Tracciamento delle fonti di contaminazione da PFAS con il “machine learning”
L’inquinamento ambientale da sostanze per- e polifluoroalchiliche (PFAS) è diffuso a causa del loro utilizzo prolungato nel tempo e della loro persistenza nell’ambiente. Questi fattori rendono difficile identificare la fonte di contaminazione nei campioni, poiché in molti casi la contaminazione può risalire a decenni fa o provenire da diverse fonti possibili. L’allocazione delle fonti è importante per individuare l’origine della contaminazione e può fornire informazioni sul comportamento ambientale dei singoli componenti dei PFAS. Questo articolo descrive uno studio condotto per esplorare l’uso del “supervised machine learning” per allocare la fonte di contaminazione da PFAS sulla base dei pattern identificati nelle concentrazioni dei singoli componenti. È stato creato un dataset contenente le concentrazioni dei componenti dei PFAS in 1197 campioni ambientali di acqua, basandosi su dati provenienti da siti in tutto il mondo. Il dataset è stato diviso equamente in un set di dati di addestramento e uno di test, e il set di dati di addestramento, composto da 598 campioni, è stato utilizzato per addestrare quattro classificatori di apprendimento automatico, tra cui tre classificatori convenzionali e una rete neurale multistrato. I metodi utilizzati funzionano su principi diversi tra loro ma forniscono previsioni simili, ciò supporta l’ipotesi che esistano pattern nei campioni acqua contenente PFAS che ne consentono l’allocazione delle fonti. I risultati dello studio supportano l’idea che l’apprendimento automatico supervisionato possa rappresentare un’importante risorsa come strumento per l’allocazione delle fonti di contaminazione.