La calidad del aire (CA) es una creciente preocupación en todo el mundo, principalmente en zonas urbanas. Según la Organización Mundial de la Salud (OMS), mueren prematuramente cerca de 7 millones de personas por año debido a la contaminación del aire, mientras que más del 80% de los habitantes de áreas urbanas con monitoreo están expuestos a niveles que exceden los límites establecidos, especialmente en países en desarrollo (10.1136/bmj.i2730).
Las partículas en el aire son un indicador importante al respecto pues, dependiendo de su tamaño y composición, tienen diferentes impactos sobre la salud de las personas y sobre el clima. La medición de la CA generalmente se realiza a través de estaciones de monitoreo altamente tecnificadas (denominadas comúnmente “estaciones de referencia”) pero extremadamente costosas (alrededor de 10 mil dólares por instrumento de medición). Es por ello que este tipo de mediciones son dispersas o inexistentes, especialmente en países con bajos recursos económicos como los nuestros, lo que genera un gran desconocimiento acerca de la CA (la Figura 1 representa gran parte las instalaciones activas en el mundo).
Una alternativa viene dada por los denominados sensores de bajo costo, que poseen numerosas limitaciones y requieren una exhaustiva caracterización previa a su uso, pero podrían aportar valiosa información. Una segunda alternativa, complementaria a las anteriores, es el modelado numérico de la CA que, dependiendo del enfoque, puede requerir de datos, información y/o potentes computadores no siempre disponibles. En ambos casos, es necesario validar los resultados con mediciones independientes (por ejemplo, empleando las mencionadas estaciones de referencia).
Situación en la megaciudad de Buenos Aires
Toda la periferia de la Región Metropolitana de Buenos Aires, como la mayor parte de Argentina y de Latinoamérica, se encuentra en una de estas zonas sin cobertura de mediciones de CA. Las únicas estaciones de monitoreo se encuentran en la zona céntrica de la ciudad y no es conveniente utilizar sus datos en otros lugares dadas las distancias (la CA es muy heterogénea!).
En la Figura 2 podés ver el sitio de estudio de la investigación, ubicado en el centro-norte de esta mega urbanización. En esta área hay 3 principales preocupaciones vinculadas a la CA: el crecimiento sostenido del parque automotor junto con un crecimiento urbano escasamente planificado, una precaria gestión de residuos, y la presencia de algunas industrias dispersas con dudoso cumplimiento de regulaciones ambientales. Además, existen desigualdades sociales y de acceso a los servicios básicos que hacen a gran parte de la población particularmente vulnerable al deterioro ambiental.
Nuestro aporte
Este artículo busca contarte sobre los métodos y resultados más importantes de la investigación doctoral titulada “Integración de metodologías de bajo costo para la determinación de la calidad del aire”. En este proyecto, exploramos los impactos de las partículas atmosféricas en la CA en la Región Metropolitana de Buenos Aires, Argentina (con ~ 14 millones de habitantes, la 3ra urbe más grande de Latinoamérica). El problema es que existen partículas microscópicas en el aire, que pueden ser sólidas o líquidas, y que tienen la capacidad de permanecer suspendidas en la atmósfera desde varias horas hasta algunas semanas afectando la calidad de vida de la población. Por esto desarrollamos equipos de bajo costo para medir estas partículas en el aire y también creamos modelos de inteligencia artificial (IA) para analizar datos y predecir niveles de contaminación en algunas áreas específicas de la ciudad. Los resultados conseguidos aportan nueva información sobre las cantidades, distribuciones y tipos de partículas en el aire, de mucha utilidad para la toma de decisiones y la planificación urbana.
Entendiendo la calidad del aire con Inteligencia Artificial
La comprensión de los procesos de contaminación del aire y el desarrollo de modelos que los caractericen resultan indispensables en aplicaciones regulatorias, de investigación y forenses. Una aplicación interesante de modelado de la CA (aunque se usa también en muchísimos otros campos de estudio) lo proporciona lo que se llama la Inteligencia Artificial, una rama de la minería de datos, en la cual se intenta extraer la mayor cantidad de información posible con los datos disponibles. Un ejemplo son las Redes Neuronales Artificiales (RNA), las cuales son modelos capaces de interpretar distintos vínculos entre variables y pueden enseñarnos cosas que se les escapan al análisis tradicional de datos, además pueden ser utilizadas con computadoras convencionales (no siempre, pero es posible en muchos casos). Dicho de forma un poco llana y algo simplista, estos modelos se “entrenan” con los datos disponibles y “aprenden” de ellos, para luego funcionar de manera autónoma. Precisan alimentarse de datos de diferentes orígenes (por ejemplo, meteorología y concentraciones de contaminantes medidos en el pasado), para clasificar o predecir valores de alguna magnitud que nos interese (como concentraciones de algún contaminante).
¿Cómo lo hicimos?
Por un lado, diseñamos una RNA para pronosticar la CA y clasificar su origen tratando de minimizar el costo computacional (es decir, optimizado para que pueda utilizarse en un computador convencional) y mejorando su desempeño en base a los datos disponibles. Por otro lado, desarrollamos e implementamos tecnología de bajo costo económico para proveer datos de manera sistemática sobre CA en la región. Finalmente, se integraron las mediciones realizadas con los modelos de RNA.
Potenciales beneficios para la comunidad
Los modelos de Inteligencia Artificial mejoran mucho si se dispone de una gran cantidad de datos, pero sin ello aún logran resultados aceptables con la adecuada configuración. En nuestro caso, la integración con mediciones de bajo costo nos permitió obtener muy buenos resultados y con limitada disponibilidad de información, por lo que estamos confiados de su potencialidad en otros sitios con similares problemas. Pudimos clasificar y caracterizar el origen de las partículas en la zona y desarrollar un modelo que predice PM con una buena aproximación y a un costo accesible. La combinación de ambos componentes, es decir los datos generados con los instrumentos de bajo costo y los resultados de los modelos de inteligencia artificial, demostró ser más potente que lo que cada una de las partes individualmente podría proveer.
Finalmente, los productos de la investigación descrita, en cuanto a desarrollo tecnológico y modelos (diseños, códigos, etc..) son de libre acceso en un repositorio digital para cualquier interesadx, con el espíritu de aportar un conocimiento compartido de manera abierta que pueda ser replicado en zonas con las mismas problemáticas y limitaciones. Por cualquier duda o consulta, no dudes en escribirme a ascagliotti@campus.ungs.edu.ar.