Universidad

Inteligencia artificial para la conservación de ecosistemas vulnerables

Inteligencia Artificial

José Enrique González | Miércoles 05 de noviembre de 2025

Investigadores del MIT utilizan inteligencia artificial para monitorear ecosistemas vulnerables, desarrollando métodos eficientes que optimizan la selección de modelos y mejoran la conservación de especies en riesgo.



Un reciente estudio de la Universidad Estatal de Oregón ha revelado que más de 3,500 especies animales se encuentran en peligro de extinción debido a factores como la alteración de hábitats, la sobreexplotación de recursos naturales y el cambio climático. Para abordar esta problemática y proteger a la fauna vulnerable, investigadores como Justin Kay, estudiante de doctorado en MIT y miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL), están desarrollando algoritmos de visión por computadora que permiten monitorear con precisión las poblaciones animales. Kay, quien forma parte del equipo liderado por la profesora asistente Sara Beery, se enfoca actualmente en el seguimiento del salmón en el Pacífico Noroeste, donde estos peces son fundamentales para proporcionar nutrientes a depredadores como aves y osos, además de regular la población de presas como los insectos.

No obstante, manejar una gran cantidad de datos sobre vida silvestre implica un desafío considerable. Los investigadores deben seleccionar entre numerosos modelos de inteligencia artificial para analizar esta información. En este contexto, Kay y sus colegas han desarrollado métodos que optimizan este proceso, incluyendo un enfoque innovador denominado “selección activa de modelos impulsada por consenso” (CODA). Este trabajo fue reconocido como un Highlight Paper en la Conferencia Internacional sobre Visión por Computadora (ICCV) celebrada en octubre.

Innovaciones en el análisis de datos ecológicos

El proyecto cuenta con el respaldo parcial de la Nacional Science Foundation, el Consejo de Investigación en Ciencias Naturales e Ingeniería de Canadá y el Laboratorio Abdul Latif Jameel para Sistemas Hídricos y Alimentarios (J-WAFS). En una entrevista, Kay profundiza sobre su investigación y otros esfuerzos relacionados con la conservación.

Q: En tu artículo planteas la cuestión sobre qué modelos de IA rendirán mejor en un conjunto específico de datos. Con hasta 1.9 millones de modelos preentrenados disponibles en el repositorio HuggingFace, ¿cómo ayuda CODA a enfrentar este reto?

A: Hasta hace poco, utilizar IA para análisis de datos implicaba entrenar tu propio modelo, lo cual requiere un esfuerzo significativo para recopilar y anotar un conjunto representativo. Además, es necesario contar con habilidades técnicas para ejecutar y modificar el código del entrenamiento. Sin embargo, ahora existen millones de modelos preentrenados disponibles públicamente que pueden realizar diversas tareas predictivas con eficacia. Esto permite a los usuarios analizar sus datos sin necesidad de desarrollar su propio modelo; simplemente descargan uno existente que cumpla con sus requisitos. Pero esto plantea un nuevo desafío: ¿cuál modelo elegir entre los millones disponibles?

Estrategias eficientes para la selección del modelo adecuado

Generalmente, responder a esta pregunta también requiere mucho tiempo recopilando y anotando un amplio conjunto de datos para probar los modelos. Esto es especialmente cierto cuando las necesidades del usuario son específicas y las distribuciones de datos son desiguales o cambian constantemente. Nuestro objetivo con CODA fue reducir significativamente este esfuerzo al hacer que el proceso de anotación sea “activo”. En lugar de requerir que los usuarios anoten grandes conjuntos todos a la vez, guiamos a los usuarios para que anoten los puntos más informativos dentro de sus datos brutos. Esto es notablemente efectivo; a menudo se necesita anotar tan solo 25 ejemplos para identificar el mejor modelo entre los candidatos.

Estamos muy entusiasmados con cómo CODA ofrece una nueva perspectiva sobre cómo utilizar eficazmente el esfuerzo humano en el desarrollo y despliegue de sistemas basados en aprendizaje automático (ML). A medida que los modelos AI se vuelven más comunes, nuestro trabajo resalta la importancia de centrarse en crear pipelines robustos para evaluación, no solo en entrenamiento.

Aplicaciones prácticas del método CODA

Q: Aplicaste el método CODA a la clasificación de vida silvestre en imágenes. ¿Por qué tuvo tanto éxito y qué papel pueden jugar sistemas como este en el monitoreo futuro de ecosistemas?

A: Un hallazgo clave fue que al considerar un conjunto de modelos AI candidatos, el consenso entre todas sus predicciones resulta ser más informativo que las predicciones individuales. Esto puede verse como una especie de “sabiduría colectiva”: al promediar las votaciones entre todos los modelos se obtiene una buena estimación sobre las etiquetas que deberían tener los puntos individuales en tu conjunto bruto. Nuestra estrategia con CODA se basa en estimar una “matriz de confusión” para cada modelo AI — dado que la etiqueta verdadera para algún punto es clase X, ¿cuál es la probabilidad que tiene un modelo individual para predecir clase X, Y o Z? Esto crea dependencias informativas entre todos los modelos candidatos y las categorías deseadas.

Pensemos en una aplicación práctica donde eres un ecólogo especializado en vida silvestre que ha recolectado un conjunto potencialmente enorme de imágenes desde cámaras desplegadas en el campo. Deseas saber qué especies aparecen en estas imágenes; una tarea ardua donde clasificadores visuales pueden ayudar a automatizar procesos. Si has etiquetado 50 imágenes de tigres hasta ahora y algún modelo ha funcionado bien con esas imágenes, puedes confiar bastante bien que también funcionará con las demás imágenes no etiquetadas del mismo grupo.

Nuevas fronteras en investigación ecológica

Q: Trabajas en Beerylab bajo la dirección de Sara Beery, donde se combinan capacidades reconocidas por algoritmos ML con tecnología visual para monitorear vida silvestre. ¿Cuáles son otras formas mediante las cuales tu equipo está rastreando y analizando el mundo natural más allá del CODA?

A: El laboratorio es un lugar realmente emocionante; surgen nuevos proyectos todo el tiempo. Actualmente estamos monitoreando arrecifes coralinos con drones, identificando elefantes individuales a lo largo del tiempo y fusionando datos multimodales obtenidos desde satélites junto a cámaras in situ, solo por mencionar algunos ejemplos. En términos generales, exploramos tecnologías emergentes para el monitoreo biodiverso e intentamos identificar dónde están los cuellos de botella analíticos para desarrollar nuevos enfoques aplicables ampliamente.

Nuestros algoritmos han sido utilizados para contar salmones migratorios mediante video sonar submarino; enfrentamos distribuciones cambiantes mientras tratamos construir conjuntos diversos para entrenamiento. Cada vez encontramos algo nuevo al desplegar nuevas cámaras lo cual tiende a degradar el rendimiento algorítmico. Este es solo uno entre muchos problemas generales conocidos como adaptación al dominio; al intentar aplicar algoritmos existentes nos dimos cuenta rápidamente sobre limitaciones serias respecto cómo fueron entrenados o evaluados esos algoritmos.

A partir ahí logramos desarrollar un nuevo marco adaptativo publicado recientemente que aborda estas limitaciones llevando avances significativos hacia conteo eficaz del pez e incluso análisis aplicado a vehículos autónomos o naves espaciales.

A medida que continuamos desarrollando métodos integradores combinando predicciones ML junto a pipelines predictivos multietapa así como modelos estadísticos ecológicos avanzados; entendemos mejor cómo mejorar análisis predictivos considerando su uso real: generalmente lo importante no son las cajas delimitadoras alrededor animales sino responder preguntas más amplias sobre qué especies habitan aquí y cómo están cambiando con el tiempo.

Dada la velocidad sin precedentes con la cual cambia nuestro mundo natural hoy día; poder transitar rápidamente desde hipótesis científicas hasta respuestas fundamentadas por datos resulta crucial no solo para proteger ecosistemas sino también comunidades enteras dependientes directamente sobre ellos.

TEMAS RELACIONADOS:


Noticias relacionadas