La segmentación de áreas de interés en imágenes médicas es un proceso fundamental en la investigación clínica, conocido como segmentación. Este procedimiento es uno de los primeros pasos que los investigadores clínicos realizan al llevar a cabo estudios que involucran imágenes biomédicas.
Por ejemplo, para analizar cómo cambia el tamaño del hipocampo del cerebro a medida que los pacientes envejecen, el científico debe delinear cada hipocampo en una serie de escaneos cerebrales. Muchas veces, este proceso es manual y consume mucho tiempo, especialmente si las regiones a estudiar son difíciles de definir.
Con el fin de optimizar este proceso, investigadores del MIT han desarrollado un sistema basado en inteligencia artificial que permite a los investigadores segmentar rápidamente nuevos conjuntos de datos de imágenes biomédicas mediante simples acciones como hacer clic, garabatear y dibujar cuadros sobre las imágenes. Este nuevo modelo de IA utiliza estas interacciones para predecir la segmentación.
Innovación en la Segmentación Médica
A medida que el usuario marca imágenes adicionales, la cantidad de interacciones necesarias disminuye, llegando eventualmente a cero. El modelo puede entonces segmentar cada nueva imagen con precisión sin intervención del usuario. Esto se debe a que la arquitectura del modelo ha sido diseñada específicamente para utilizar información de imágenes previamente segmentadas para realizar nuevas predicciones.
A diferencia de otros modelos de segmentación médica, este sistema permite al usuario segmentar un conjunto completo de datos sin necesidad de repetir su trabajo para cada imagen. Además, la herramienta interactiva no requiere un conjunto de imágenes pre-segmentadas para su entrenamiento, lo que significa que los usuarios no necesitan tener conocimientos avanzados en aprendizaje automático ni recursos computacionales extensos. Pueden utilizar el sistema para una nueva tarea de segmentación sin necesidad de reentrenar el modelo.
A largo plazo, esta herramienta podría acelerar los estudios sobre nuevos métodos de tratamiento y reducir los costos asociados a ensayos clínicos e investigaciones médicas. También podría ser utilizada por médicos para mejorar la eficiencia en aplicaciones clínicas, como la planificación del tratamiento con radiación.
Facilitando la Investigación Científica
“Muchos científicos solo pueden segmentar unas pocas imágenes al día debido a lo laborioso que resulta el proceso manual. Nuestra esperanza es que este sistema permita avanzar en la ciencia al permitir a los investigadores clínicos realizar estudios que antes estaban fuera de su alcance por falta de herramientas eficientes”, afirma Hallee Wong, estudiante graduada en ingeniería eléctrica y ciencias computacionales y autora principal del estudio sobre esta nueva herramienta.
Wong está acompañada en el estudio por Jose Javier Gonzalez Ortiz, PhD ’24; John Guttag, profesor Dugald C. Jackson de Ciencias Computacionales e Ingeniería Eléctrica; y el autor senior Adrian Dalca, profesor asistente en la Escuela Médica de Harvard y científico investigador en el Laboratorio de Ciencias Computacionales e Inteligencia Artificial del MIT (CSAIL). La investigación será presentada en la Conferencia Internacional sobre Visión por Computadora.
Optimización Continua
Los investigadores han diseñado cuidadosamente la arquitectura del modelo utilizando una colección diversa de datos biomédicos para garantizar que pueda mejorar sus predicciones basándose en las entradas del usuario. No es necesario reentrenar o personalizar el modelo para adaptarlo a sus datos; simplemente se puede cargar una nueva imagen médica y comenzar a marcarla.
Eficiencia Mejorada con Menos Interacciones
Al comparar MultiverSeg con herramientas líderes actuales para segmentación interactiva e in-contexto, se observó que superó todos los estándares establecidos. A diferencia de otras herramientas existentes, MultiverSeg requiere menos interacciones por parte del usuario con cada imagen. Para la novena imagen nueva, solo necesitaba dos clics del usuario para generar una segmentación más precisa que un modelo diseñado específicamente para esa tarea.
En algunos tipos de imágenes, como radiografías, el usuario podría necesitar segmentar solo una o dos imágenes manualmente antes de que el modelo sea lo suficientemente preciso como para hacer predicciones por sí solo. La interactividad también permite al usuario corregir las predicciones del modelo, iterando hasta alcanzar el nivel deseado de precisión.
"Con MultiverSeg, los usuarios siempre pueden proporcionar más interacciones para refinar las predicciones de IA. Esto acelera dramáticamente el proceso porque generalmente es más rápido corregir algo existente que empezar desde cero", concluye Wong.
A medida que avanza esta investigación, los científicos planean probar esta herramienta en situaciones reales junto a colaboradores clínicos y mejorarla según los comentarios recibidos. También buscan habilitar MultiverSeg para segmentar imágenes biomédicas 3D.
Este trabajo cuenta con el apoyo parcial de Quanta Computer Inc. y los Institutos Nacionales de Salud (NIH), además del respaldo hardware proporcionado por el Centro de Ciencias Biológicas de Massachusetts.