Los hospitales y centros de salud generan diariamente una cantidad significativa de informes médicos en lenguaje natural. Para que esta información sea útil en la organización, el intercambio o la investigación, es fundamental convertirla a códigos clínicos estandarizados. Este proceso, que aún consume considerables recursos y tiempo, ha sido objeto de estudio por parte de la investigadora Alicia Ramírez Arrabe, quien forma parte del grupo NLP&IR del Departamento de Lenguajes y Sistemas Informáticos de la UNED. Su equipo ha desarrollado un sistema de inteligencia artificial diseñado para automatizar esta tarea, proporcionando además claridad sobre los fragmentos textuales que respaldan cada decisión tomada.
Claves de la noticia
Sistema automatiza codificación médica
La IA convierte informes en códigos estandarizados.
Mejora del 3.42% en precisión
Resultados competitivos frente a métodos tradicionales.
Transparencia en decisiones AI
El sistema explica qué texto justifica cada código.
El sistema propuesto se basa en una arquitectura que transforma automáticamente textos médicos en códigos de la Clasificación Internacional de Enfermedades (CIE). Este proceso se organiza en tres etapas: reconocimiento de entidades, clasificación supervisada y análisis semántico. La evaluación del sistema, realizada con corpus en español e inglés, ha demostrado resultados competitivos, logrando una mejora media del 3.42% en la métrica F1 respecto a enfoques anteriores.
Beneficios de la codificación clínica automatizada
La codificación clínica es esencial para traducir información contenida en informes médicos —como diagnósticos, síntomas y procedimientos— a un lenguaje común basado en códigos estandarizados. Esto permite que profesionales de diferentes centros registren y consulten datos homogéneamente, facilitando así tanto la gestión sanitaria como el análisis posterior de grandes volúmenes de información.
A pesar de su importancia, este proceso sigue realizándose principalmente de manera manual, lo que implica un alto costo en términos de tiempo y recursos. Según Ramírez Arrabe, “los sistemas que automaticen el proceso aportan mucho valor al convertir una tarea tediosa y prolongada en un procedimiento rápido y eficiente”, permitiendo así dedicar más tiempo a la investigación y el análisis.
Además, el sistema incluye dos innovaciones significativas: una fase no supervisada que identifica códigos previamente desconocidos durante el entrenamiento y una capacidad para interpretar referencias complejas dentro del texto médico. Esto permite comprender menciones superpuestas o fragmentadas que deben ser analizadas conjuntamente para determinar el código correcto.
Un enfoque transparente y eficaz
Una característica destacada del sistema es su capacidad para no operar como una "caja negra". No solo genera propuestas de codificación; también indica qué partes específicas del informe justifican cada resultado. “El sistema presentado no solo predice los códigos CIE-10, sino que también devuelve las partes del texto que respaldan dichas predicciones”, explica Ramírez Arrabe. Esta transparencia permite a los profesionales sanitarios entender rápidamente por qué se asignó un determinado código y validar los resultados con mayor eficiencia.
Para evaluar su rendimiento, se utilizó corpus en español e inglés. Aunque los modelos fueron entrenados independientemente para cada conjunto de datos, el objetivo era demostrar que la metodología mantiene su eficacia sin depender de un único tipo de información clínica.
La mejora obtenida —un 3.42% en F1— es especialmente relevante dado que la codificación clínica automática enfrenta desafíos computacionales significativos al trabajar con lenguaje médico especializado y más de 100.000 códigos posibles. Por lo tanto, avances aparentemente menores pueden tener un impacto considerable sobre la precisión y cobertura del sistema.
El próximo paso será desarrollar una demonstração funcional, donde se podrán introducir textos clínicos para visualizar automáticamente tanto los códigos detectados como los fragmentos justificativos correspondientes. Si se obtienen resultados positivos, esta línea investigativa podría facilitar futuras aplicaciones prácticas en entornos clínicos o investigativos.
Dicha investigación cuenta con el respaldo institucional de la UNED y con el conocimiento especializado del grupo NLP&IR, reconocido por su labor en procesamiento del lenguaje natural aplicado al ámbito biomédico.
Preguntas sobre la noticia
¿Cómo mejora el sistema de IA la codificación clínica en comparación con los métodos manuales?
El sistema de IA automatiza el proceso de codificación clínica, lo que reduce significativamente el tiempo y recursos necesarios para traducir informes médicos a códigos estandarizados. Esto permite a los profesionales dedicar más tiempo a la investigación y análisis de datos.
¿Qué innovaciones presenta el sistema desarrollado por Alicia Ramírez Arrabe?
El sistema incluye una fase no supervisada que identifica códigos no vistos previamente y puede interpretar referencias complejas dentro del texto médico, mejorando su eficacia en entornos reales.
¿Por qué es importante que la IA explique sus decisiones en la codificación médica?
La capacidad del sistema para señalar las partes del texto que justifican cada código asignado permite a los profesionales sanitarios comprender y validar rápidamente los resultados, aumentando la transparencia del proceso.
¿Cuál es el siguiente paso en esta línea de investigación?
El próximo paso es desarrollar una demo funcional que permita introducir textos clínicos y visualizar automáticamente tanto los códigos detectados como los fragmentos que justifican cada decisión, facilitando futuras aplicaciones clínicas o de investigación.