Investigadores de la Universidad de Cádiz han desarrollado un innovador método llamado REDIBAGG, que promete revolucionar el entrenamiento de modelos de inteligencia artificial. Este avance, financiado por la Consejería de Universidad, Investigación e Innovación, permite aumentar la velocidad de entrenamiento hasta en un 70%, utilizando menos datos sin comprometer la precisión. La técnica tiene aplicaciones potenciales en campos tan variados como la medicina, la industria y las finanzas.
REDIBAGG está diseñado para manejar grandes volúmenes de información en tareas de clasificación, donde los algoritmos deben seleccionar entre múltiples opciones. Por ejemplo, en el ámbito sanitario, podría acelerar sistemas de diagnóstico automático manteniendo su fiabilidad; en el sector industrial, facilitaría la detección de fallos en tiempo real con un menor consumo de recursos; y en finanzas, permitiría procesar extensos registros más rápidamente para prevenir fraudes o analizar riesgos.
Versatilidad y Eficiencia del Método REDIBAGG
El sistema ha demostrado su eficacia en diversas situaciones, tal como se detalla en un artículo publicado en la revista Engineering Applications of Artificial Intelligence. Juan Francisco Cabrera, coautor del estudio, destaca que “no es un método orientado a ciertos tipos de datos, sino que es muy versátil y robusto ante cualquier volumen con gran número de características o instancias”.
Una de las ventajas significativas de REDIBAGG es su facilidad de implementación. Puede ser utilizado en entornos comunes con inteligencia artificial, como el lenguaje de programación Python, junto con bibliotecas estándar como Scikit-learn. Esto lo convierte en una herramienta accesible para investigadores y empresas.
A diferencia del tradicional método ‘bagging’, que requiere entrenar modelos con submuestras del tamaño original del conjunto de datos —lo que implica un alto coste computacional— REDIBAGG utiliza subconjuntos más pequeños pero representativos. Esto no solo reduce el tiempo necesario para el aprendizaje, sino que también disminuye significativamente el consumo de recursos.
Resultados Prometedores y Futuras Aplicaciones
Los investigadores validaron REDIBAGG en 30 conjuntos de datos reales utilizando Urania, el supercomputador de la Universidad de Cádiz. Los resultados mostraron una precisión comparable al método original y lograron reducir el tiempo de entrenamiento promedio en un 35%, alcanzando reducciones del 70% en conjuntos muy grandes. Esther Lydia Silva, autora principal del estudio, subraya que “al trabajar con modelos menos complejos se reducen las horas de entrenamiento y el coste de almacenamiento”.
A medida que avanzan sus investigaciones, los científicos planean liberar este método para su uso por parte de la comunidad científica. También están considerando cómo adaptar esta herramienta a otros sistemas de aprendizaje automático más allá del bagging y explorar su aplicación en tareas relacionadas con regresión.
Este trabajo ha sido posible gracias al financiamiento proporcionado por la Consejería de Universidad y Fondos FEDER.
La noticia en cifras
Cifra |
Descripción |
70% |
Aumento en la velocidad de entrenamiento de modelos de IA. |
35% |
Reducción promedio del tiempo de entrenamiento. |
70% |
Reducciones alcanzadas en conjuntos de datos muy grandes. |