Un reciente informe de referencia elaborado por EQS Group y BCM ha puesto de manifiesto los avances significativos en el uso de la inteligencia artificial (IA) en el ámbito del cumplimiento normativo. Este estudio evalúa seis modelos de IA en 120 escenarios reales, abarcando desde evaluaciones de riesgo hasta la revisión de terceros.
La investigación revela que la IA está siendo incorporada rápidamente en los flujos de trabajo corporativos, aunque no todos los modelos ofrecen un rendimiento uniforme. El "EQS Benchmark Report: AI Performance in Compliance & Ethics" destaca que los modelos actuales logran una precisión casi perfecta en tareas estructuradas, con tasas de acierto superiores al 95%. Sin embargo, se observa una caída significativa en su eficacia cuando las tareas son más complejas o ambiguas.
El Progreso en Modelos de IA para Cumplimiento Normativo
Este informe, realizado en colaboración con la asociación alemana Berufsverband der Compliance Manager e.V. (BCM), también resalta el acelerado progreso observado, con los modelos proyectados para 2025 superando notablemente a sus predecesores de 2024. Según Moritz Homann, Director de Innovación de Producto e IA en EQS Group, “para muchos profesionales del cumplimiento, la IA sigue siendo un territorio desconocido”.
Homann enfatiza que comprender cómo aplicar eficazmente la IA es un desafío crucial, especialmente en un campo donde la precisión y la integridad son esenciales. En este sentido, Dra. Gisa Ortwein, presidenta del BCM, subraya que “la IA puede ofrecer nuevos niveles de conocimiento al cumplimiento”, pero recalca que es fundamental mantener su uso dentro de límites éticos y legales claros.
Análisis Comparativo entre Modelos Recientes
El informe marca un hito al ser el primero en evaluar el rendimiento de la IA específicamente en el ámbito del cumplimiento. Se centra en medir la precisión y utilidad práctica de los modelos durante diversas tareas cotidianas que enfrentan los profesionales del sector. Los resultados indican que el modelo Gemini 2.5 Pro, desarrollado por Google, obtuvo la puntuación más alta con un 86,7%, destacándose por su solidez en todas las áreas de cumplimiento.
Cercano a este resultado se encuentra GPT-5 de OpenAI, que alcanzó un 86,5%. Este modelo ha sido designado como el estándar por defecto para ChatGPT desde agosto de 2025 y sobresale especialmente en generación de contenido abierto. Por otro lado, otros modelos como o3 y Claude Opus 4.1 mostraron rendimientos variables, reflejando así el avance significativo entre generaciones.
Eficiencia y Limitaciones de la Inteligencia Artificial
A medida que se analizan las capacidades generales de estos modelos, se observa que ofrecen mejores resultados en tareas estructuradas con reglas claras. Por ejemplo, el rendimiento medio fue del 90,8% en decisiones basadas en políticas establecidas y del 91,8% en clasificación de datos. No obstante, cuando las tareas implican mayor complejidad o ambigüedad, como redacción o análisis crítico, incluso los modelos más avanzados enfrentan dificultades significativas.
Homann advierte sobre la importancia de no delegar completamente ciertas tareas críticas a la IA: “La fortaleza radica en utilizar estas herramientas como multiplicadores de capacidades”, lo cual permite a los especialistas concentrarse donde su juicio es indispensable.
Consistencia y Precisión: Claves para el Futuro
El informe también evaluó la consistencia entre respuestas repetidas por cada modelo; sorprendentemente, más del 95% fueron idénticas. Las llamadas "alucinaciones", o errores generados por la IA, fueron escasas. Esto demuestra que bajo instrucciones claras y contexto adecuado, los modelos actuales pueden proporcionar resultados estables y fundamentados.
Aun así, se recalca que la supervisión humana sigue siendo esencial para manejar contenido sensible con implicaciones regulatorias. La elección del modelo adecuado y el diseño preciso del prompt son factores determinantes para obtener resultados óptimos.
Finalmente, Homann concluye: “La IA ha llegado para quedarse”. La forma en que se implemente hoy definirá su papel futuro dentro del cumplimiento normativo. Los equipos deben no solo gestionar los riesgos asociados a esta tecnología sino también aplicarla activamente para maximizar sus beneficios.
Para aquellos interesados en profundizar más sobre este tema innovador, el informe completo está disponible para descarga directa.