SK Telecom avanza en el desarrollo de modelos de lenguaje AI
SK Telecom (SKT) ha dado un paso significativo en su proceso de creación de modelos de lenguaje grande (LLMs) al lanzar una versión ligera enfocada en smartphones, destinada a la comunidad de código abierto Hugging Face. Este nuevo modelo, denominado AX 3.1 Lite, cuenta con 7 mil millones de parámetros y representa la evolución del modelo utilizado en la función de gestión de llamadas A-dot de SKT.
La compañía ha afirmado que desarrolló este LLM desde cero, mejorando la eficiencia y rendimiento del AX 3.0 Lite, previamente utilizado en A-dot. Según SKT, las características de su último modelo permitirán ofrecer servicios más fluidos al facilitar que las empresas implementen configuraciones optimizadas en dispositivos móviles.
Entre los beneficios que se esperan del AX 3.1 Lite, se destacan la capacidad de procesamiento de información y la reducción del consumo energético, áreas donde el LLM podría aportar mejoras significativas.
Rendimiento destacado y proyecciones futuras
El AX 3.1 Lite “posee excelentes capacidades de procesamiento del idioma coreano, comparables a las de su modelo hermano AX 4.0 Lite”, según declaraciones de SKT. Este último modelo, AX 4.0 Lite, utiliza 72 mil millones de parámetros.
En cuanto a su desempeño, el AX 3.1 Lite alcanzó un nivel del 96 por ciento en la evaluación de competencia lingüística coreana KMMLU2 y un 102 por ciento en CLIcK3, que incorpora elementos culturales. En contraste, el AX 4.0 Lite obtuvo resultados del 64.2 por ciento y 71.2 por ciento, respectivamente.
Desde 2018, SKT ha estado trabajando en sus propios LLMs, lo que le ha permitido posicionarse como líder en la localización y lanzamiento del GPT-2. La empresa planea seguir utilizando su método “desde cero” como base para sus esfuerzos continuos en este campo, incluyendo el avance de su gama soberana AX 3 y el uso del AX 4 para un pre-entrenamiento constante “en áreas que requieren un rendimiento y eficiencia optimizados”.
Hugging Face proporciona diversos recursos colaborativos para probar funciones relacionadas con la inteligencia artificial.