iymagazine.es

I+D UNIVERSITARIO

Lanza la versión 5.0 de ParlaMint, el corpus multilingüe de sesiones parlamentarias europeas
Ampliar

Lanza la versión 5.0 de ParlaMint, el corpus multilingüe de sesiones parlamentarias europeas

martes 12 de agosto de 2025, 13:40h

Se lanza la versión 5.0 de ParlaMint, un corpus multilingüe de textos parlamentarios europeos, que incluye mejoras en la anotación automática por temas y sentimientos para facilitar análisis lingüísticos y políticos.

La Universidad de Santiago de Compostela ha lanzado oficialmente la versión 5.0 del corpus ParlaMint, un proyecto que, al igual que en sus ediciones anteriores, cuenta con la colaboración del Instituto da Lingua Galega y el Proxecto Nós. Este corpus se centra en la recopilación y anotación de datos provenientes del Parlamento gallego, conocido como ParlaMint-ES-GA.

ParlaMint forma parte de la infraestructura digital europea CLARIN, cuyo objetivo es crear un corpus multilingüe, comparable y homologado de las sesiones parlamentarias europeas. Este recurso se compila y codifica uniformemente en todos los países participantes, incluyendo metadatos detallados sobre los oradores, tales como identificador, nombre, género y partido político, así como información sobre las intervenciones, que abarca fecha, rol y sesión.

Novedades en la Anotación Automática

La nueva versión introduce dos mejoras significativas: la anotación automática por temas y la anotación automática del sentimiento en las intervenciones. La primera permite realizar consultas en el corpus según los temas tratados durante los debates parlamentarios. Por su parte, la segunda indica si una intervención expresa una valoración positiva, negativa o neutra.

Estas innovaciones amplían considerablemente las posibilidades de análisis del corpus. Se pueden llevar a cabo estudios lingüísticos profundos así como investigaciones sobre discurso político, polarización o la evolución temática del debate parlamentario a lo largo del tiempo. La disponibilidad de etiquetas temáticas y de sentimiento facilita el estudio de cómo diferentes partidos políticos abordan un mismo tema o cómo varía el tono de las intervenciones según el contexto político.

Cuerpo Multilingüe y Enriquecido

La versión recientemente publicada incluye no solo el corpus ParlaMint 5.0, sino también los corpus enriquecidos con anotación lingüística automática bajo el título ParlaMint.ana 5.0. Además, se presentan versiones multilingües con traducción automática al inglés, denominadas ParlaMint-en.ana 5.0.

Con estas actualizaciones, ParlaMint se consolida como una herramienta esencial para investigadores interesados en el análisis del lenguaje y la política a nivel europeo.

Valora esta noticia
0
(0 votos)
¿Te ha parecido interesante esta noticia?    Si (0)    No(0)

+
0 comentarios