El equipo de Procesamiento de Lenguaje Natural (NLP) conformado por estudiantes del Departamento de Ciencia de la Computación (DCC UC), el Centro Nacional de Investigación en Inteligencia Artificial (Cenia) y del Instituto Milenio Fundamento de los Datos (IMFD), obtuvieron el primer lugar en dos categorías de la shared task de IberLEF 2024 “Automatic detection and characterization of propaganda techniques and narratives from Diplomats of major power“.
DIPROMATS 2024 tiene por título la competencia que desafió a los participantes a desarrollar sistemas avanzados para la detección y caracterización automática de técnicas de propaganda y narrativas en tweets emitidos por diplomáticos de potencias mundiales como Estados Unidos, Europa, Rusia y China. La competencia dividió las tareas en dos categorías principales: “Identificación y Caracterización de la Propaganda” y “Detección de Narrativas“.
“La competencia consistió en diseñar sistemas para la detección automática de técnicas de propaganda en lenguaje natural, en específico en comentarios que se producen en redes sociales. El data set con el cual se trabajó corresponde a un Data que se construyó específicamente para esta competencia y consiste en tweets extraídos desde cuentas de políticos y diplomáticos importantes de las grandes potencias del mundo como Estados Unidos, Europa, Rusia y China”, explicó el académico e investigador principal de Cenia, Marcelo Mendoza.
El equipo, conformado por Miguel Fernández (IMFD y doctorado DCC UC), Maximiliano Ojeda (IMFD y doctorado DCC UC), Lilly Guevara (Cenia, de la línea de investigación RL5 e Ingeniería USM), Diego Varela (Cenia, de la línea de investigación RL5 e Ingeniería USM) y Marcelo Mendoza (académico DCC UC, investigador principal Cenia e IMFD), alcanzaron el primer lugar en dos categorías de la competencia.
Tras los trascendentes resultados al team se le invitó a presentar su solución en el evento que se llevará a cabo del 24 al 26 de septiembre en Valladolid, España.
Marcelo Mendoza, miembro del equipo, comentó que: “como los mensajes vienen de distintos países, hay algunos que son en castellano y otros que son en inglés. Entonces la competencia se evalúa en tres categorías uno que es bilingüe, inglés y español. Nosotros ganamos en inglés y en bilingüe, en español ocupamos podio es decir, llegamos en segundo o en tercer lugar en todas las otras tareas”.
Por: Pía Cassone