CENIA desarrolla un sistema de IA que simula encuestas de opinión pública con testimonios de personas similares

Un paper liderado por el investigador de CENIA Andrés Abeliuk, que será presentado en la conferencia IC2S2 2026, propone modelar la opinión pública a partir de testimonios de personas con características similares al encuestado, reduciendo costos y mejorando la representatividad de grupos históricamente excluidos.

Investigadores del Centro Nacional de Inteligencia Artificial (CENIA) desarrollaron un método de Inteligencia Artificial capaz de simular respuestas de encuestas de opinión pública a partir de testimonios de personas con características demográficas similares al encuestado, sin necesidad de entrevistarlo directamente. La técnica, llamada peer-conditioning (acondicionamiento por pares), fue creada por Andrés Abeliuk, Fabrizzio Pezzolla, Mitchell Bosley y Sergio Toro, y será presentada en julio de 2026 en la International Conference on Computational Social Science (IC2S2), en Estados Unidos.

El sistema busca reducir los costos de las encuestas y mejorar la representación de grupos históricamente excluidos en Chile, como comunidades indígenas, adultos mayores y habitantes de zonas rurales. La lógica del método es que un número reducido de testimonios puede dar cuenta de las opiniones de una población mucho más amplia, al modelar a un encuestado a partir de personas demográficamente similares que sí fueron entrevistadas.

Este resultado es el primer avance concreto del proyecto “Towards Fair and Contextualized Simulations of Public Opinion in Chile using Large Language Models”, liderado por Abeliuk gracias a un Fondecyt de Iniciación 2026, adjudicado por la Agencia Nacional de Investigación y Desarrollo (ANID). La investigación busca desarrollar modelos de lenguaje adaptados a contextos locales para reducir los sesgos hacia grupos como adultos mayores, personas de zonas rurales y pueblos indígenas, y representar mejor sus opiniones en encuestas.

Acondicionamiento por pares: un método para simular opiniones a partir de la experiencia de personas similares

El estudio combina dos fuentes de datos del contexto chileno: la encuesta CEP 2024-2025, usada como referencia cuantitativa para evaluar las simulaciones, y el estudio VOCES, que aporta transcripciones de entrevistas sobre valores, percepciones locales y el conflicto en la Araucanía. La técnica utiliza Generación Aumentada por Recuperación (RAG) para incorporar al modelo testimonios de personas demográficamente similares, lo que permite simular las opiniones de un ciudadano específico a partir de la experiencia de otros con características parecidas, aunque esa persona nunca haya sido entrevistada.

El proyecto parte de la premisa de que los modelos de lenguaje más utilizados (como LLaMA, Gemma o GPT-4) se entrenan principalmente con datos de contextos del Norte Global, lo que reduce su precisión al representar a grupos subrepresentados en Chile. El estudio denomina a esta brecha “exclusión epistémica” y advierte que puede reproducir desigualdades al omitir realidades sociales completas. El paper aborda directamente estos problemas de sesgo y falta de contexto local, que el Fondecyt busca resolver a mayor escala.

El equipo estima que bastarían 100 entrevistas reales para obtener información equivalente a una encuesta de 1.000 personas. Según los investigadores, a futuro el método podría usarse para evaluar leyes o políticas públicas antes de su implementación, simulando la reacción de la población de forma más rápida y económica. Para facilitar su adopción en otros contextos, el equipo liberará de forma gratuita los códigos y modelos desarrollados.

Noticias

Noticias Recientes