Latam-GPT lanza convocatoria para recolección de grandes volúmenes de datos

El Centro Nacional de Inteligencia Artificial (CENIA) lanzó una campaña regional para convocar a instituciones públicas, universidades, centros de investigación, organizaciones sociales y personas de toda América Latina y el Caribe con acceso a grandes volúmenes de datos a colaborar en el entrenamiento de Latam-GPT, el primer modelo de lenguaje latinoamericano de código abierto, mediante la entrega de textos con licencia abierta o permiso institucional.

Latam-GPT es una iniciativa sin precedentes en la región que busca desarrollar una inteligencia artificial que hable nuestros idiomas, comprenda nuestras instituciones y represente nuestras culturas, saberes y realidades sociales. A diferencia de los modelos globales, entrenados mayoritariamente con información del norte global, Latam-GPT se construye desde el sur, con datos diversos, trazables y autorizados.

La campaña busca recolectar grandes volúmenes de textos en español, portugués o inglés que cuenten con licencias abiertas o permisos explícitos de uso. Se aceptan tanto archivos en texto plano como enlaces a sitios institucionales con contenido útil para ser integrado vía técnicas de scraping.

¿Qué tipo de contenidos se pueden aportar?

  • Tesis, artículos académicos, papers y documentos técnicos
  • Normas, leyes, actas públicas, informes de gobierno
  • Publicaciones culturales, históricas, literarias o comunitarias
  • Blogs, entrevistas, foros, relatos orales y contenidos locales
  • Materiales sobre historia, arte, salud, economía, justicia, medioambiente, pueblos originarios, educación, y más

Los datos aportados se utilizarán para entrenar el modelo Latam-GPT, el cual será publicado en acceso abierto para toda la comunidad de América Latina y el Caribe. El proyecto se rige por principios de gobernanza ética de datos, respetando la trazabilidad, las licencias de origen y los marcos de uso definidos por cada institución.

Para enviar grandes volúmenes de datos, hemos dispuesto ESTE FORMULARIO.

Noticias

Noticias Recientes