La inteligencia artificial (IA) avanzó de manera exponencial en los últimos años, con modelos como ChatGPT y Gemini liderando el desarrollo de esta tecnología. Sin embargo, la mayoría de estas herramientas fueron creadas en los Estados Unidos, lo que implica que su cultura, valores y sesgos reflejan en gran medida la perspectiva del norte global. Esta situación genera limitaciones para representar con precisión a otras regiones, en especial América Latina, cuya historia e idiosincrasia quedan relegadas para la IA. Es lo que advirtieron los especialistas del CENIA (Centro Nacional de Inteligencia Artificial), una organización sin fines de lucro de Chile.
Latam-GPT se propone llenar el vacío. Se trata del primer modelo de IA diseñado específicamente para reflejar la riqueza cultural y lingüística de América Latina. Con el apoyo de la Universidad Nacional de Córdoba (UNC) y la Fundación Vía Libre en Argentina, este proyecto abierto y colaborativo del CENIA tiene como objetivo no solo una representación más fiel de la identidad latinoamericana, sino también la construcción de una soberanía tecnológica para la región.
Un modelo de IA con identidad latinoamericana
El CENIA de Chile presentará Latam-GPT en junio de 2025. En su desarrollo participaron más de 30 instituciones y de 60 expertos regionales para garantizar que el modelo represente la diversidad lingüística y cultural de los países latinoamericanos.
LA RESPUESTA DE CHAT-GPT. Esta captura de pantalla forma parte de la justificación oficial de una IA latinoamericana. / LATAM-GPT
Latam-GPT no sólo integrará expresiones y modismos propios de cada país, sino que también abordará contextos históricos y realidades actuales que suelen ser minimizadas en otros modelos de IA. No se trata de competir con los gigantes tecnológicos del hemisferio norte, sino de desarrollar capacidades locales con una profunda comprensión del contexto regional.
Una IA construida con y para Latinoamérica
La mayoría de los modelos de IA disponibles fueron entrenados con datos que representan la cultura y la idiosincrasia latinoamericanas. Latam-GPT busca cambiar esta situación al ser desarrollado con datos provenientes de la región, que procuran una interpretación más precisa de la realidad local.
Además, el modelo no será una simple aplicación o chatbot, sino un «modelo fundacional» sobre el que podrán desarrollarse futuras aplicaciones que comprendan mejor el español latinoamericano y las particularidades de la región.
Un proyecto abierto y colaborativo
Una de las características más relevantes de Latam-GPT es su naturaleza pública, abierta e inclusiva. Esto significa que el código del modelo será accesible para cualquier persona interesada en estudiarlo, utilizarlo o modificarlo.
El proceso de recolección de datos se diseñó para incluir textos históricos, sentencias judiciales y documentos institucionales que aún no están digitalizados. De esta manera, se busca integrar comunidades marginadas cuyos datos no suelen estar disponibles en los entrenamientos de IA tradicionales.
Según manifestaron los responsables del proyecto, Latam-GPT será entrenado con 55 billones de parámetros y utilizará 300 billones de tokens equivalentes a 12 terabytes de datos. Para mantener actualizados estos datos, el equipo de desarrollo estableció convenios con archivos nacionales y empleará técnicas avanzadas de recolección de información, como la digitalización de documentos mediante OCR.
Una inversión clave para la soberanía tecnológica
El desarrollo de Latam-GPT requiere de una inversión significativa en infraestructura tecnológica. La Universidad de Tarapacá aporto 10 millones de dólares en hardware para el entrenamiento del modelo, lo que permitirá un rendimiento competitivo.
El lanzamiento promete ser un hito en la inteligencia artificial, no sólo por lo que significa esta innovación tecnológica, sino también por su compromiso con la inclusión y la representación de América Latina en el mundo digital.