En esta noticia
La Inteligencia Artificial (IA) ha experimentado un crecimiento explosivo en los ltimos aos, con modelos como ChatGPT y Gemini liderando el sector. No es casualidad que la cultura, los valores y los sesgos de estas herramientas reflejen en gran medida a sus desarrolladores, pues la mayora de estos modelos han sido creados y entrenados en los Estados Unidos, lo que implica limitaciones a la hora de representar con precisin otras regiones, especialmente la de Amrica latina, donde la historia y la idiosincrasia local suelen quedar en un segundo plano.
Para reducir esta brecha, surge Latam-GPT, el primer modelo de IA diseado para reflejar la riqueza cultural y lingstica de la regin. Con un fuerte respaldo de Argentina, a travs de la Universidad Nacional de Crdoba (UNC) y la Fundacin Va Libre, este proyecto busca no solo una representacin ms fiel de la identidad latinoamericana, sino tambin sentar las bases de una soberana tecnolgica.
Steam regala el juego ms ansiado por todos: hasta cundo est la promocin?
Por ello, el Centro Nacional de Inteligencia Artificial (CENIA) de Chile se prepara para lanzar en junio de 2025 Latam-GPT. Ms de 30 instituciones y 60 expertos regionales han trabajado en su desarrollo para garantizar que el modelo represente la riqueza y diversidad de la regin.
Latam-GPT no slo integrar expresiones y modismos propios de cada pas, sino que tambin abordar contextos histricos y realidades actuales.
Rodrigo Durn, gerente y director ejecutivo del CENIA explica que este proyecto no busca competir con los gigantes tecnolgicos del hemisferio norte, sino desarrollar capacidades locales, centradas en una profunda comprensin del contexto regional.
Adems, ser un «modelo fundacional», no una app ni un chatbot, sino la base sobre la que podrn desarrollarse futuras aplicaciones. Al estar construidas sobre esta inteligencia, estas aplicaciones tendrn una mayor comprensin sobre Latinoamrica y el Caribe.
El nuevo modelo de IA que busca reflejar a Latinoamrica
«Hay un tema que es cultural e idiosincrtico. La mayora de los modelos del norte global presentan una subrepresentacin de los datos y por lo tanto de la cultura y de la idiosincrasia local. Eso es lo que estamos cambiando con Latam-GPT«, seala Durn a El Cronista.
En la misma lnea, Joan Cwaik, autor y divulgador tecnolgico, advierte que «hablar de soberana en IA es meterse en un terreno ms poltico que tecnolgico», pero subraya que desarrollar modelos propios no es un capricho de independencia, sino una necesidad: «Los modelos entrenados con datos ajenos siempre nos van a leer con ruido. El espaol de la Argentina no es el de Mxico, y mucho menos el de Espaa, y eso es solo el idioma».
En este sentido, Alexander Diztzend, presidente de la Sociedad Argentina de Inteligencia Artificial (SAIA), sostiene que cada nacin debera contar con al menos «un desarrollo de LLM propio ya que estos modelos llevan consigo la cultura de quienes los desarrollaron». Y cita un ejemplo: «Los modelos chinos no hablan de los eventos ocurridos en la plaza de Tiananmen en 1989. Los modelos no son imparciales. Siempre estn sesgados en una direccin».
Las 3 razones por las que hay que desactivar el Wi-Fi del celular al salir de casa
Un modelo «abierto, pblico e inclusivo»
Una de las caractersticas fundamentales del Latam-GPT ser su naturaleza pblica, abierta e inclusiva. Esto significa que el cdigo del modelo ser accesible para cualquier persona interesada: «El producto del modelo del entrenamiento se sube a una plataforma y cualquier persona puede acceder, estudiarlo, utilizarlo, replicarlo y cambiarlo».
El proceso de recoleccin de datos ha sido diseado para incluir textos histricos, sentencias judiciales y documentos institucionales an no digitalizados. Este esfuerzo permitir integrar a comunidades marginadas cuyos datos no estn disponibles en formato digital. Para ello, se ha incorporado un corpus de texto indito que incluye documentos sobre violaciones de derechos humanos en Uruguay y transcripciones taquigrficas de congresos nacionales.
En cuanto a la base de datos de Latam-GPT, Durn menciona que el modelo «ser entrenado con 55Bn de parmetros, que son 300 billones de tokens, equivalentes a 12 terabytes de datos». Sin embargo, uno de los desafos que enfrenta es la actualizacin constante de los datos, algo que se logra a travs de convenios con archivos nacionales y el uso de tcnicas avanzadas de recoleccin de datos, como el OCR para textos digitalizados.
En lo que respecta a la gran inversin en hardware para entrenar el modelo, la Universidad de Tarapac ha aportado una suma de u$s 10 millones en infraestructura.
El tan esperado lanzamiento de Latam-GPT promete ser un hito en el campo de la inteligencia artificial, no solo por su capacidad tcnica, sino por su enfoque inclusivo, culturalmente adaptado para los pases de Amrica Latina.