
Sobre Aoni
Aoni es un proyecto revolucionario de IA que tiene como objetivo preservar y revitalizar las lenguas indígenas en peligro de extinción de Sudamérica. Basándonos en la iniciativa NLLB de Meta, que entrenó modelos en 200 idiomas, estamos extendiendo este trabajo para incluir lenguas nativas americanas que fueron excluidas—comenzando con el Tehuelche y otras lenguas indígenas más pequeñas. Al entrenar LLMs para comprender y traducir estos idiomas, estamos ayudando a la humanidad a mantener vivo el patrimonio lingüístico ancestral para las generaciones futuras.

Preservando el Patrimonio
Protegiendo lenguas en peligro de desaparecer para siempre

Aprendizaje con IA
Entrenando LLMs avanzados usando Llama 4 y herramientas de código abierto

Impacto Comunitario
Empoderando a las comunidades indígenas con herramientas lingüísticas accesibles
Aplicaciones del Mundo Real
Educación y Revitalización Lingüística
Nuestros modelos permiten la creación de materiales educativos, aplicaciones de aprendizaje interactivo y recursos digitales en lenguas en peligro de extinción. Las comunidades indígenas pueden usar estas herramientas para enseñar sus idiomas a las generaciones más jóvenes.
Desde libros infantiles hasta plataformas de aprendizaje de idiomas, la traducción impulsada por IA hace posible crear contenido a escala que tomaría décadas producir manualmente.

Archivos Digitales de Preservación
Estamos digitalizando y traduciendo historias orales, relatos tradicionales y conocimientos culturales que existen solo en lenguas en peligro. Esto crea archivos digitales permanentes accesibles para investigadores y miembros de la comunidad en todo el mundo.
Al combinar la traducción con IA con la experiencia humana, garantizamos la precisión mientras aceleramos dramáticamente el proceso de preservación.
Herramientas de Conexión Cultural
Las personas indígenas que viven lejos de sus comunidades ancestrales pueden mantener la conexión con su patrimonio a través de herramientas de traducción, experiencias culturales virtuales y aplicaciones de práctica de idiomas.
Nuestra tecnología une distancias geográficas y permite la transmisión cultural a través de fronteras y generaciones.

La Tecnología
Cómo Estamos Salvando Idiomas
Stage 1: Recopilación de Datos
Recopilamos datos lingüísticos de múltiples fuentes, incluyendo grabaciones orales, textos escritos, diccionarios y trabajo de campo con hablantes nativos. Estos datos se curan cuidadosamente para garantizar autenticidad y sensibilidad cultural.
Construido con Código Abierto
Nuestro proyecto aprovecha poderosas herramientas de código abierto, incluyendo Llama 4 de Meta, herramientas de entrenamiento Fairseq NLLB e infraestructura de Google Colab. Esto garantiza transparencia, reproducibilidad y colaboración comunitaria.
Ver en GitHubEl Viaje
Hitos de Investigación
Nuestro viaje para preservar las lenguas nativas americanas a través de la IA ha estado marcado por la innovación continua y la colaboración con comunidades indígenas. Cada hito nos acerca más a garantizar que ningún idioma quede atrás.
Lanzamiento del Proyecto
Comienza la investigación inicial y la recopilación de datos para la lengua Tehuelche
Primer Lenguaje a Desarrollar
Desarrollo del Tehuelche como primer lenguaje y armado de un corpus con ayuda de especialistas en lenguas nativas argentinas
Primer Entrenamiento con LLAMA3
Continuación del desarrollo del corpus y primer entrenamiento con LLAMA3. Pruebas y verificaciones de funcionamiento del modelo
Despliegue Público y Comunidad Open Source
Primer despliegue y compartición pública del corpus y modelo de lenguaje. Inicio del desarrollo de la comunidad open source en torno a colaboradores del proyecto
Alianzas con Universidades
Establecimiento de alianzas con 10 universidades para integrar centros de investigación lingüística. Expansión de la comunidad para sumar expertos en al menos 5 nuevas lenguas nativas, incluyendo alguna lengua no latinoamericana
Expansión de Colaboraciones
Expansión de colaboraciones con más universidades. Prueba de modelos con 5 lenguajes priorizados por la comunidad de colaboradores

Idiomas que Estamos Preservando
Comenzando con Tehuelche y otras lenguas indígenas sudamericanas en peligro crítico de extinción, estamos construyendo un ecosistema integral de preservación lingüística. Mientras que el NLLB de Meta incluyó Guaraní, decenas de otras lenguas indígenas fueron excluidas—estamos trabajando para cambiar eso.
Actualmente Soportados
Pipeline
Ayúdanos a Expandir
Estamos buscando activamente colaboración con comunidades indígenas, lingüistas e investigadores para expandir nuestra cobertura de idiomas. Si tienes experiencia o recursos para lenguas sudamericanas en peligro, nos encantaría trabajar juntos.