Background

Aoni

Preservando las lenguas indígenas de Sudamérica a través del poder de la IA

Sobre Aoni

Aoni es un proyecto revolucionario de IA que tiene como objetivo preservar y revitalizar las lenguas indígenas en peligro de extinción de Sudamérica. Basándonos en la iniciativa NLLB de Meta, que entrenó modelos en 200 idiomas, estamos extendiendo este trabajo para incluir lenguas nativas americanas que fueron excluidas—comenzando con el Tehuelche y otras lenguas indígenas más pequeñas. Al entrenar LLMs para comprender y traducir estos idiomas, estamos ayudando a la humanidad a mantener vivo el patrimonio lingüístico ancestral para las generaciones futuras.

Teaching languages

Preservando el Patrimonio

Protegiendo lenguas en peligro de desaparecer para siempre

AI Technology

Aprendizaje con IA

Entrenando LLMs avanzados usando Llama 4 y herramientas de código abierto

Community impact

Impacto Comunitario

Empoderando a las comunidades indígenas con herramientas lingüísticas accesibles

Aplicaciones del Mundo Real

Educación y Revitalización Lingüística

Nuestros modelos permiten la creación de materiales educativos, aplicaciones de aprendizaje interactivo y recursos digitales en lenguas en peligro de extinción. Las comunidades indígenas pueden usar estas herramientas para enseñar sus idiomas a las generaciones más jóvenes.

Desde libros infantiles hasta plataformas de aprendizaje de idiomas, la traducción impulsada por IA hace posible crear contenido a escala que tomaría décadas producir manualmente.

Education

Archivos Digitales de Preservación

Estamos digitalizando y traduciendo historias orales, relatos tradicionales y conocimientos culturales que existen solo en lenguas en peligro. Esto crea archivos digitales permanentes accesibles para investigadores y miembros de la comunidad en todo el mundo.

Al combinar la traducción con IA con la experiencia humana, garantizamos la precisión mientras aceleramos dramáticamente el proceso de preservación.

Herramientas de Conexión Cultural

Las personas indígenas que viven lejos de sus comunidades ancestrales pueden mantener la conexión con su patrimonio a través de herramientas de traducción, experiencias culturales virtuales y aplicaciones de práctica de idiomas.

Nuestra tecnología une distancias geográficas y permite la transmisión cultural a través de fronteras y generaciones.

Cultural connection

La Tecnología

Cómo Estamos Salvando Idiomas

Stage 1: Recopilación de Datos

Recopilamos datos lingüísticos de múltiples fuentes, incluyendo grabaciones orales, textos escritos, diccionarios y trabajo de campo con hablantes nativos. Estos datos se curan cuidadosamente para garantizar autenticidad y sensibilidad cultural.

Construido con Código Abierto

Nuestro proyecto aprovecha poderosas herramientas de código abierto, incluyendo Llama 4 de Meta, herramientas de entrenamiento Fairseq NLLB e infraestructura de Google Colab. Esto garantiza transparencia, reproducibilidad y colaboración comunitaria.

Ver en GitHub

El Viaje

Hitos de Investigación

Nuestro viaje para preservar las lenguas nativas americanas a través de la IA ha estado marcado por la innovación continua y la colaboración con comunidades indígenas. Cada hito nos acerca más a garantizar que ningún idioma quede atrás.

2024fundación

Lanzamiento del Proyecto

Comienza la investigación inicial y la recopilación de datos para la lengua Tehuelche

2024modelo

Primer Lenguaje a Desarrollar

Desarrollo del Tehuelche como primer lenguaje y armado de un corpus con ayuda de especialistas en lenguas nativas argentinas

2025expansión

Primer Entrenamiento con LLAMA3

Continuación del desarrollo del corpus y primer entrenamiento con LLAMA3. Pruebas y verificaciones de funcionamiento del modelo

2025despliegue

Despliegue Público y Comunidad Open Source

Primer despliegue y compartición pública del corpus y modelo de lenguaje. Inicio del desarrollo de la comunidad open source en torno a colaboradores del proyecto

2026modelo

Alianzas con Universidades

Establecimiento de alianzas con 10 universidades para integrar centros de investigación lingüística. Expansión de la comunidad para sumar expertos en al menos 5 nuevas lenguas nativas, incluyendo alguna lengua no latinoamericana

2026hito

Expansión de Colaboraciones

Expansión de colaboraciones con más universidades. Prueba de modelos con 5 lenguajes priorizados por la comunidad de colaboradores

Journey visualization

Idiomas que Estamos Preservando

Comenzando con Tehuelche y otras lenguas indígenas sudamericanas en peligro crítico de extinción, estamos construyendo un ecosistema integral de preservación lingüística. Mientras que el NLLB de Meta incluyó Guaraní, decenas de otras lenguas indígenas fueron excluidas—estamos trabajando para cambiar eso.

Actualmente Soportados

Tehuelche

Pipeline

Quechua
Aymara
Guaraní (extensions)
Wichi
Toba
Mocoví
Pilagá
Chorote
Nivaclé
Maká
Enlhet
Sanapaná
Angaité
Guaná
Ayoreo
Ishir
Maskoy
Toba-Maskoy

Ayúdanos a Expandir

Estamos buscando activamente colaboración con comunidades indígenas, lingüistas e investigadores para expandir nuestra cobertura de idiomas. Si tienes experiencia o recursos para lenguas sudamericanas en peligro, nos encantaría trabajar juntos.