La Real Academia Española revela tres aplicaciones de inteligencia artificial de acceso público en Madrid el 6 de noviembre de 2025, con el propósito de proteger y promover el español en el cambiante panorama digital.
Presentado en la sede histórica de la Academia, este conjunto de software —que incluye un observatorio de neologismos y un verificador lingüístico— constituye el resultado más visible hasta la fecha de la iniciativa de Lengua Española e Inteligencia Artificial, más conocida por su acrónimo LEIA.
Creada en 2019 y actualmente financiada con 5 millones de euros del programa NextGenerationEU de la Unión Europea, LEIA busca garantizar que el español «prospere no solo en las aulas y los libros, sino también en algoritmos, plataformas y aplicaciones», según funcionarios de la academia. Al poner estas herramientas a disposición de académicos, desarrolladores y público en general, la RAE espera situar al español en igualdad tecnológica con el inglés y otras lenguas dominantes.
Las aplicaciones
El elemento central del lanzamiento es el Observatorio de Neologismos, un sistema automatizado que examina medios de comunicación, redes sociales y otros contenidos digitales para detectar palabras y expresiones ausentes del autorizado Diccionario de la lengua española (DLE). En tiempo real identifica términos emergentes, regionalismos y préstamos extranjeros, presentando cada candidato con comentarios provisionales de lingüistas.
Complementando el observatorio está el Verificador Lingüístico, que clasifica y explica errores ortográficos, léxicos, sintácticos y morfológicos en cualquier texto cargado. Los usuarios reciben sugerencias fundamentadas en la doctrina académica y enlaces directos a entradas relevantes del diccionario o la gramática. Una tercera herramienta, el Recolector de Variedades, invita a hablantes de todo el mundo a contribuir con frases regionales mediante juegos interactivos, creando un repositorio colaborativo de diversidad lingüística para estudios futuros.
Aunque impulsadas por modelos de lenguaje y algoritmos de procesamiento de lenguaje natural, el software fue diseñado estrictamente como ayuda, no como reemplazo de lingüistas profesionales. «No es un chatbot sino una herramienta que asiste a los lingüistas», explicó Asunción Gómez-Pérez, directora de LEIA, durante la presentación. Las decisiones finales sobre la incorporación de nuevas palabras al diccionario permanecen en manos humanas, subrayó.
Urgencia estratégica
«La inteligencia artificial ya no es opcional sino esencial», declaró Santiago Muñoz Machado, director de la RAE, enmarcando el lanzamiento como una respuesta necesaria a lo que denominó «un aliado indispensable para preservar, estudiar y proyectar la lengua española hacia el futuro». Esa sensación de urgencia sustenta todo el programa LEIA. En una entrevista con El Mundo, funcionarios de la academia describieron el objetivo general del proyecto como «defender el uso del español en el ámbito digital y en inteligencia artificial» El Mundo.
El respaldo gubernamental ha ampliado el alcance de LEIA. Su segunda fase, iniciada en 2022, se incorporó al Proyecto Estratégico para la Recuperación y Transformación Económica (PERTE) de España para la «Nueva Economía de la Lengua». El Ministerio para la Transformación Digital señala que el plan busca aprovechar el español para el crecimiento tecnológico y económico mientras fomenta la «soberanía tecnológica y lingüística». Dentro de este marco, el proyecto ALIA está desarrollando modelos de IA domésticos para reducir la dependencia de plataformas en inglés en sectores estratégicos.
Apertura de los archivos
Junto con el nuevo software, la academia anunció la digitalización completa de más de 800.000 fichas históricas de «punto rojo» que documentan los primeros usos registrados de palabras españolas. Según los curadores, hacer que el archivo sea libremente consultable en línea acelerará la investigación etimológica y armonizará el estudio académico con los datos vivos producidos por el observatorio de neologismos.
Cómo funcionan las herramientas
El motor de IA del observatorio procesa millones de páginas web en español diariamente. Un algoritmo filtra posibles neologismos comparando términos con el DLE y otros corpus de referencia aprobados. Los términos candidatos se clasifican por frecuencia, distribución geográfica y novedad semántica antes de que un lingüista humano revise la preselección. Cada término recibe una etiqueta de estado público —en observación, aceptado o rechazado— junto con una breve nota que explica el fundamento.
El verificador aplica modelos de lenguaje basados en transformers ajustados a las reglas gramaticales de la RAE. Cuando un usuario pega un texto, el sistema señala desviaciones y cita pasajes autorizados de la Nueva gramática u Ortografía. Una interfaz con código de colores categoriza los problemas como ortográficos, léxicos, sintácticos o morfológicos, permitiendo a los escritores profundizar en explicaciones en lugar de simples correcciones subrayadas en rojo.
La recopilación de variedades lingüísticas se apoya en la gamificación. Los visitantes responden cuestionarios de vocabulario regional o graban pronunciaciones locales. A cambio, ganan puntos e insignias con temas literarios. Los datos fluyen a los servidores de la RAE donde dialectólogos validan las entradas, enriqueciendo gradualmente una interfaz pública basada en mapas que muestra el mosaico global del español.
Lanzamiento público y acceso
Las aplicaciones estarán disponibles en los próximos días a través del portal LEIA en el sitio web de la RAE, de forma gratuita para usuarios individuales. Se están considerando licencias comerciales y una interfaz de programación de aplicaciones (API) para editores y empresas tecnológicas que busquen integrar el verificador en sus flujos de trabajo.
Al abrir la plataforma, la RAE espera cultivar un círculo virtuoso: los usuarios ayudan a entrenar mejores modelos de lenguaje, y los modelos mejorados devuelven valor a la misma comunidad mediante herramientas más precisas. «El futuro de la lengua depende, al fin y al cabo, de sus hablantes», recordó Muñoz Machado a los asistentes.
Coalición internacional
Aunque liderado por la RAE, LEIA opera en colaboración con la Asociación de Academias de la Lengua Española (ASALE), cuyas 23 academias miembro representan a 500 millones de hablantes en cinco continentes. La infraestructura compartida permite que lingüistas argentinos, por ejemplo, etiqueten características del español rioplatense, mientras equipos mexicanos contribuyen con regionalismos de Yucatán u Oaxaca. Este enfoque distribuido es esencial para un idioma con amplia variación dialectal, argumenta Gómez-Pérez, porque «ningún corpus único puede capturar el español en toda su riqueza».
La reacción de la comunidad lingüística ha sido cautelosamente optimista. Los académicos acogen con satisfacción los datos abiertos y algoritmos transparentes, pero enfatizan la importancia de la supervisión humana para evitar reforzar sesgos o canonizar prematuramente jergas pasajeras. La insistencia de la academia en mantener a los estudiosos «en el circuito» se considera, por tanto, una salvaguarda crucial.
Financiación y cronograma
El presupuesto de 5 millones de euros de LEIA cubre infraestructura de datos, anotación lingüística y campañas de divulgación pública hasta 2026. Contribuciones adicionales en especie provienen de universidades españolas y socios del sector privado especializados en procesamiento de lenguaje natural. Según documentos del proyecto, próximos hitos incluyen un módulo de corpus de voz para mejorar la precisión del reconocimiento de habla para acentos no estándar y un complemento educativo compatible con sistemas populares de gestión del aprendizaje.
Contexto europeo más amplio
El esfuerzo de España refleja movimientos similares de otros miembros de la UE para integrar idiomas nacionales en sistemas de IA, una tendencia alentada por el impulso de Bruselas hacia la «soberanía digital». Sin embargo, el español ocupa una posición única: es tanto un idioma global como, fuera de América Latina, a menudo subrepresentado en investigaciones avanzadas de PLN dominadas por conjuntos de datos en inglés. Al construir sus propias herramientas, España espera influir en los estándares internacionales y garantizar que el español mantenga un lugar privilegiado en servicios impulsados por IA como asistentes virtuales, motores de traducción e interfaces de voz.
Próximos pasos
La academia planea informes públicos regulares, comenzando con un resumen de fin de año que detallará cuántos neologismos candidatos detecta el observatorio por mes, cuántos pasan la revisión humana y cuántos son finalmente aprobados para su inclusión en el diccionario. El portal comunitario de LEIA mostrará tablas de clasificación para colaboradores del recopilador de variedades, incentivando aún más la participación amplia.
Para educadores, está previsto que el verificador se integre con plataformas de procesamiento de texto ampliamente utilizadas, permitiendo a los estudiantes recibir comentarios gramaticales alineados con las directrices de la RAE en lugar de reglas genéricas de corrección ortográfica. Mientras tanto, medios de comunicación están probando APIs de texto masivo para agilizar procesos de edición —una indicación temprana de que las herramientas podrían ganar tracción más allá del ámbito académico.
Análisis: impacto potencial
Si el lanzamiento cumple sus objetivos, los hispanohablantes pronto podrían beneficiarse de un ecosistema integral de recursos de IA con sofisticación equivalente a los disponibles en inglés. Esto, a su vez, podría impulsar la creación de contenido, mejorar la investigación en PLN y reducir las barreras que actualmente dirigen a muchos desarrolladores hacia modelos anglófonos. Aun así, el éxito a largo plazo dependerá de una inversión sostenida y de la capacidad de la RAE para mantener sus algoritmos transparentes e inclusivos —un delicado equilibrio entre autoridad prescriptiva y la naturaleza democrática de la evolución del lenguaje digital.
Por ahora, el lanzamiento del observatorio de neologismos y el verificador lingüístico marca un paso decisivo hacia la fusión de la filología centenaria con la tecnología del siglo XXI, asegurando que la lengua de Cervantes hable con fluidez en la era de los algoritmos.
Fuentes
- https://www.elmundo.es/cultura/literatura/2025/11/06/690cef78e4d4d8a31f8b45bf.html
- https://es.euronews.com/cultura/2025/11/06/la-ia-ya-no-es-una-opcion-la-rae-abre-al-publico-aplicaciones-de-inteligencia-artificial
