Hay 520 millones de personas que hablan y escriben en español. En la era de la inteligencia artificial, esa cifra no garantiza por sí sola que una máquina entienda bien el idioma.
El Consejo Superior de Investigaciones Científicas acaba de poner ese problema en el centro con el informe Descubrir el potencial científico de la lengua española analiza los retos para las políticas públicas. La idea de fondo resulta bastante directa. Si faltan información, corpus, algoritmos de procesamiento del lenguaje natural y terminologías en español, las máquinas hablarán peor este idioma o lo entenderán con más limitaciones.
El español necesita datos para que la máquina no tropiece
No basta con que una lengua tenga cientos de millones de hablantes. El CSIC sitúa la cuestión en el terreno menos visible para el gran público, que es el de los recursos con los que trabajan los sistemas de inteligencia artificial, una carencia que enlaza con debates recientes sobre gobernanza del uso de la IA.
Dicho de otro modo, una lengua puede ser masiva en la calle y débil en los sistemas automáticos. Ahí entran los corpus, las terminologías especializadas y los algoritmos entrenados para trabajar en español sin depender siempre de materiales pensados para otros idiomas.
En 2025, además, el CSIC presentó su EstrategIA CSIC 2025-2030.
La estrategia ya mueve proyectos, contratos y presupuesto
Esa hoja de trabajo llega acompañada de cifras concretas. La institución mantiene más de 90 proyectos activos de inteligencia artificial y dedica a ese conjunto un presupuesto superior a 21 millones de euros.
Eloísa del Pino, presidenta del Consejo, enmarcó ese despliegue en una idea amplia sobre el papel de la tecnología dentro del organismo.
"La EstrategIA CSIC define el compromiso de la institución con un uso ético, riguroso y transformador de la Inteligencia Artificial en la investigación, la gestión y la transferencia del conocimiento" - Eloísa del Pino, presidenta del Consejo Superior de Investigaciones Científicas
Junto a los proyectos, el programa Momentum CSIC ha lanzado 187 contratos de investigación en inteligencia artificial con financiación de Red.es. La combinación entre presupuesto, personal y estructura deja ver que aquí no se habla solo de experimentar en laboratorios, sino de crear capacidad estable.
La formación crece mientras la IA entra en más espacios
También aparece otra pieza menos vistosa y, sin embargo, decisiva. El portal CSIC Aprende y su Colección IA reúnen más de 50 módulos de autoaprendizaje sobre inteligencia artificial aplicada en Azure.
Mientras tanto, la estrategia aprobada en 2025 no camina aislada. El CSIC la alinea con la Estrategia Española de Inteligencia Artificial 2024, con la iniciativa europea RAISE y con el Plan Estatal de Investigación Científica, Técnica y de Innovación 2024-2027, un encaje que conecta esta discusión con la regulación española de la inteligencia artificial.
Al final, la discusión sobre el español en la inteligencia artificial no gira solo alrededor de 520 millones de hablantes. Gira alrededor de algo más incómodo y más concreto, que es si existen suficientes datos, terminologías y algoritmos para que una máquina no trate una de las grandes lenguas del mundo como si fuera secundaria.