Once mil millones de dólares en 2 años: ElevenLabs ya traduce voz con emoción y entonación a otros idiomas sin que graben en castellano

ElevenLabs, fundada en 2023, pasó a unicornio europeo con 11.000M$ de valoración; sus modelos “trasladan” voz, entonación y emoción a otros idiomas, impulsando agentes para atención y ventas.

30 de abril de 2026 a las 11:24h
Once mil millones de dólares en 2 años: ElevenLabs ya traduce voz con emoción y entonación a otros idiomas sin que graben en castellano
Once mil millones de dólares en 2 años: ElevenLabs ya traduce voz con emoción y entonación a otros idiomas sin que graben en castellano

Hace apenas unos años, escuchar una voz humana perfectamente imitada por una máquina en varios idiomas, con entonación, emoción y acento nativo, sonaba como ciencia ficción. Hoy, en una oficina de Madrid, ingenieros trabajan para perfeccionar esa misma tecnología, capaz de hacer hablar a Matthew McConaughey en español con su voz real aunque él no haya grabado ni una sola palabra en castellano o de doblar en tiempo real las ruedas de prensa de la Comisión Europea. No es magia es la nueva realidad que construye ElevenLabs, una empresa que, en menos de dos años, ha pasado de ser un proyecto ambicioso a convertirse en uno de los mayores unicornios tecnológicos de Europa.

De la frustración a la revolución

Mati Staniszewski no oculta su desencanto con cómo ha evolucionado la tecnología de voz hasta ahora. "Es una experiencia terrible", dice sin rodeos. Y no lo dice desde la queja, sino desde el impulso "Fundamos ElevenLabs para arreglarlo". Junto a Piotr Dabkowski, Staniszewski lanzó la empresa en 2023 con una obsesión clara devolverle el alma a la voz generada por inteligencia artificial. Porque, como bien sabemos todos tras una llamada automatizada interminable, la diferencia entre una voz mecánica y una que transmite calidez humana es abismal. ElevenLabs no solo quiere que suene bien, quiere que se sienta.

"Nuestros modelos no solo traducen las palabras, sino que trasladan la voz, la entonación y la emoción a otras lenguas" - Mati Staniszewski, CEO de ElevenLabs

La promesa suena grandiosa, pero los números respaldan la ambición. La compañía ha alcanzado una valoración de 11.000 millones de dólares tras una ronda de financiación de 500 millones liderada por Sequoia, uno de los fondos más prestigiosos del mundo. En total, ha recaudado 781 millones de dólares, con el respaldo de instituciones como el Santander, cuyo CEO ha calificado esta inversión como "una señal de lo en serio que se están tomando esta tecnología las grandes instituciones financieras". No es para menos el mercado de la voz artificial está dejando de ser un accesorio para convertirse en un pilar estratégico de la comunicación global.

Madrid, nuevo frente del sonido del futuro

El desembarco de ElevenLabs en España no es casual. "España ha sido uno de los mercados donde más rápido hemos crecido", afirma Staniszewski. La apertura de una oficina en Madrid, con un equipo local de ingeniería y negocio, responde a una demanda creciente de grandes compañías que buscan integrar agentes inteligentes en sus operaciones. El plan es conformar un equipo de unos veinte profesionales en el país, una apuesta clara por el talento español en inteligencia artificial.

Y las aplicaciones ya están aquí. eDreams Odigeo utiliza la tecnología para atención al cliente en cinco idiomas, con millones de interacciones y mejoras de doble dígito en tiempos de resolución de llamadas. MediaMarkt emplea agentes de voz en WhatsApp, web y redes sociales para activar seguros y vender suscripciones. Santa Lucía Seguros ha dotado de voz a su asistente virtual, haciendo que las interacciones se sientan menos robóticas y más cercanas. En todos estos casos, no se trata solo de automatizar, sino de humanizar a escala.

Entre la voz humana y la artificial dónde dibujar la línea

Pero con grandes capacidades llegan grandes responsabilidades. La clonación de voces, los deepfakes auditivos y el fraude telefónico son riesgos reales. ElevenLabs lo sabe y actúa toda voz generada en su plataforma es trazable hasta la cuenta que la creó. La empresa bloquea la clonación de políticos y celebridades, y exige verificación de voz para acceder a herramientas profesionales. Además, colabora con otras organizaciones en la detección de deepfakes en tiempo real y tiene una alianza con el UK AI Security Institute para investigar cómo los usuarios perciben cuándo están hablando con una IA.

"Nos gustaría hacer una OPV algún día", reconoce Staniszewski, "pero por ahora estamos centrados en avanzar nuestros modelos y productos". Mientras tanto, la compañía avanza en un equilibrio delicado usar la IA para liberar a las personas de tareas repetitivas gestión de citas, cuentas, devoluciones y reservar la atención humana para lo que realmente requiere empatía, criterio y escucha activa. "La tecnología no debe reemplazar, sino potenciar", parece decir la filosofía implícita detrás de cada decisión.

La voz, ese rastro sonoro de nuestra identidad, ya no pertenece solo a los cuerpos que la emiten. Está siendo replicada, traducida, adaptada, enriquecida. Y aunque pueda sonar inquietante, también ofrece una esperanza la de una comunicación más inclusiva, accesible y emocionalmente inteligente. En Madrid, en una oficina que aún huele a nuevo, un equipo trabaja para que la próxima vez que escuches una voz perfecta en gallego, catalán o euskera, no importe si es humana o artificial, sino si te hizo sentir comprendido. Ese, al final, es el verdadero reto. Y el verdadero avance.

Sobre el autor
Redacción
Ver biografía