OpenAI ha dado un paso más en la carrera por dominar la generación de contenidos audiovisuales con el lanzamiento de Sora 2, la segunda generación de su modelo de creación de vídeos a partir de texto. Este avance no solo mejora la calidad visual y la coherencia escénica respecto a su predecesor, sino que también introduce una aplicación móvil que recuerda a TikTok y que promete transformar la forma en que los usuarios interactúan con los contenidos generados por inteligencia artificial. La herramienta, que combina realismo, interactividad y personalización, podría marcar un antes y un después en el entretenimiento digital y en la creación colaborativa en línea.
La nueva aplicación permite a los usuarios, tras una verificación rápida mediante reconocimiento de rostro y voz, insertarse como cameos en escenas generadas por inteligencia artificial.
Esta funcionalidad abre un abanico de posibilidades para la creación de vídeos personales, desde escenas de acción hasta entornos fantásticos, todo sin necesidad de cámaras ni estudios. Además, los usuarios pueden remezclar contenidos de otros, compartir sus creaciones y navegar por un feed personalizado, todo dentro de una interfaz intuitiva pensada para fomentar la participación activa más que el consumo pasivo.
La compañía describe este salto tecnológico como un avance comparable al que en su día supuso GPT 3.5 para el texto. Esta comparación no es baladí. Sora 2 no solo genera imágenes más realistas, sino que incorpora una comprensión mucho más profunda de la física del mundo real. Un ejemplo claro es que si una pelota falla el aro en un tiro de baloncesto, ahora rebota en el tablero de forma natural, en lugar de desaparecer o teletransportarse, un error habitual en modelos anteriores de generación de vídeo. Esta fidelidad física es una de las principales novedades técnicas del sistema.
Otro avance significativo es la capacidad del modelo para mantener el estado de la escena entre diferentes planos, lo que mejora la continuidad narrativa. Además, Sora 2 puede interpretar instrucciones más complejas, generar voces sintetizadas de alta calidad, incluir efectos sonoros y crear paisajes sonoros completos. Todo ello en un solo flujo de generación, lo que multiplica su potencial creativo y su utilidad en entornos profesionales como el cine independiente, la publicidad o la educación.
La aplicación se estrena inicialmente bajo invitación para dispositivos iOS en Estados Unidos y Canadá. Aunque OpenAI promete una expansión a más países en el futuro, por ahora no está disponible en España ni en gran parte de Europa. Este lanzamiento limitado responde probablemente a cuestiones regulatorias, especialmente en un contexto en el que la Unión Europea está redoblando esfuerzos para controlar el impacto de la IA en la privacidad y la desinformación.
El servicio arranca de forma gratuita, aunque con límites en el número de generaciones posibles, dependiendo de la capacidad de cómputo disponible. Aquellos que busquen una experiencia más potente podrán acceder a Sora 2 Pro, una versión de mayor calidad reservada para suscriptores de ChatGPT Pro que pagan 200 dólares mensuales. OpenAI también tiene previsto habilitar el acceso al modelo mediante una API, lo que permitirá a desarrolladores y empresas integrarlo en sus propias aplicaciones.
Uno de los aspectos más destacables es el enfoque ético y de diseño responsable
OpenAI asegura que la aplicación no busca atrapar al usuario en un scroll infinito y que está diseñada para priorizar a personas conocidas y fomentar la creación más que el consumo. Este enfoque contrasta con el modelo de adicción al contenido que han criticado muchas plataformas sociales. La compañía también ha implementado medidas específicas para proteger a los adolescentes, incluyendo un número limitado de generaciones, permisos estrictos para el uso de su imagen en cameos, controles parentales integrados desde ChatGPT y la posibilidad de revocar en cualquier momento el uso de su rostro o voz.
Para prevenir el acoso y otros abusos, habrá moderadores humanos supervisando casos extremos. OpenAI no oculta los desafíos técnicos que aún quedan por resolver. La empresa admite que los errores abundan y que la coherencia general está lejos de ser perfecta, aunque considera el progreso respecto a Sora 1 como evidente. Esto incluye problemas como objetos que aparecen y desaparecen, movimientos antinaturales o inconsistencias temporales, comunes aún en modelos de vanguardia.
La llegada de Sora 2 no solo es un hito tecnológico, sino también un punto de inflexión cultural. Por primera vez, millones de personas podrán crear vídeos complejos con instrucciones sencillas, sin necesidad de habilidades técnicas previas. Esto democratiza la creación audiovisual, pero también plantea nuevas preguntas sobre la autenticidad, el derecho a la imagen y el papel de la realidad en un entorno cada vez más sintético.
"si una pelota falla el aro, rebota en el tablero en lugar de teletransportarse, un error común en sistemas anteriores" por
OpenAI
En este nuevo escenario, donde la línea entre lo real y lo generado por máquina se difumina, la responsabilidad de las empresas tecnológicas será más importante que nunca. Sora 2 no es solo un producto, es un espejo de hacia dónde se dirige la creatividad humana en la era de la inteligencia artificial. Y aunque aún no esté disponible en España, su impacto global será inevitable, invitándonos a repensar no solo cómo consumimos contenidos, sino cómo los creamos y con qué propósito.