OpenAI, editor de ChatGPT y del generador de imágenes DALL-E, ha presentado una nueva herramienta, llamada “Sora”, capaz de crear vídeos realistas de hasta un minuto de duración simplemente introduciendo texto, una importante innovación en el campo de la inteligencia artificial. Basándose en investigaciones anteriores realizadas sobre los programas DALL-E y GPT, esta nueva plataforma aún está en fase de prueba, afirmó la start-up californiana aliada de Microsoft, que presentó algunos vídeos y su génesis.

El programa puede generar vídeos de hasta un minuto de duración «manteniendo la calidad visual y respetando la demanda de los usuarios», dijo OpenAI en su sitio web. Sora puede “generar escenas complejas con varios personajes, tipos específicos de movimientos y detalles precisos”, detalla la startup en su sitio. Sora también permite crear un vídeo a partir de una imagen fija, asegura el gigante de la inteligencia artificial, o ampliar vídeos existentes.

Sam Altman, jefe de OpenAI, declaró en la red social X que su empresa “ofrecería acceso a un número limitado de creadores” a esta nueva herramienta, como parte de una fase experimental. También invitó a los usuarios a realizar propuestas para generar videos, los más relevantes de los cuales momentos después difundió en la plataforma. Entre estos vídeos podemos ver a dos perros retozando en la nieve de la montaña. Otro vídeo muestra el vuelo de un animal imaginario, mitad pato, mitad dragón, ante una magnífica puesta de sol, con un hámster vestido con ropa deportiva en el lomo.

Sora sirve de base para “programas capaces de comprender y simular el mundo real”, explica la start-up, que espera que “constituya un paso importante en la realización de la AGI” (Inteligencia General Artificial), un sistema altamente autónomo que superaría a los humanos en la mayoría de las tareas económicamente rentables. OpenAI advirtió que el “modelo actual” de la plataforma tenía “defectos” como confusión entre izquierda y derecha o imposibilidad de mantener la continuidad visual a lo largo del vídeo. “Por ejemplo, una persona puede morder una galleta, pero después la galleta puede no tener la marca del mordisco”, explica el editor.

Al presentar esta nueva herramienta, la empresa afirmó que la cuestión de la seguridad constituye una cuestión esencial y que se organizarán simulaciones con usuarios desafiados a producir fallos de funcionamiento o a crear contenidos inapropiados, para definir mejor los límites de la plataforma. «Involucraremos a formuladores de políticas, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología», dijo OpenAI. Meta, Google y Runway AI, que funcionan en aplicaciones similares llamadas «texto a vídeo», ya han presentado ejemplos.