OpenAI presenta un modelo de IA para a creación de vídeo

xoves, 15 de febreiro do 2024 Marcus Fernández

OpenAI, creadores do célebre ChatGPT, están a sorprender ao mundo coa presentación da súa última creación: Sora, un modelo de IA capaz de crear escenas imaxinativas e realistas partindo de instrucións de texto.
En contraste con outras solucións semellantes, como Gen-2 Runway ou o Lumiere de Google, as creacións con Sora van máis aló duns poucos segundos de vídeo, sendo capaz de crear actualmente pezas visuais de grande calidade de até un minuto de duración axustándose ao indicado nas instrucións de texto, o que supón un impresionante nivel de comprensión da IA do mundo que nos rodea para ser capaz de simulalo en movemento.
Sora aínda non está aberto ao público, aínda que OpenAI está a compartir esta tecnoloxía con outras persoas fóra da compañía para poder recibir feedback de artistas visuais, deseñadores e creadores de vídeo para así mellorar na evolución deste modelo que pode ser de grande utilidade para os profesionais creativos.
O modelo actual é capaz de xerar complexas escenas con múltiples personaxes, tipos de movemento específicos, e mesmo marcando detalles moi concretos dos suxeitos e o fondo, grazas ao grande coñecemento que ten do mundo e a súa profunda comprensión da linguaxe, sorprendendo o feito de que nun único vídeo poida compoñer diferentes tomas, conseguindo uns resultados moi cinematográficos á vez que consegue manter o estilo visual e a persistencia dos personaxes.
Dende OpenAI recoñecen que o modelo actual aínda ten puntos febles, como dificultades para simular a física dunha escena complexa, non poder entender certas reaccións de causa-efecto, dificultades para manter o raccord, ou mesmo chegar a confundir detalles espaciais (como mesturar esquerda e dereita).
Pero antes de ofrecer Sora ao mundo, unha das principais preocupacións de OpenAI é a súa seguridade, xa que unha ferramenta así pode facilitar a creación de contidos para xerar desinformación, manipular á poboación ou vulnerar a propiedade intelectual, polo que están a traballar na elaboración dunhas políticas de uso e unhas salvagardas ante malos usos da ferramenta, así como tamén prevén a incorporación de metadatos nos contidos para que poida saberse de xeito doado que foron creados sinteticamente.
Estamos ante unha tecnoloxía realmente revolucionaria, que en poucos meses abrirase ao público, e que polo que amosaron até agora pode supor toda unha revolución para a creación audiovisual.

PUBLICIDADE