Tecnología, ciencia y cultura digital
Es posible que se gane una comisión por los enlaces en esta página

Sora, el generador de vídeos de OpenAI, es impresionante pero aterrador

OpenAI lanzó su principal generador de texto a video con IA y los resultados son tan increíbles como preocupantes.

Es posible que se gane una comisión por los enlaces en esta página.
Captura de pantalla de un vídeo generado por IA de Sora de OpenAI
Captura de pantalla de un vídeo generado por IA de Sora de OpenAI
Imagen: OpenAI

Abierta AI presentó Sora, su principal generador de texto a video, el jueves con videos hermosos e increíblemente realistas que muestran las capacidades del modelo de IA. Sora ahora está disponible para un pequeño número de investigadores y creativos que probarán el modelo antes de un lanzamiento público más amplio, lo que podría significar un desastre para la película. industria y nuestro problema colectivo deepfake.

“Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo”, dijo OpenAI en una publicación de blog. “El modelo entiende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el plano físico. mundo.”

Publicidad

OpenAI no dijo cuándo se lanzará Sora al público.

Sora es la primera incursión de OpenAI en la generación de videos con IA, y se suma a la tecnología de texto y generadores de imágenes, ChatGPT y Dall-E. Es único porque es menos una herramienta creativa y más una herramienta”.motor de física basado en datos,” como señaló el Dr. Jim Fan, investigador senior de Nvidia . Sora no está sólo generando una imagen, sino está determinando la física de un objeto en su entorno y renderiza un video basado en estos cálculos.

Publicidad

Para generar videos con Sora, los usuarios pueden simplemente escribir algunas oraciones como mensaje, muy parecido a los generadores de imágenes de IA. entre un estilo fotorrealista o un animado, produciendo resultados impactantes en sólo unos minutos.

Publicidad

Sora es un modelo de difusión, lo que significa que genera vídeo comenzando con un vídeo borroso y lleno de estática y lo suaviza lentamente hasta convertirlo en un formato pulido. versiones que ves a continuación. Los generadores de imágenes y videos de Midjourney y Stable Diffusion también son modelos de difusión.

Sin embargo, debo tener en cuenta que Sora de OpenAI es mucho mejor. Los vídeos que produce Sora son más largos, más dinámicos y fluyen juntos mejor que competidores. Sora siente que crea videos reales, mientras que los modelos de la competencia parecen un stop-motion de imágenes de IA. OpenAI ha estallado una vez más Otro campo más de IA con un generador de vídeo que avergüenza a la competencia.

Publicidad

Los vídeos producidos por Sora son innegablemente increíbles. Estos vídeos habrían tardado horas en ser producidos por un equipo de cine o animadores reales. Sora probablemente será disruptivo para la industria cinematográfica de la misma manera que ChatGPT y los generadores de imágenes de IA han conmocionado al mundo editorial y del diseño. Es una tecnología que es a la vez notable y, sin embargo, aterradora en términos de seguridad laboral para los creadores de videos.

Publicidad

OpenAI dice que hay algunos ajustes que deben resolver, incluyendo no comprender causa y efecto. Sora puede generar un vídeo de persona que le da un mordisco a una galleta, pero después, es posible que la galleta no tenga una marca de mordisco. OpenAI también dice que el modelo carece Conciencia espacial. Puede confundir izquierda y derecha y no entender cómo una persona u objeto interactúa con una escena.

La seguridad también es una preocupación primordial, especialmente dado cómo se ha abusado de la tecnología de inteligencia artificial para crear deepfakes en los últimos meses. OpenAI dice que creará herramientas para ayudar a detectar contenido engañoso, así como también aplicará tecnologías existentes que rechacen mensajes de texto dañinos. Sin embargo, Dadas las formas en que la gente ha eludido las protecciones de los modelos actuales de IA, es cuestionable el éxito de estos esfuerzos.

Publicidad

Sora es tan impresionante como aterrador, y está claro cómo este potente generador de vídeo con IA podría perturbar la industria cinematográfica y crear salidas. Imagínese si el Los deepfakes de Taylor Swift eran vídeos. O y si el Llamada telefónica deepfake de Joe Biden a los votantes de New Hampshire ¿Fue un mensaje fotorrealista de la Oficina Oval? Sora aún no está disponible públicamente, pero las implicaciones de una tecnología tan poderosa preceden su lanzamiento .

Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.