Trending Misterio
iVoox
Descargar app Subir
iVoox Podcast & radio
Descargar app gratis
Enrique Rodal
Llega Sora, la inteligencia artificial de Open AI que crea vídeos

Llega Sora, la inteligencia artificial de Open AI que crea vídeos 5w3w6k

16/2/2024 · 16:47
0
95
Enrique Rodal

Descripción de Llega Sora, la inteligencia artificial de Open AI que crea vídeos 3m1c4v

Open AI, creadores de ChatGPT, han presentado otra herramienta de IA generativa, denominada Sora, que permite generar vídeos de hasta 60 segundos escribiendo palabras clave. Ha llamado la atención que es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento de cámara y detalles precisos del sujeto y del fondo. Hemos visto un dron sobrevolar el coliseo, una mujer paseando por una calle en Corea, mamuts corriendo, o barcos pirata navegando dentro de una taza de café. Todo ello con gran realismo. Esta IA va a tener importantes implicaciones en el sector creativo y en todo lo que tiene que ver con la creación de imágenes, la privacidad y el copyright. Conversamos sobre lo que supone Sora con Humberto Bustince, catedrático de Ciencia de la Computación e Inteligencia Artificial de la Universidad Pública de Navarra. gg5h

Lee el podcast de Llega Sora, la inteligencia artificial de Open AI que crea vídeos

Este contenido se genera a partir de la locución del audio por lo que puede contener errores.

Son las cinco y treinta y dos minutos de la tarde es viernes así que tenemos por delante un tiempo para hablar de nuevas tecnologías y hoy nos queremos acercar a lo que es la noticia del día en el ámbito de la inteligencia artificial enrique rodal arrecha león el salieron hoy la noticia como dices es que ella los creadores de derechos lgbt han presentado una herramienta de ia generativa denominadas hora que permite generar videos de hasta sesenta segundos escribiendo palabras clave igual que nos ofrecen otros servicios como dalí home journey en estos casos con imágenes estáticas no es algo nuevo pero sí que ha llamado la atención que es capaz de generar escenas complejas como múltiples personajes tipos específicos el movimiento de cámara y detalles precisos del sujeto y del fondo hemos visto por ejemplo un dron sobrevolar el coliseo romano una mujer paseando por una calle en tokio mamuts corriendo o barcos pirata navegando dentro de una taza de café todo ello con gran realismo además verdad que impacta y necesitamos a humberto augustin fue catedrático de ciencia de la computación e inteligencia artificial de la universidad pública de navarra para situarnos y digerir la barraca león humberto racha león bueno te ha llamado la atención verdad esta herramienta si además tengo que decirlo y es que desde que ha llegado a mis manos la herramienta pues llevo todo el día dedicado a ella es me parece que es un paso más de esa revolución que empezó el uno de diciembre del dos mil veintidós que sí que me gustaría decir que una fecha esa fue una otra el trece de marzo luego vienen a abril claro a ver texto primero segundo imagen tercero sonido el siguiente pasos de esta herramienta será con audio también claro hasta ahora tenemos video es lo que tenemos imágenes en movimiento qué tipo de innovación presenta estas herramientas hora respecto a otras aplicaciones de inteligencia artificial generativa como p t o dalí bueno mira a ver yo quiero decir es complicado lo que voy a decir a ver si intento hacerlo bien es lo que nosotros llamamos modelos de difusión partimos siempre que es todo lo que está haciendo la la empresa open artificial que llenes de texto y de texto vamos evolucionando a imagen y luego a sonido la idea es la siguiente abre en inteligencia artificial tenemos una serie de problemas que hay que tratarlos precisamente porque no tienen detrás una solución matemática una teoría matemática que lo resuelva yo siempre pongo el mismo ejemplo supongamos que queremos hacer un un trayecto que es pamplona bilbo donosti vitoria burgos pasando una y volviendo a pamplona pasan una vez por cada cien y con el mínimo gasto de energía no hay una teoría matemática que lo haga entonces la inteligencia artificial toma ese reto de hacerlo bueno pues lo que ha hecho ahora es exactamente lo mismo con el modelo de difusión una teoría matemática que no tiene solución damos solución por ahora no que no hay no hay un teorema que la resuelva qué es calcular la inversa de una distribución de probabilidades no voy a hablar más de eso y en esto se basa precisamente este tipo de herramientas primero lali etcétera pero todo lo que sea meter texto y generar una imagen tendremos funciona sí es bueno sí es similar a lo que hacíamos con el dalí o con el chat jpg lo harán y en video no te decía umberto que te han llamado la atención los los programas o comandos de texto que se utilizan para recrear estos videos por ejemplo el video de los barcos pirata navegando en una taza de café el es video fotorrealista de primer plano de dos barcos piratas luchando entre sí mientras navegan dentro de una taza de café es impresionante a ver hay que decir que el prom que se mete condiciona a la red neuronal que que actúa y que la red neuronal empieza siempre por una imagen aleatoria a ver una imagen aleatoria para nosotros recordáis esas pantallas de televisión sobre todo aquellas de blanco y negro que salía esto el ratón puntos blancos y negros pues se parte te no sé si la tenéis en mente es que además solía hacer un ruido muy especial para ser parte de una imagen de ese estilo el funcionamiento ver intentaré decirlo supongamos que cogemos un millón de imágenes y yo me dedico con la primera imagen a meter ruido es decir puntos aleatorios de forma matemática pero puntos que molesten a la imagen y hago eso con la primera con la última y con todas las imágenes una astilla tengo ese millón de imágenes tengo las originales y la correa ponente a cada una de ellas con ruido que he metido cosas raras dentro de la imagen pero que se ve visualmente ahora me generó una red neuronal de las que hacemos todo el rato pues para aprender una cosa etcétera etcétera cojo la primera imagen con ruido hago el problema al revés con la prima

Comentarios de Llega Sora, la inteligencia artificial de Open AI que crea vídeos 36h6m

Este programa no acepta comentarios anónimos. ¡Regístrate para comentar!