184 visualizações 3 min 0 Comentário

Sora da OpenAI: Criação de vídeos a partir de texto e imagens

- 16 de fevereiro de 2024

Além do Texto e Imagens: Como o Sora Transforma Ideias em Vídeos

Desperta curiosidade sobre o processo único de transformação pelo Sora.

Em 15 de outubro, a OpenAI revelou ao mundo sua mais recente inovação em inteligência artificial, o “Sora”. Este avançado sistema de IA é capaz de criar vídeos de até 60 segundos, utilizando apenas texto e imagens como entrada. Atualmente, o Sora está na fase inicial de desenvolvimento, com acesso restrito a um grupo selecionado de especialistas e criadores de conteúdo, indicando que ainda não está disponível para o público geral.

A tecnologia por trás do Sora é especialmente projetada para compreender e interpretar solicitações do usuário de maneira profunda, não apenas reconhecendo o conteúdo textual, mas também aplicando esse entendimento na geração de vídeos que refletem de forma realista essas solicitações. Esta IA de geração de vídeo se destaca pela sua habilidade em criar cenas complexas que incluem personagens dinâmicos, movimentos específicos e cenários detalhados, mantendo uma consistência temporal notável. Mesmo que o sujeito do vídeo desapareça temporariamente do quadro, o Sora assegura que, ao retornar, ele mantenha seu estado original com alta probabilidade.

Além disso, o Sora inova ao permitir a transformação de imagens estáticas em vídeos animados detalhados, oferecendo aos usuários a capacidade de expandir a narrativa de um vídeo existente ao adicionar novas cenas no início ou no final, e até mesmo preencher lacunas com quadros ausentes. A funcionalidade do Sora se estende à criação de vídeos em loop e à geração de transições suaves que conectam dois vídeos de maneira imperceptível, além de suportar a criação de imagens em alta resolução, chegando a 2.048 x 2.048 pixels.

Contudo, a tecnologia ainda enfrenta desafios, como a dificuldade em compreender completamente as relações de causa e efeito, exemplificado pela ausência de marcas de mordida em um biscoito após ser mordido, e a criação de cenas que apresentam movimentos fisicamente improváveis.

A inovação trazida pelo Sora marca um avanço significativo no campo da inteligência artificial, prometendo revolucionar a forma como vídeos são criados e editados, apesar dos desafios existentes que ainda necessitam ser superados.

Comentários estão fechados.