A OpenAI anunciou sua primeira ferramenta para criação de vídeos de até um minuto de duração a partir de texto, chamada Sora. Segundo a empresa, esta inteligência artificial é capaz de gerar “cenas complexas com vários personagens” e “detalhes precisos do sujeito e do plano de fundo”.
A Sora deverá concorrer com
modelos similares de Google (Lumiere) e Meta (Make-A-Video). Todos eles estão
em fase de testes e não foram liberadas para os usuários.
A OpenAI promete que sua IA conseguirá criar personagens convincentes, que expressam emoções vibrantes — se a Sora realmente conseguir fazer isso, ela já está melhor que vários atores.
O site da OpenAI traz alguns
vídeos de demonstração. Os resultados são bastante detalhados, visualmente
satisfatórios e, quando exigido, realísticos.
Os prompts altamente específicos
chamam a atenção. Um dos vídeos foi feito a partir do pedido de um zoom no olho
de uma mulher de 24 anos, filmado em 70 mm, com cores vivas, durante a golden
hour em Marrakech (Marrocos).
Em outro, o teto descrevia uma
cena com um homem de 60 anos ponderando a história do Universo em um café de
Paris (França), com o sujeito dando um sorriso discreto ao achar uma resposta
para o mistério da vida.
Sora tem problemas típicos de IA
Nem tudo está funcionando
perfeitamente, porém. A OpenAI admite que a Sora tem dificuldades em simular a
parte física de uma cena complexa e nem sempre entende corretamente causas e
efeitos. “Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas
depois disso, o biscoito pode estar sem uma marca de mordida”, diz a página.
Outros problemas conhecidos são
confusões espaciais, como trocar esquerda e direita, e entender eventos que
ocorrem no decorrer do tempo, como seguir a trajetória de uma câmera.
A OpenAI colocou em seu site
alguns exemplos dos problemas. Há movimentos fisicamente implausíveis, animais
e pessoas surgindo espontaneamente, uma bola de basquete atravessando o aro e
furando a rede da cesta, uma cadeira de plástico excessivamente flexível e uma
senhora que não consegue apagar as velas de seu bolo de aniversário.
A Sora ainda não vai funcionar em
nenhum produto da OpenAI. Por enquanto, ela estará disponível apenas aos red
teamers da empresa, que vão testar riscos e perigos. Artistas visuais,
cineastas e designers também terão acesso à ferramenta para fazer comentários.
Fonte: TecnoBlog.