Um novo concorrente da Meta surgiu para desafiar o favorito de todos, Dall-E: Make-A-Video, um gerador de vídeo para texto que produz trechos curtos e silenciosos com base em prompts de texto semelhantes aos do Dall-E.
Dall-E é considerado simples se comparado com Make-A-Video, segundo Mark Zuckerberg. O CEO do Meta explicou em uma publicação no Facebook que criar vídeos é mais desafiador do que fotos, pois não envolve apenas a precisão dos pixels, mas também a previsão de como eles irão se modificar com o tempo. Make-A-Video não enfrenta essa dificuldade, pois ele é capaz de entender o movimento no mundo real e aplicá-lo à geração de imagens a partir de texto de maneira tradicional.
Outra função do Make-A-Video é a possibilidade de dar movimento a imagens que inicialmente são estáticas. Por exemplo, ao transformar uma imagem estática de uma mulher fazendo uma pose de ioga, a profundidade da transformação no Make-A-Video é evidenciada quando uma luz cintila na lente. O site da ferramenta oferece outros exemplos e destaca a opção de apresentar um vídeo existente ao Make-A-Video para obter diversas novas interpretações.
Vamos considerar esses exemplos com cautela, pois o Make-A-Video ainda não foi lançado para o público, mas representa uma nova possibilidade emocionante para a inteligência artificial.
Meta compartilhou um artigo sobre uma ferramenta que pode ser conferido neste link. O artigo explora o treinamento da ferramenta, juntamente com suas limitações técnicas, como a incapacidade de criar clipes com mais de cinco segundos e oferecer resoluções acima de 768 por 768 pixels a 16 quadros por segundo. De acordo com o Verge, o único modelo público de texto para vídeo disponível, chamado CogVideo, enfrenta as mesmas restrições.
Objetivo
Deixe uma resposta