Home Mundo Gen-3 Alpha é a resposta da Runway ao sora da OpenAI: 9...

Gen-3 Alpha é a resposta da Runway ao sora da OpenAI: 9 vídeos mostram a versatilidade do modelo de IA

29
0

A inteligência artificial está progredindo em ritmo acelerado, assim como sua adoção. Por um lado, a ameaça da IA ​​substituir empregos é grande, enquanto, por outro lado, ela está mostrando inúmeras maneiras de amplificar a criatividade humana. A Runway AI, sediada nos EUA, apresentou seu mais recente modelo de IA Gen-3 Alpha. A empresa afirma que ele é “uma nova fronteira para geração de vídeo controlável e de alta fidelidade”.

Gen-3 Alpha é o primeiro na próxima série de modelos treinados pela Runway em uma nova infraestrutura construída para treinamento multimodal em larga escala. A Runway afirma que o novo modelo é uma grande melhoria em fidelidade, consistência e movimento em relação à Gen-2. É seu passo em direção à construção de Modelos Mundiais Gerais – o próximo grande avanço em IA, pois esses serão sistemas que entenderão o mundo visual e sua dinâmica.

Desde o lançamento do modelo Gen-3 Alpha, os usuários da internet têm compartilhado suas criações exclusivas com o mundo. Esses vídeos de alta definição mostram a versatilidade e o alcance do novo modelo de IA da Runway AI. Aqui está uma olhada em alguns vídeos fascinantes da Gen-3 Alpha.

Crie sua ficção de monstro

Um modelo de texto para vídeo como o Gen-3 Alpha pode realmente amplificar sua criatividade. Um usuário no X (antigo Twitter) conhecido como Uncanny Harry AI usou o modelo para criar um pequeno vídeo de um monstro fictício surgindo do Rio Tâmisa em Londres. O vídeo mostra um “monstro hediondo” surgindo do rio evocando o famoso Godzilla ou Kaiju. O clipe de 11 segundos é cinematográfico com uma cena sombria de Londres sob um céu nublado, e o monstro lentamente subindo acima das ondas ferozes.

Desenho a lápis em lapso de tempo

Outra usuária, Anu Akash, que afirma estar “explorando ferramentas de IA” em sua biografia no X, compartilhou um pequeno vídeo gerado pela Gen-3 Alpha onde um desenho a lápis de uma garota é mostrado em lapso de tempo. Akash usou o prompt descrevendo o vídeo de lapso de tempo de vista superior de uma arte a lápis desenhada à mão. Ela o descreveu como uma arte de uma garota com cabelo de coelho do começo ao fim. A usuária também reconheceu que o cabelo era um erro de digitação no prompt que ela deu, pois pretendia que fossem “orelhas de coelho”. No entanto, ela pareceu satisfeita com a produção da Gen-3 Alpha.

Uma narrativa floral

Gen-3 Alpha pode materializar até mesmo seus sonhos mais loucos. Martin Haerlin, outro usuário do X, usou o modelo para criar um carrossel visual de flores. Podia-se ver o desabrochar de pétalas rosas e vermelhas de flores sobre uma megacidade, armas atirando em flores de todos os tipos cores e tamanhos, o arco de um guerreiro se transformando em um girassol, margaridas flutuando no ar, soldados e artistas marciais manobrando flores. Em sua postagem, Haerlin exclamou que com o Gen-3 Alpha parecia que seu conjunto de ferramentas para contar histórias foi supercarregado e elevado a saltos.

Crie seu filme de ficção científica

O Gen-3 Alpha pode potencialmente transformar suas ideias de ficção científica em realidade. O antigo criador do Google Maps AR/VR, Bilawal Sidhu, acessou sua conta X para compartilhar seus experimentos com o Gen-3 Alpha da Runway AI. Em uma longa sequência de vídeos, ele elogiou o modelo de IA por seus visuais impressionantes de simulação de partículas, efeitos de interação de luz e movimentos complexos de câmera em alguns casos.

Sidhu também destacou a capacidade do Gen-3 Alpha de manter detalhes de alta frequência, geração de vídeo no estilo de tiro em primeira pessoa e exercer controle usando prompts de texto, independentemente da física imperfeita. O criador também observou gráficos de movimento realistas, física e cidade visualização. Embora ele achasse as renderizações humanas boas, ele afirmou que elas eram difíceis de controlar. Sidhu disse que os heads-up displays e os prompts de realidade aumentada eram realistas.

Instruções de texto para controlar a velocidade da câmera

Entusiasta da arte da IA vkuoo compartilhou uma criação única da Gen-3 Alpha. Esta é talvez a primeira vez na geração de texto para vídeo de IA. O usuário apresentou uma demonstração onde ele é mostrado controlando velocidades de câmera usando comandos de texto. Quando um dos usuários solicitou o prompt que ele usou para criar o vídeo, vkuoo respondeu com o prompt – “Corrida de hiper-lapso desorientadora ultrarrápida através de um túnel em um labirinto de vinhas em rápido crescimento. As luzes do túnel piscam em alta frequência, e as vinhas crescem rapidamente para bloquear o caminho. Movimento rápido da câmera com mudanças intensas de foco.”

Um vídeo de um carro esportivo em movimento

Heather Cooper, cuja biografia a descreve como uma educadora e consultora de IA, compartilhou um vídeo curto impressionante de um carro esportivo atravessando um pavimento molhado. O vídeo foi gravado em um ângulo baixo mostra o futurista carro movendo-se por uma rua ladeada por luzes de neon. Cooper usou o prompt – “Low-angle tracking shot following a sleek sport car with neon lights reflecting off the wet pavment.”

Detalhes ricos e sincronização labial realista

Chrissie, outra usuária do X que é uma criadora de vídeos de IA, compartilhou um clipe curto criado usando Gen-3 Alpha. O clipe mostra uma mulher andando e falando sobre Gen-3 Alpha. A usuária observou que as habilidades de sincronização labial do Gen-3 Alpha da Runway AI são divertidas. “Olhe para a expressão dela enquanto ela dá aquele risinho leve no final, rs”, escreveu Chrissie

Visuais hiper-realistas

O artista digital e cineasta, Christopher Fryant, compartilhou um curta-metragem de 53 segundos chamado ‘This Town isn’t Real’. Fryant usou o modelo Gen-3 Alpha com alguma edição adicional e design de som feito por ele. Fritador disse que a saída é inteiramente texto para vídeo. A filmagem do vídeo mostra a câmera passando por uma cena noturna mostrando pessoas em movimento. A princípio, pode parecer uma filmagem real.

Voando através do tempo e das paisagens

Blaine Brown, cuja biografia X diz que ele é um líder de Inovação, tentou o Gen-3 Alpha pela primeira vez. Brown acessou sua conta X para compartilhar o resultado. Seu prompt dizia – “Um voo por um castelo na Irlanda que se torna uma cidade cyberpunk futurística com arranha-céus.” O vídeo criado pelo Gen-3 Alpha é rico em detalhes, pois descreve com precisão as torres de canto do castelo, suas passarelas de paralelepípedos e uma transição suave para uma cidade cyberpunk com arranha-céus brilhantes.

Os modelos de vídeo de IA são uma prova do potencial que a IA detém o campo de comunicação visual. No início deste ano, a OpenAI chocou o mundo com seu modelo superior de texto para vídeo Sora. Embora os modelos de vídeo de IA tenham persistido, nos últimos tempos mais e mais startups de IA estão surgindo com seus modelos de IA que estão essencialmente superando seus antecessores.

Oferta festiva

Com base nas criações acima de vários usuários, parece que o Gen-3 Alpha da Runway está no mesmo nível do Sora, até mesmo o superando em alguns casos com base nas amostras de vídeo compartilhadas pela OpenAI. O Sora ainda não está disponível. O ex-CEO da Stability AI, Emad Mostaque, também compartilhou uma postagem fazendo comparações entre o Gen-3 Alpha e o Sora.

A Runway AI está entre uma das primeiras startups a trabalhar com IA para geração de vídeo. O Gen-3 Alpha, que agora está disponível ao público, permite que os usuários façam vídeos de IA hiper-realistas a partir de texto, imagens ou até mesmo prompts de vídeo. Aqueles inscritos com PistaML plataforma pode usar o modelo’. Enquanto Gen-1 e Gen-2 eram modelos gratuitos, para usar Gen-3, os usuários terão que comprar uma assinatura a partir de US$ 12 por mês/por editor.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here