2026/04/13

Seedance 2.0: como usar referências de imagem, vídeo e áudio

Guia prático para usar o Seedance 2.0 com referências de imagem, vídeo e áudio, incluindo modos de entrada, papéis de @asset, limites e erros comuns.

A maneira mais fácil de obter resultados fracos do Seedance 2.0 é tratá-lo como um modelo normal de texto para vídeo. Isso geralmente leva às mesmas falhas: o elemento principal se desvia, a linguagem de câmera fica confusa e o áudio ou o ritmo parecem desconectados do plano.

Os materiais oficiais do Seedance apontam para uma lógica de operação diferente. O Seedance 2.0 funciona melhor quando você para de pensar em "uma instrução melhor" e passa a pensar em como distribuir o controle. O texto define a intenção. As imagens fixam a identidade e os detalhes. O vídeo ensina o movimento e a lógica de câmera. O áudio molda o ritmo e a atmosfera. O verdadeiro trabalho não é empilhar adjetivos, e sim decidir o que cada entrada deve controlar.

Este guia detalha o fluxo de trabalho prático para usar o Seedance 2.0 com referências de imagem, vídeo e áudio em conjunto, incluindo quando usar cada modo de entrada, como dividir a responsabilidade entre os ativos e o que evitar se você quiser resultados mais limpos.

Visual da página oficial do produto Seedance 2.0

Visual oficial do produto Seedance 2.0 da página pública da ByteDance.

Resposta rápida: Como usar bem o Seedance 2.0

Se você quer a versão curta, siga esta ordem:

  • Escolha o modo de entrada correto primeiro. O Seedance 2.0 separa primeiro/último quadro de referência de uso geral, e eles não são o mesmo fluxo de trabalho.
  • Faça o upload apenas dos ativos que devem realmente controlar o clipe. Mais arquivos não significam automaticamente resultados melhores.
  • Atribua uma função a cada ativo com referências no estilo @asset em vez de esperar que o modelo adivinhe.
  • Use imagens para identidade e estabilidade de design, vídeo para movimento ou linguagem de câmera e áudio para ritmo ou atmosfera.
  • Quando um resultado estiver próximo do ideal, use iterações no estilo de extensão, inserção ou edição em vez de recomeçar do zero.

Esse é o padrão central do Seedance 2.0: escolha o caminho certo, distribua as funções com clareza e depois escreva a instrução que amarra tudo isso.

Comece escolhendo o modo de entrada certo

Uma das distinções mais úteis no manual oficial é que o Seedance 2.0 possui dois caminhos principais de entrada:

  • primeiro/último quadro
  • referência de uso geral

Use primeiro/último quadro quando você tiver principalmente um quadro mais uma descrição em texto e quiser que o modelo construa o plano a partir dessa âncora. Nesse fluxo de trabalho, a instrução ainda carrega grande parte da lógica da cena.

Use referência de uso geral quando quiser combinar texto, imagens, vídeos e áudio em um único fluxo de trabalho direcionado. Essa é a melhor escolha quando você já conhece o elemento principal, o movimento, o tom ou o ritmo que deseja e precisa que o modelo siga o material fornecido em vez de inventar tudo por conta própria.

Essa escolha é importante porque muda a forma como você escreve. Em um fluxo de trabalho de primeiro quadro, a instrução precisa construir mais da cena. Em um fluxo de trabalho de referência de uso geral, ela funciona mais como uma camada de coordenação que explica ao modelo como os ativos enviados devem interagir.

Dê a cada entrada uma função clara

O Seedance 2.0 suporta texto + imagem + vídeo + áudio juntos, mas sua força não está simplesmente em aceitar mais arquivos. Sua força está no fato de que esses arquivos podem ser usados de forma deliberada.

O modelo de operação oficial é direto:

  • O texto define a intenção do plano.
  • As referências de imagem fixam a identidade do elemento principal, figurino, forma do produto, material ou detalhes da cena.
  • As referências de vídeo ensinam o movimento, o tempo e a linguagem de câmera.
  • As referências de áudio moldam a batida, a atmosfera, o tom do diálogo ou as transições.

O manual também deixa os limites práticos claros:

  • até 9 arquivos de imagem, com menos de 30 MB cada
  • até 3 arquivos de vídeo, com duração total da fonte de 2s-15s, com menos de 50 MB cada
  • até 3 arquivos de áudio, duração total de até 15s, com menos de 15 MB
  • até 12 arquivos no total em entradas multimodais mistas
  • duração da geração de 4s a 15s

Esses limites são úteis porque forçam a priorização. O objetivo não é enviar tudo o que você tem. O objetivo é decidir qual pequeno conjunto de ativos deve controlar a identidade, o movimento, o som e a continuidade.

Gráfico oficial de avaliação de texto para vídeo do Seedance 2.0

Visual oficial de avaliação de texto para vídeo do Seedance 2.0 dos materiais de lançamento.

Use referências @asset para dizer ao modelo o que importa

O hábito mais importante no Seedance é o mapeamento explícito de ativos. O manual recomenda referências no estilo @asset para que o modelo não precise deduzir qual é a função de cada arquivo enviado.

Um padrão prático é o seguinte:

  • @image1 estabelece o quadro inicial ou a identidade do elemento principal
  • @image2 define um figurino, material, visão lateral do produto ou adereço principal
  • @video1 ensina o movimento de câmera ou a lógica da ação
  • @audio1 fornece música, ritmo ou atmosfera

Isso é muito mais eficaz do que enviar vários arquivos e escrever um parágrafo genérico. Depois que cada ativo recebe um papel claro, a instrução textual só precisa descrever como esses papéis devem interagir.

Essa é a diferença entre "descrever tudo" e "dirigir o plano". O Seedance 2.0 é muito melhor no segundo modo.

Um fluxo de trabalho prático no Seedance 2.0

Se você está criando um clipe com referências de imagem, vídeo e áudio juntas, esta é a ordem mais confiável.

1. Fixe o elemento principal primeiro

Comece com a referência de imagem que mais importa. Se o resultado depender de um produto reconhecível, personagem ou detalhe de figurino, fixe isso antes de mexer no movimento ou na música.

Pergunte a si mesmo:

  • O que absolutamente não pode perder a consistência?
  • O problema principal é a identidade, os detalhes do produto, a textura ou o design da cena?
  • Qual imagem melhor ancora isso?

Se o seu plano depender de várias âncoras estáticas, adicione-as apenas quando cada uma controlar uma responsabilidade visual distinta.

2. Adicione vídeo apenas quando o movimento for a parte difícil

Use uma referência de vídeo quando o verdadeiro problema for o movimento da câmera, a marcação de cena ou o tempo da ação. É aqui que o Seedance 2.0 se torna muito mais útil do que um fluxo de trabalho apenas com texto.

Em vez de descrever uma aproximação, rotação, revelação ou ritmo de ação em uma prosa densa, você pode deixar o vídeo de origem ensinar ao modelo a gramática do movimento. Seu texto pode então focar no que deve acontecer dentro da nova cena.

Isso é especialmente útil para:

  • planos de produtos com controle de movimento
  • ritmos de ação com continuidade
  • cenas em plano contínuo ou plano-sequência
  • transições complexas de câmera

3. Adicione áudio quando o ritmo for importante para o plano

O áudio não é apenas decoração no Seedance 2.0. Os materiais oficiais o tratam como parte do sistema de controle.

Use áudio quando precisar de:

  • transições sincronizadas com a batida
  • ritmo guiado pela música
  • clima de diálogo
  • tempo emocional mais forte

Se o clipe deve cortar, mover ou se intensificar com o som, diga isso diretamente ao modelo. Se o som deve vir de um vídeo de origem, o Seedance também suporta emprestar essa lógica de áudio como parte do fluxo de trabalho.

4. Escreva a instrução como uma camada de coordenação

Depois que seus ativos forem escolhidos, escreva a instrução textual como uma coordenação entre as entradas, e não como uma redescrição dos arquivos.

Bons textos de instrução no Seedance geralmente respondem:

  • O que deve permanecer fixo?
  • O que deve se mover?
  • O que a câmera deve aprender com o vídeo de referência?
  • O que o áudio deve influenciar?
  • O que deve mudar ao longo do tempo?

Isso funciona melhor do que encher a instrução de adjetivos que os arquivos enviados já mostram.

5. Itere com extensão ou inserção quando o resultado estiver próximo

Um dos fluxos de trabalho mais práticos do Seedance 2.0 é que você nem sempre precisa gerar novamente do zero. O manual oficial suporta explicitamente:

  • estender um clipe existente
  • inserir uma cena entre dois clipes
  • usar o primeiro quadro mais um vídeo de referência de ação
  • descrever a continuidade explicitamente em ações vinculadas

Se o primeiro resultado estiver quase certo, continue a partir dele. Isso costuma ser mais estável do que reconstruir o plano inteiro.

No que o Seedance 2.0 é especialmente bom

Com base nos exemplos do manual oficial, o Seedance 2.0 é particularmente forte quando a tarefa criativa depende da coordenação entre vários sinais de controle, e não apenas de imaginação textual.

Os padrões de alto valor mais claros são:

  • planos comerciais e de produtos guiados por referência
  • linguagem de câmera emprestada de uma referência de vídeo
  • design de cena em plano-sequência ou com forte continuidade
  • edições sincronizadas com a batida e ritmo sensível à música
  • fluxos de trabalho de extensão de vídeo, inserção e estilo de edição

É por isso que o Seedance 2.0 faz mais sentido quando você já tem quadros aprovados, um exemplo de movimento, uma trilha sonora ou um roteiro visual preliminar. Trata-se menos de uma geração do tipo "surpreenda-me" e mais de uma produção direcionada em formato curto.

Gráfico oficial de avaliação de imagem para vídeo do Seedance 2.0

Visual oficial de avaliação de imagem para vídeo do Seedance 2.0 dos materiais de lançamento.

Erros comuns que quebram o fluxo de trabalho

A maioria dos resultados fracos do Seedance vem de uma atribuição ruim, não da falta de criatividade.

Enviar muitos ativos

Se cada arquivo tentar controlar tudo, o resultado ficará confuso. Seja seletivo e torne cada arquivo responsável por uma função principal.

Usar referências conflitantes

Não misture ativos que brigam entre si. Se a imagem define um plano focado na estética limpa do produto, mas a referência de vídeo ensina um movimento caótico de câmera na mão, você precisa decidir qual deles realmente domina o plano.

Redescrever o que os arquivos já mostram

Uma vez que o ativo já contém o detalhe visual, sua instrução deve focar no controle e no sequenciamento. Repetir os mesmos detalhes descritivos geralmente adiciona ruído em vez de clareza.

Usar o caminho de entrada errado

Se você estiver combinando várias modalidades, não force o trabalho em um fluxo de trabalho de primeiro quadro. Em vez disso, use o caminho de referência de uso geral.

Ignorar as restrições atuais

O manual também observa um limite real: envios contendo rostos humanos reais e realistas estão bloqueados no momento. Essa é uma restrição do fluxo de trabalho, não um caso isolado menor.

O melhor modelo mental para o Seedance 2.0

A maneira mais simples de pensar sobre o Seedance 2.0 é esta:

  • a imagem define sobre o que é o plano
  • o vídeo define como o plano se move
  • o áudio define como o plano é sentido no tempo
  • o texto define como os três devem cooperar

Se você mantiver essa hierarquia clara, o Seedance 2.0 se tornará muito mais fácil de controlar. Se você misturar esses papéis, o modelo terá que adivinhar, e adivinhar é onde a perda de consistência começa.

Considerações finais

Se você está tentando aprender a usar o Seedance 2.0 com referências de imagem, vídeo e áudio, a principal lição não é inventar uma instrução mais esperta. É manter disciplina no fluxo de trabalho.

Escolha o modo de entrada certo. Fique só com os ativos que realmente importam. Dê um papel claro a cada um. Depois, escreva a instrução de forma que una esses papéis.

Esse é exatamente o modelo operacional para o qual o Seedance 2.0 foi construído. Se o seu fluxo de trabalho já depende de imagens de referência, clipes de movimento, tempo de áudio e edições iterativas, ele é uma das opções mais claras para manter o controle dentro da atual pilha de vídeo com IA. Se quiser testar esse fluxo de trabalho na prática, comece pelo Seedance 2.0 no WMHub e só depois compare com o diretório de modelos de vídeo, quando já souber de que tipo de controle realmente precisa.