Seedance 2.0 : utiliser des références image, vidéo et audio
Guide pratique pour utiliser Seedance 2.0 avec des références image, vidéo et audio : modes d’entrée, rôles @asset, limites et erreurs à éviter.
Le moyen le plus simple d'obtenir de mauvais résultats avec Seedance 2.0 est de le traiter comme un modèle texte-vidéo classique. Cela conduit généralement aux mêmes échecs : le sujet dérive, le langage de la caméra devient confus, et l'audio ou le rythme semble déconnecté du plan.
La documentation officielle de Seedance propose une autre logique de travail. Pour bien utiliser Seedance 2.0, il faut cesser de chercher « une meilleure consigne » et réfléchir plutôt à la répartition du contrôle. Le texte fixe l’intention. Les images verrouillent l’identité et les détails. La vidéo apporte le mouvement et la logique de caméra. L’audio règle le rythme et l’ambiance. Le vrai travail n’est pas d’ajouter des adjectifs, mais de décider ce que chaque entrée doit piloter.
Ce guide détaille le flux de travail pratique pour utiliser Seedance 2.0 avec des références d'image, de vidéo et d'audio combinées, y compris quand utiliser chaque mode d'entrée, comment répartir les responsabilités entre les ressources, et ce qu'il faut éviter si vous souhaitez des résultats plus nets.

Visuel officiel du produit Seedance 2.0 issu de la page publique de ByteDance.
Réponse rapide : Comment bien utiliser Seedance 2.0
Si vous voulez la version courte, suivez cet ordre :
- Choisissez d'abord le bon mode d'entrée. Seedance 2.0 sépare la
première/dernière imagede laréférence polyvalente, et il ne s'agit pas du même flux de travail. - Ne téléversez que les ressources qui doivent véritablement contrôler le clip. Plus de fichiers ne signifie pas automatiquement de meilleurs résultats.
- Attribuez un rôle à chaque ressource avec des références de type
@assetau lieu d'espérer que le modèle devine. - Utilisez les images pour l'identité et la stabilité du design, la vidéo pour le mouvement ou le langage de la caméra, et l'audio pour le rythme ou l'ambiance.
- Lorsqu'un résultat est proche, utilisez l'extension, l'insertion ou l'itération de type édition au lieu de repartir de zéro.
C'est le principe central de Seedance 2.0 : choisissez la bonne voie, attribuez clairement les rôles, puis rédigez une consigne qui coordonne l'ensemble.
Commencez par choisir le bon mode d'entrée
L'une des distinctions les plus utiles du manuel officiel est que Seedance 2.0 propose deux voies d'entrée principales :
première/dernière imageréférence polyvalente
Utilisez première/dernière image lorsque vous disposez principalement d'une image et d'une description textuelle, et que vous souhaitez que le modèle construise le plan à partir de ce point d'ancrage. Dans ce flux de travail, la consigne porte encore une grande partie de la logique de la scène.
Utilisez référence polyvalente lorsque vous souhaitez combiner du texte, des images, des vidéos et de l'audio dans un seul flux de travail dirigé. C'est le meilleur choix lorsque vous connaissez déjà le sujet, le mouvement, le ton ou le rythme que vous souhaitez, et que vous avez besoin que le modèle suive le matériel fourni au lieu de tout inventer par lui-même.
Ce choix est important car il change votre façon d’écrire. Dans un flux basé sur la première image, la consigne doit construire davantage la scène. Dans un flux de référence polyvalente, elle agit plutôt comme une consigne de pilotage qui explique comment les ressources importées doivent se combiner.
Donnez un rôle clair à chaque entrée
Seedance 2.0 prend en charge la combinaison texte + image + vidéo + audio, mais sa force ne réside pas simplement dans le fait d'accepter plus de fichiers. Sa force est que ces fichiers peuvent être utilisés de manière délibérée.
Le modèle de fonctionnement officiel est simple :
- Le texte définit l'intention du plan.
- Les références d'image verrouillent l'identité du sujet, le costume, la forme du produit, la matière ou les détails de la scène.
- Les références vidéo enseignent le mouvement, le timing et le langage de la caméra.
- Les références audio façonnent le rythme, l'atmosphère, le ton des dialogues ou les transitions.
Le manuel clarifie également les limites pratiques :
- jusqu'à
9fichiers d'image, de moins de30 MBchacun - jusqu'à
3fichiers vidéo, avec une durée source totale de2s-15s, de moins de50 MBchacun - jusqu'à
3fichiers audio, d'une durée totale allant jusqu'à15s, de moins de15 MB - jusqu'à
12fichiers au total pour les entrées multimodales mixtes - durée de génération de
4sà15s
Ces limites sont utiles car elles obligent à prioriser. Le but n'est pas de télécharger tout ce que vous avez. Le but est de décider quel petit ensemble de ressources doit contrôler l'identité, le mouvement, le son et la continuité.

Visuel d'évaluation officiel texte-vers-vidéo de Seedance 2.0 issu des documents de lancement.
Utilisez les références @asset pour indiquer au modèle ce qui compte
L'habitude la plus importante avec Seedance est l'association explicite des ressources. Le manuel recommande d'utiliser des références de type @asset pour que le modèle n'ait pas à deviner le rôle de chaque fichier importé.
Voici un schéma pratique :
@image1définit l'image d'ouverture ou l'identité du sujet@image2fixe un costume, une matière, une vue de profil du produit ou un accessoire clé@video1montre le mouvement de caméra ou la logique de l'action@audio1apporte la musique, le rythme ou l'ambiance
C'est une approche bien plus efficace que d'importer plusieurs fichiers et de rédiger un paragraphe générique. Une fois que chaque ressource a un rôle bien défini, la consigne textuelle n'a plus qu'à décrire la façon dont ces rôles doivent fonctionner ensemble.
C'est toute la différence entre « tout décrire » et « diriger le plan ». Seedance 2.0 est bien meilleur dans ce second mode.
Un flux de travail pratique pour Seedance 2.0
Si vous créez un clip en combinant des références d'image, de vidéo et d'audio, voici l'ordre le plus fiable.
1. Verrouillez le sujet en premier
Commencez par la référence d'image la plus importante. Si le résultat dépend d'un produit reconnaissable, d'un personnage ou d'un détail vestimentaire, verrouillez-le avant de toucher au mouvement ou à la musique.
Posez-vous les questions suivantes :
- Qu'est-ce qui ne doit absolument pas dériver ?
- Le problème principal concerne-t-il l'identité, les détails du produit, la texture ou la conception de la scène ?
- Quelle image ancre le mieux cela ?
Si votre plan dépend de plusieurs points d'ancrage fixes, ne les ajoutez que si chacun contrôle une responsabilité visuelle distincte.
2. N'ajoutez la vidéo que lorsque le mouvement est la partie difficile
Utilisez une référence vidéo lorsque le véritable problème réside dans le mouvement de la caméra, le placement ou le timing de l'action. C'est là que Seedance 2.0 devient bien plus utile qu'un flux de travail basé uniquement sur le texte.
Au lieu de décrire un travelling avant, une rotation, une révélation ou un temps fort de l'action dans une prose dense, vous pouvez laisser la vidéo source enseigner au modèle la grammaire du mouvement. Votre consigne peut alors se concentrer sur ce qui doit se passer à l'intérieur de la nouvelle scène.
Ceci est particulièrement utile pour :
- les plans de produits avec contrôle du mouvement
- les temps forts d'action avec continuité
- les scènes en plan continu ou en plan-séquence
- les transitions de caméra complexes
3. Ajoutez l'audio lorsque le rythme est important pour le plan
L'audio n'est pas qu'une simple décoration dans Seedance 2.0. La documentation officielle le présente comme un levier de contrôle à part entière.
Utilisez l'audio lorsque vous avez besoin de :
- transitions synchronisées sur le rythme
- rythme dicté par la musique
- l'ambiance d'un dialogue
- un timing émotionnel plus fort
Si le clip doit être coupé, bouger ou s'intensifier avec le son, dites-le directement au modèle. Si le son doit provenir d'une vidéo source, Seedance permet également d'emprunter cette logique audio dans le cadre du flux de travail.
4. Rédigez la consigne comme une couche de coordination
Une fois vos ressources choisies, rédigez la consigne textuelle comme des instructions entre les entrées, et non comme une re-description des fichiers.
Une bonne rédaction de consigne pour Seedance répond généralement à :
- Qu'est-ce qui doit rester fixe ?
- Qu'est-ce qui doit bouger ?
- Que doit apprendre la caméra de la vidéo de référence ?
- Qu'est-ce que l'audio doit influencer ?
- Qu'est-ce qui doit changer au fil du temps ?
Cela produit de meilleures consignes que de bourrer la consigne d'adjectifs que les fichiers téléchargés montrent déjà.
5. Itérez avec l'extension ou l'insertion lorsque le résultat est proche
L'un des flux de travail les plus pratiques de Seedance 2.0 est que vous n'avez pas toujours besoin de tout regénérer de zéro. Le manuel officiel prend explicitement en charge :
- l'extension d'un clip existant
- l'insertion d'une scène entre deux clips
- l'utilisation de la première image plus une vidéo de référence d'action
- la description explicite de la continuité à travers des actions liées
Si le premier résultat est globalement correct, continuez à partir de celui-ci. C'est souvent plus stable que de reconstruire l'intégralité du plan.
Ce pour quoi Seedance 2.0 est particulièrement doué
D'après les exemples du manuel officiel, Seedance 2.0 est particulièrement performant lorsque la tâche créative dépend de la coordination de plusieurs leviers de contrôle plutôt que de la seule imagination textuelle.
Les modèles à forte valeur ajoutée les plus évidents sont :
- les plans de produits et les publicités guidés par des références
- le langage de la caméra emprunté à une vidéo de référence
- la conception de scènes en plan-séquence ou à forte continuité
- les montages synchronisés sur le rythme et la cadence adaptée à la musique
- les flux de travail d'extension vidéo, d'insertion et de style montage
C'est pourquoi Seedance 2.0 prend tout son sens lorsque vous avez déjà des images approuvées, un exemple de mouvement, une bande-son ou un découpage approximatif. Il s'agit moins d'une génération de type "surprenez-moi" que d'une production dirigée au format court.

Visuel officiel d'évaluation image-vers-vidéo de Seedance 2.0 issu des documents de lancement.
Les erreurs courantes qui brisent le flux de travail
La plupart des résultats médiocres de Seedance proviennent d'une mauvaise attribution des rôles, et non d'un manque de créativité.
Télécharger trop de ressources
Si chaque fichier essaie de tout contrôler, le résultat devient confus. Restez sélectif et donnez à chaque fichier la responsabilité d'une tâche principale.
Utiliser des références contradictoires
Ne mélangez pas des ressources qui s'opposent. Si l'image définit un plan beauté de produit épuré mais que la vidéo de référence enseigne un mouvement de caméra à l'épaule chaotique, vous devez décider laquelle contrôle réellement le plan.
Redécrire ce que les fichiers montrent déjà
Une fois que la ressource contient déjà le détail visuel, votre consigne doit se concentrer sur le contrôle et le séquençage. Répéter les mêmes détails descriptifs ajoute souvent du bruit plutôt que de la clarté.
Utiliser la mauvaise voie d'entrée
Si vous combinez plusieurs modalités, ne forcez pas la tâche dans un flux de travail de première image. Utilisez plutôt la voie de référence polyvalente.
Ignorer les restrictions actuelles
Le manuel note également une véritable limite : les téléchargements contenant des visages humains réalistes sont actuellement bloqués. Il s'agit d'une contrainte du flux de travail, et non d'un cas particulier mineur.
Le meilleur modèle mental pour Seedance 2.0
La façon la plus simple de concevoir Seedance 2.0 est la suivante :
- l'image définit le sujet du plan
- la vidéo définit comment le plan bouge
- l'audio définit le ressenti temporel du plan
- le texte définit comment les trois doivent coopérer
Si vous gardez cette hiérarchie claire, Seedance 2.0 devient beaucoup plus facile à contrôler. Si vous brouillez ces rôles, le modèle doit deviner, et c'est en devinant que la dérive commence.
Le mot de la fin
Si vous cherchez à utiliser Seedance 2.0 avec des références d’image, de vidéo et d’audio, la leçon principale n’est pas de trouver une consigne brillante. C’est de garder une méthode de travail rigoureuse.
Choisissez le bon mode d’entrée. Ne gardez que les ressources utiles. Donnez un rôle précis à chacune. Puis rédigez une consigne qui relie clairement ces rôles.
C’est exactement le type de fonctionnement pour lequel Seedance 2.0 a été conçu. Si votre flux dépend déjà d’images de référence, de clips de mouvement, de synchronisation audio et de montages itératifs, c’est l’une des options les plus claires pour garder la main sur la génération vidéo IA. Pour le tester directement, commencez par Seedance 2.0 sur WMHub, puis comparez-le au répertoire de modèles vidéo seulement une fois que vous savez quel type de contrôle il vous faut réellement.
@asset pour indiquer au modèle ce qui compteUn flux de travail pratique pour Seedance 2.01. Verrouillez le sujet en premier2. N'ajoutez la vidéo que lorsque le mouvement est la partie difficile3. Ajoutez l'audio lorsque le rythme est important pour le plan4. Rédigez la consigne comme une couche de coordination5. Itérez avec l'extension ou l'insertion lorsque le résultat est procheCe pour quoi Seedance 2.0 est particulièrement douéLes erreurs courantes qui brisent le flux de travailTélécharger trop de ressourcesUtiliser des références contradictoiresRedécrire ce que les fichiers montrent déjàUtiliser la mauvaise voie d'entréeIgnorer les restrictions actuellesLe meilleur modèle mental pour Seedance 2.0Le mot de la fin