2026/04/15

World Labs Spark 2.0 : Diffuser les modèles de monde IA

World Labs Spark 2.0 : le streaming LoD, les fichiers .RAD et la pagination GPU rendent les modèles de monde IA interactifs et partageables sur le web.

Générer des mondes en 3D n'est plus la partie la plus difficile. Les diffuser auprès des utilisateurs réels l'est.

C'est pourquoi Spark 2.0 de World Labs est si important. Il ne s'agit pas d'un énième modèle de monde, ni du système qui invente une scène 3D de toutes pièces. C'est la couche qui rend les vastes mondes en 3D Gaussian Splatting exploitables sur le web ouvert, y compris sur les téléphones et les casques de réalité virtuelle qui, en temps normal, ploieraient sous le poids d'une scène complète.

Autrement dit : Spark 2.0 est la couche de diffusion des modèles de monde par IA. Les systèmes de création de mondes peuvent générer ou composer une scène. Spark 2.0 permet de transformer cette scène en un espace que l'on peut ouvrir, explorer et partager via un simple lien, sans avoir besoin d'une station de travail.

Visuel principal de World Labs Spark 2.0 montrant un monde 3DGS diffusable sur le web

Visuel officiel de World Labs Spark 2.0 montrant un monde 3DGS diffusable en streaming sur le web.

Ce qu'est réellement Spark 2.0

Spark 2.0 est un moteur de rendu open source de 3D Gaussian Splatting conçu pour le web. World Labs l'a développé en s'appuyant sur THREE.js et WebGL2 afin qu'il puisse fonctionner dans des navigateurs classiques, que ce soit sur ordinateur, mobile ou appareils XR.

Sa mission est simple en théorie, mais complexe en pratique : prendre des scènes 3DGS extrêmement vastes et en faire un rendu suffisamment fluide pour qu'elles soient utilisables en dehors d'un environnement de démonstration contrôlé.

Cette distinction est cruciale, car il est facile de se méprendre sur la nature de Spark 2.0. Ce n'est pas la même chose que Marble ou qu'un modèle de monde génératif. Spark 2.0 ne crée pas le monde. Il le conditionne, le diffuse et en fait le rendu une fois qu'il a été créé.

C'est pourquoi ce lancement est important, bien au-delà des cercles de l'ingénierie graphique. Si les systèmes d'IA sont amenés à générer des espaces toujours plus vastes et explorables, il faut bien que quelqu'un résolve le problème du « dernier kilomètre » de la diffusion.

Pourquoi cela compte pour les modèles de monde de l'IA

Ce qu'il faut surtout retenir du lancement de Spark 2.0, ce n'est pas seulement l'amélioration du rendu web. C'est que la pile technologique complète des modèles de monde commence à être plus aboutie.

Concrètement, cette pile ressemble désormais plutôt à ceci :

  1. Générer ou capturer un monde en 3D.
  2. Étendre ou composer ce monde pour en faire quelque chose de plus vaste.
  3. Diffuser et rendre le bon niveau de détail pour l'appareil utilisé.
  4. Partager le résultat sous forme d'expérience native dans le navigateur.

C'est à cette quatrième étape que de nombreux discours sur les modèles de monde s'effondrent encore. Un monde généré peut paraître impressionnant dans une vidéo de recherche, mais s'il ne peut pas être diffusé sur un appareil classique sans une perte de qualité massive ou une configuration complexe, il tient davantage de l'artefact de laboratoire que du produit fini.

Spark 2.0 s'attaque directement à cette lacune. Il rend la réponse à la question « comment déployer ce monde ? » beaucoup plus claire.

Les trois mécanismes techniques qui font fonctionner Spark 2.0

Le rapport technique de World Labs et la documentation associée de Spark mettent en évidence trois idées principales derrière Spark 2.0. Aucune d'entre elles n'est magique en soi. La nouveauté réside dans leur combinaison au sein d'un système de diffusion pensé pour le navigateur, destiné aux très grandes scènes 3DGS.

1. Le niveau de détail continu (LoD) respecte les limites de l'appareil

Spark 2.0 n'essaie pas de rendre chaque splat d'une scène en même temps. Il construit un arbre de niveaux de détails continus et sélectionne le sous-ensemble de splats qui correspond le mieux au point de vue actuel.

C'est important car les mondes 3DGS de haute qualité peuvent facilement atteindre des dizaines de millions de splats, alors qu'un appareil grand public ne peut en gérer qu'une petite fraction avec une fréquence d'images fluide. Spark gère ce décalage en maintenant le nombre de splats actifs dans une limite adaptée à l'appareil et en affinant les détails là où c'est le plus nécessaire.

Pour les créateurs, l'idée clé est simple : la scène peut être immense, mais l'appareil ne calcule que les détails dont il a besoin sur le moment.

Schéma World Labs de l'arbre de splats LoD continu dans Spark 2.0

Schéma World Labs de l'arbre de splats LoD continu utilisé pour maintenir d'immenses scènes 3DGS dans le budget des appareils.

2. Le format .RAD transforme le 3DGS en un média diffusable en continu

Les fichiers 3DGS standards sont inadaptés à une diffusion sur navigateur. Les formats non compressés sont trop volumineux, tandis que les formats compressés nécessitent souvent le téléchargement complet du fichier avant que la scène ne devienne utilisable.

Spark 2.0 introduit le format .RAD pour résoudre ce problème. Au lieu de traiter le monde comme un objet géant devant être chargé d'un seul coup, il découpe la scène en blocs diffusables en continu. Une version simplifiée apparaît d'abord, puis davantage de détails arrivent à mesure que l'utilisateur se déplace.

C'est l'une des raisons pour lesquelles cette version semble importante au-delà d'une simple mise à jour du moteur de rendu. Elle redéfinit le 3DGS, passant d'un fichier lourd à télécharger à un média spatial pouvant être diffusé progressivement.

3. La pagination GPU rend les « mondes immenses sur de petits appareils » possibles

Même avec le streaming, les GPU mobiles et les limites de mémoire des navigateurs imposent toujours un plafond strict. Spark 2.0 résout ce problème avec un système de mémoire de type table de pagination sur le GPU.

Au lieu de garder un monde entier en mémoire, il conserve un pool fixe et charge ou décharge des blocs en fonction de ce que l'utilisateur explore réellement. Le résultat n'offre pas des performances infinies, mais il constitue une voie beaucoup plus réaliste vers des mondes sur navigateur qui semblent plus vastes que ce que l'appareil devrait normalement tolérer.

C'est là que le concept de « couche de diffusion » prend tout son sens. Spark 2.0 ne promet pas la disparition des limites matérielles. Il promet que la diffusion du monde devient suffisamment adaptative pour fonctionner dans ces limites.

Ce que Spark 2.0 change pour les concepteurs

Pour les développeurs, le changement pratique ne concerne pas seulement la qualité visuelle. Il s'agit de la distribution.

Avant l'apparition de tels outils, une grande scène 3DGS se comportait souvent comme un actif spécialisé. Vous pouviez l'inspecter sur du matériel puissant, en publier une vidéo ou la montrer dans une visionneuse restreinte, mais la transformer en une expérience web grand public était beaucoup plus difficile.

Spark 2.0 rend viables plusieurs flux de travail plus ambitieux :

  • des mondes 3D natifs pour le web qui s'ouvrent à partir d'une URL au lieu d'un client lourd
  • des scènes composites créées à partir de multiples objets splat dans le même espace
  • de la narration spatiale sur navigateur, des visites virtuelles et de l'art interactif
  • des démos de modèles de monde partageables avec de vrais utilisateurs plutôt qu'uniquement avec des équipes internes

C'est également important pour la flexibilité des concepteurs. Le pipeline de shaders programmables de Spark et les outils orientés XR associés signifient que le projet ne se limite pas à un visionnage passif. Il ouvre la voie à des expériences web où les mondes splat peuvent être rééclairés, stylisés, animés et explorés dans des formats plus interactifs.

C'est aussi la raison pour laquelle cette version s'inscrit dans la vision plus large de World Labs. Marble gère davantage l'aspect « génération et composition » du pipeline. Spark 2.0 prend en charge l'aspect « distribution et exploration ».

Ce que Spark 2.0 ne résout pas

L'approche sensationnaliste consisterait à dire que Spark 2.0 rend la distribution de mondes sans effort. Ce n'est pas la bonne lecture.

Il existe encore de réelles contraintes :

  • les réseaux lents entraîneront toujours un chargement initial grossier suivi d'un affinement visible
  • les équipes ont toujours besoin d'un pipeline de préparation des actifs, incluant la conversion en .RAD
  • l'expérience dépend toujours de la prise en charge des navigateurs de l'ère WebGL2
  • Spark 2.0 résout le rendu et la distribution, mais pas la qualité de génération du monde en elle-même

Ce dernier point est particulièrement important. Spark 2.0 est une percée en matière de distribution, et non un substitut à un modèle de monde robuste, à de bonnes données de capture ou à un pipeline de scène bien pensé.

Comment les lecteurs de WMHub devraient l'envisager

Si vous travaillez sur des flux de travail d'IA 3D ou de modèles de monde, Spark 2.0 mérite votre attention pour une raison précise : il donne à la partie aval de la pile technologique une dimension plus orientée produit.

Le débat plus large sur l'IA se concentre souvent trop sur la qualité de génération et pas assez sur les mécanismes de distribution. Mais dans les produits réels, la distribution fait partie intégrante de la capacité. Un monde qui ne fonctionne que dans une vitrine contrôlée a moins de valeur qu'un monde qui peut être ouvert, exploré et partagé par des utilisateurs ordinaires.

C'est également la grille de lecture que nous adopterions sur WMHub. L'étape de création et l'étape de distribution sont des tâches différentes. Si vous explorez la génération d'actifs, la construction de scènes ou les flux de travail texte-vers-3D et image-vers-3D, la prochaine étape logique est le hub des flux de travail d'IA 3D. Si vous évaluez la direction que prend la catégorie des modèles de monde, Spark 2.0 est un signal fort indiquant que la distribution native sur navigateur devient un atout concurrentiel de cette catégorie.

En résumé

Spark 2.0 de World Labs est important car il répond à une question de produit, et pas seulement à une question de rendu.

La question n'est pas « l'IA peut-elle générer un monde ? ». La question est « ce monde peut-il être distribué sur des appareils standards tout en restant interactif, de haute fidélité et partageable ? »

Spark 2.0 est l'une des réponses récentes les plus claires à ce problème. Il ne remplace pas les modèles de monde. Il facilite leur déploiement.

Explorer les flux de travail d'IA 3D sur WMHub

Sources consultées