World Labs Spark 2.0を解説:AI世界モデルの配信レイヤー
World Labs Spark 2.0を徹底解説。LoDストリーミング、.RADファイル、GPUページングにより、AI世界モデルをウェブ上で閲覧、操作、共有可能にする仕組みを紹介します。
3Dワールドの生成は、もはや難しい課題ではありません。真の課題は、それを実際のユーザーに届けることです。
だからこそ、World Labsの「Spark 2.0」が重要な意味を持ちます。これは新たなワールドモデルでも、ゼロから3Dシーンを作り出すシステムでもありません。大規模な3Dガウシアンスプラッティング(3D Gaussian Splatting)のワールドを、オープンウェブ上で実用的に機能させるためのレイヤーなのです。通常ならシーン全体のデータ量に耐えきれずフリーズしてしまうような、スマートフォンやVRデバイス上での動作も可能にします。
別の言い方をすれば、Spark 2.0はAIワールドモデルのための「配信(デリバリー)レイヤー」です。ワールド構築システムはシーンの生成や構成を行いますが、Spark 2.0は、そのシーンを高性能なワークステーションがなくても、リンク一つで誰でも開き、探索し、共有できる形へと変換する役割を担います。

Web上でストリーミング配信される3DGSワールドを示す、World Labs Spark 2.0の公式メインビジュアル。
Spark 2.0の真の役割とは
Spark 2.0は、Web向けに開発されたオープンソースの3Dガウシアンスプラッティング・レンダラーです。World LabsはこれをTHREE.jsとWebGL2をベースに設計しており、デスクトップ、モバイル、XRデバイスの一般的なブラウザ上で動作させることができます。
その役割は、理論上はシンプルですが、実践するのは困難です。それは、極めて大規模な3DGSシーンを取り込み、管理されたデモ環境以外でも実用に耐えうるほどスムーズにレンダリングすることです。
Spark 2.0は誤解されやすいため、この違いを理解しておくことが重要です。これはMarbleや生成AIワールドモデルとは異なります。Spark 2.0はワールドそのものを「生成」するわけではありません。すでに存在するワールドをパッケージ化し、ストリーミングし、レンダリングするのです。
だからこそ、今回のリリースはグラフィックスエンジニアのコミュニティにとどまらない重要性を持っています。AIシステムが今後さらに大規模で探索可能な空間を生成していくのであれば、誰かが配信における「ラストワンマイル」の課題を解決しなければならないからです。
AIワールドモデルにとってこれが重要な理由
Spark 2.0のリリースから得られる最も重要なポイントは、単にWebレンダリングが向上したということだけではありません。ワールドモデルのスタック全体が、より完成に近づき始めているということです。
実用的な観点から見ると、現在のスタックは次のようになります。
- 3Dワールドを生成またはキャプチャする。
- そのワールドを拡張または合成して、より大規模なものにする。
- 使用中のデバイスに最適なディテールレベルでストリーミングおよびレンダリングする。
- その結果をブラウザネイティブな体験として共有する。
多くのワールドモデルの構想が依然として壁にぶつかるのは、この4番目のステップです。生成されたワールドは、研究用の動画では見栄えが良いかもしれませんが、大幅な品質低下やセットアップの手間なしに一般的なデバイスに配信できないのであれば、それは実際のプロダクトというよりも研究室の成果物にとどまってしまいます。
Spark 2.0は、このギャップに直接切り込んでいます。「ワールドをどのように届けるか?」という問いに対する答えを、はるかに明確なものにしているのです。
Spark 2.0を機能させる3つの技術的アプローチ
World Labsの技術解説や関連するSparkのドキュメントを見ると、Spark 2.0の背後には3つの主要なアイデアがあることがわかります。それら一つ一つは魔法のようなものではありません。斬新なのは、それらが組み合わされ、非常に大規模な3DGSシーン向けの「ブラウザファースト」な配信システムとして構築されている点です。
1. デバイスの処理バジェット内に収める連続的なLoD
Spark 2.0は、シーン内のすべてのスプラットを一度にレンダリングしようとはしません。連続的なLoD(Level of Detail:詳細度)ツリーを構築し、現在の視点に最も適したスプラットのサブセットを選択します。
高品質な3DGSの世界では、スプラット数が数千万に達することも珍しくありません。一方で、一般的なコンシューマー向けデバイスがインタラクティブなフレームレートで処理できるのは、そのごく一部にすぎません。Sparkは、アクティブなスプラット数をデバイスが処理できる範囲(バジェット)内に抑え、最も重要な部分のディテールを最適化することで、このギャップを埋めています。
クリエイターにとって、この重要なアイデアはシンプルです。シーン自体は巨大であっても、デバイスは「現在必要なディテール」の分だけ処理を行えばよいということです。

巨大な3DGSシーンをデバイスの処理予算内に収めるための、連続LoDスプラットツリーを示すWorld Labsの図。
2. 3DGSをストリーミング可能なメディアに変える「.RAD」フォーマット
標準的な3DGSファイルは、ブラウザでの配信には不向きです。非圧縮フォーマットはサイズが大きすぎますし、圧縮フォーマットはシーンが利用可能になる前にファイル全体を読み込む必要があることが多いためです。
Spark 2.0は、この問題を解決するために.RADフォーマットを導入しました。ワールドを「一度にすべて読み込まなければならない巨大なオブジェクト」として扱うのではなく、シーンをストリーミング可能なチャンク(塊)に分割します。まず粗いバージョンが表示され、その後、ユーザーが移動するにつれて詳細なデータが読み込まれます。
これが、今回のリリースが単なるレンダラーのアップグレード以上に重要だと感じられる理由の一つです。3DGSを「ダウンロードする重いファイル」から、「プログレッシブに配信できる空間メディア」へと再定義しているのです。
3. 「小さなデバイスで巨大な世界」を実現するGPUページング
ストリーミングを活用しても、モバイルGPUやブラウザのメモリ制限という厳しい壁は依然として存在します。Spark 2.0は、GPU上のページテーブル方式のメモリシステムによってこの問題に対処しています。
ワールド全体をメモリに常駐させるのではなく、固定サイズのプールを保持し、ユーザーが実際に探索している場所に基づいてチャンクをスワップ(入れ替え)します。これにより無限のパフォーマンスが得られるわけではありませんが、デバイスの本来の限界を超えた広がりを感じさせるブラウザベースのワールドを実現するための、はるかに現実的なアプローチとなります。
ここで「配信レイヤー」という考え方が最も活きてきます。Spark 2.0は、ハードウェアの制限がなくなることを約束しているわけではありません。ワールドの配信が、その制限内で機能するほど適応性の高いものになることを約束しているのです。
ビルダーにとってSpark 2.0が変えるもの
開発者にとって、実用的な変化は視覚的な品質だけではありません。それは配信(ディストリビューション)です。
このようなツールが登場する前は、大規模な3DGSシーンは専門的なアセットとして扱われることがほとんどでした。高性能なハードウェアで検証したり、動画として公開したり、制限のあるビューアで表示したりすることはできましたが、それを幅広いWeb体験へと昇華させることは非常に困難でした。
Spark 2.0により、さらに野心的なワークフローが実現可能になります。
- 重いクライアントアプリではなく、URLから開くWebネイティブな3Dワールド
- 同じ空間内に複数のスプラットオブジェクトを配置して作成された合成シーン
- ブラウザベースの空間ストーリーテリング、バーチャルツアー、インタラクティブアート
- 内部チームだけでなく、実際のユーザーと共有できるワールドモデルのデモ
これはビルダーの柔軟性にとっても重要です。Sparkのプログラマブルなシェーダーパイプラインと関連するXR向けツールは、このプロジェクトが単なる受動的な視聴にとどまらないことを意味しています。スプラットワールドの再照明(リライティング)、スタイライズ、アニメーション化が可能で、よりインタラクティブな形式で探索できるWeb体験の方向性を示しています。
これが、今回のリリースがWorld Labsのより大きなストーリーに合致する理由でもあります。Marbleはパイプラインの「生成と合成」の側面を主に担い、Spark 2.0は「配信と探索」の側面を主に担っています。
Spark 2.0が解決しないこと
誇大広告的に言えば、Spark 2.0によってワールドの配信が全く手間なく行えるようになった、となるかもしれません。しかし、それは正しい解釈ではありません。
依然として現実的な制約が存在します。
- 低速なネットワークでは、依然として最初は粗い状態で読み込まれ、徐々に鮮明になっていく過程が目に見える
- チームには、
.RADへの変換を含むアセット準備パイプラインが引き続き必要である - 体験は依然としてWebGL2時代のブラウザサポートに依存している
- Spark 2.0はレンダリングと配信を解決するものであり、それ自体がワールド生成の品質を向上させるわけではない
この最後のポイントは特に重要です。Spark 2.0は配信におけるブレイクスルーであり、強力なワールドモデル、優れたキャプチャデータ、または綿密に設計されたシーンパイプラインの代わりになるものではありません。
WMHub読者はどう捉えるべきか
AI 3Dやワールドモデルのワークフローに携わっている場合、Spark 2.0は特定の理由から注目に値します。それは、スタックの下流部分をよりプロダクトの形に近づけるからです。
AIに関する幅広い議論では、生成品質に焦点が当たりすぎ、配信のメカニズムが軽視されがちです。しかし、実際のプロダクトにおいては、配信も機能の一部です。制御されたショーケースでしか機能しないワールドは、一般ユーザーが開いて、ナビゲートし、共有できるワールドよりも価値が低くなります。
それはWMHubでも用いる視点です。作成のステップと配信のステップは異なる役割を持っています。アセット生成、シーン構築、またはText-to-3DやImage-to-3Dのワークフローを探索している場合、次に参照すべき適切な場所はAI 3Dワークフローハブです。ワールドモデルというカテゴリーがどこへ向かっているのかを評価している場合、Spark 2.0は、ブラウザネイティブな配信がこのカテゴリーの競争優位性の一部になりつつあることを示す強力なシグナルとなります。
結論
World LabsのSpark 2.0が重要である理由は、単なるレンダリングの課題ではなく、プロダクトとしての課題に対する答えを出しているからです。
その課題とは、「AIはワールドを生成できるか?」ではありません。「そのワールドを、インタラクティブで高忠実度、かつ共有可能だと感じられる形で、一般的なデバイスに配信できるか?」ということです。
Spark 2.0は、その問題に対する最近の最も明確な答えの1つです。ワールドモデルを置き換えるものではありません。ワールドモデルを世に送り出しやすくするものです。
WMHubでAI 3Dワークフローを探索する