NVIDIA Cosmos 世界基盤モデルによる、合成データのスケールアップとフィジカル AI リーズニングの実現
…入力トークン数が最大 256K まで拡張され、長文コンテキストのサポートが強化されました。 物理法則に基づいたフォトリアルな動画を実現する Cosmos Transfer Cosmos Transfer は、構造的な入力から再現性の高い世界のシーンを生成し、正確な空間的配置とシーン構成を保証します。 Cosmos Transfer は、ControlNet アーキテクチャを採用することで、事前学習済みの知識を保持し、構造化された一貫性のある出力を実現します。 時空間コントロールマップを活用して、合成データと実世界の表現を動的に一致させることで、シーンの構成、オブジェクトの配置、およびモーション ダイナミクスをきめ細かく制御することが可能になります。 入力 : 構造化されたビジュアル データまたはジオメトリ データ: セグメント化マップ、深度マップ、エッジマップ…