(自動翻訳)
2025/01/08
NVIDIA、物理 AI 開発のゲームチェンジャーである Cosmos を発表
NVIDIA は CES 2025 で、自律走行車とロボティクスの物理 AI 開発に革命をもたらすジェネレーティブ ワールド ファウンデーション モデル プラットフォームである Cosmos を発表しました。
Cosmosは、フォトリアリスティックな物理ベースの合成データを生成し、コストのかかる実世界のデータ収集なしでAIトレーニングを可能にします。
このプラットフォームは、AIアクセラレーションパイプラインを搭載し、14日間で2,000万時間のビデオを処理し、8倍の圧縮と12倍の高速処理を提供するビジュアルトークナイザーを備えています。
Uber、Waabi、Agility などのアーリーアダプターは、自律型モビリティ、データ キュレーション、ロボット トレーニングに Cosmos を活用しています。
CES 2025 で、NVIDIA は、自律走行車 (AV) やロボットなどの物理 AI システムの開発に革命を起こすように設計された一連のジェネレーティブ ワールド ファウンデーション モデル (WFM) である画期的な Cosmos プラットフォームを発表しました。NVIDIA の創業者兼 CEO であるジェンスン・フアン (Jensen Huang) が基調講演で行ったこの発表は、AI ドリブン シミュレーションと合成データ生成における大きな飛躍を示しています。Uber、Waabi、Agilityなどの大手企業がすでに参加しているCosmosは、物理的なAI開発を民主化し、あらゆる規模の開発者が利用できるようにする準備ができています。
Cosmosは何をするのか、なぜそれが重要なのか
Cosmos WFMは、フォトリアリスティックな物理ベースの合成データを生成するために構築されているため、開発者はコストのかかる実世界のデータ収集を必要とせずにAIモデルをトレーニングおよび評価できます。これらのモデルは、倉庫、工場、運転シナリオなどの複雑な環境を、驚くべき精度でシミュレートできます。テキスト、画像、ビデオなどの入力をセンサーやモーションデータと組み合わせることで、CosmosはロボットやAVが物理世界をナビゲートする方法を学習するのに役立つリアルなシミュレーションを作成できます。
「ロボット工学のためのChatGPTの瞬間が来ています」とHuang氏は述べています。「大規模な言語モデルと同様に、World Foundation ModelはロボットやAVの開発を進めるための基本ですが、すべての開発者が自分自身をトレーニングするための専門知識とリソースを持っているわけではありません。私たちは、フィジカルAIを民主化し、一般的なロボティクスをすべての開発者が利用できるようにするためにCosmosを設立しました。」
Cosmos は、合成データを生成するだけでなく、効率性も重視しています。このプラットフォームは、NVIDIA の AI と CUDA で高速化されたデータ処理パイプラインを備えており、NVIDIA Blackwell プラットフォームを使用してわずか 14 日間で 2,000 万時間のビデオを処理、キュレーション、ラベル付けできます。これは、同じタスクを達成するのに 3 年以上かかる従来の CPU ベースのパイプラインに比べて劇的な改善です。
さらに、Cosmosには、現在の主要なトークナイザーよりも8倍の圧縮と12倍の高速処理を実現する最先端のビジュアルトークナイザーが含まれています。これらのツールと、モデルのトレーニングとカスタマイズのための NVIDIA NeMo フレームワークを組み合わせることで、Cosmos は物理的な AI システムの構築と改良を目指す開発者にとって強力なリソースとなっています。
実際のアプリケーションとアーリーアダプター
Cosmos の潜在的なアプリケーションは膨大です。たとえば、開発者はこのプラットフォームを使用して、雪道の状況や倉庫の混雑など、ビデオ データ内の特定のトレーニング シナリオを検索できます。また、強化学習用の合成データを生成したり、シミュレートされた環境でAIモデルをテストしたりして、結果を予測し、意思決定を改善することもできます。
ロボティクスと自動運転の大手企業は、すでにCosmosを活用しています。ヒューマノイドロボットの会社であるAgilityは、このプラットフォームを使用して、モデルのトレーニング用のフォトリアリスティックなシナリオを生成しています。AV向けジェネレーティブAIのパイオニアであるWaabiは、データキュレーションとシミュレーションのためにCosmosを評価しています。一方、Uber は NVIDIA と提携して、自律型モビリティ ソリューションの開発を加速しています。
「ジェネレーティブAIは、豊富なデータと非常に強力なコンピューティングの両方を必要とするモビリティの未来を牽引します」と、UberのCEOであるDara Khosrowshahi氏は述べています。「NVIDIA と協力することで、業界向けの安全でスケーラブルな自動運転ソリューションのタイムラインを加速させることができると確信しています。」
NVIDIA は、プライバシー、安全性、透明性を優先し、信頼できる AI の原則に沿って Cosmos を開発するというコミットメントを強調しています。このプラットフォームには、有害なコンテンツを軽減するためのガードレールが含まれており、AIが生成したビデオには目に見えない透かしが付いています。これらの対策は、ユーザーの信頼を維持しながらイノベーションを促進するように設計されています。
NVIDIA の Cosmos プラットフォームは、フィジカル AI 開発における記念碑的な一歩を表しています。Cosmosは、合成データを生成し、実世界の環境をシミュレートするための強力なツールを開発者に提供することで、ロボティクスと自律走行車の進歩を加速させる準備ができています。Huang氏が述べたように、Cosmosは、大規模な言語モデルが自然言語処理で行ったことを物理AIで実現することを目指しています。オープンモデルライセンスと堅牢な機能を備えたCosmosは、単なるツールではなく、AIイノベーションの次の波の触媒です。