Google DeepMind 發表通用「Genie 3」世界模型(World Model),即時生成前所未有的動態 3D 環境,供使用者與 AI 代理互動。
世界模型是一種 AI 系統,可模擬環境,用於教育、娛樂或訓練機器人、AI 代理等場景,是邁向 AGI(Artificial General Intelligence,通用人工智慧)的關鍵基石。透過世界模型,使用者只需要給出提示文字,模型便會生成一個能夠自由探索的空間,不同於以 3D 素材手工打造,整個世界由 AI 生成。
Google DeepMind 為此投注大量資源,去年 12 月即展示可根據影像建立互動世界的「Genie 2」,並召集一支由前 OpenAI Sora 影像生成團隊共同負責人帶隊的世界模型團隊。但 Genie 2 仍受侷限,比方說 Genie 2 生成的世界只能玩上大約 10~20 秒。現在 Genie 3 看來是一大進步。