0
| 本文作者: nebula | 2026-04-16 15:18 |
4月16日,阿里巴巴發布可實時構建和交互的世界模型產品HappyOyster(快樂生蠔)。該模型基于原生多模態架構而建,支持多模態理解與音視頻聯合生成。目前產品可實現漫游(Wander)和導演(Direct)兩大核心能力,用戶可以實時構建可互動、可演繹、可探索的 AI 數字世界。同時,用戶生成的數字世界,不僅能被完整保存,還能開放給其他用戶進行二次創作。據悉,該產品由阿里ATH創新事業部團隊研發,與此前爆火的HappyHorse同屬一個團隊。
相比大語言模型相對成熟的模型架構和技術范式,世界模型仍屬于前沿探索領域。阿里的HappyOyster與谷歌的Genie3同屬于世界模擬器流派。區別于傳統文生視頻模型輸入提示詞、等待渲染、獲得成片的被動流程,這一流派采用長時間跨度上的世界演化建模方式。通過學習海量長視頻數據,以及文本、動作指令、圖像參考等多樣控制信號,模型能夠主動理解空間、物理與因果規律,預測情節和畫面的演變,從而把“被動生成內容”轉變為“主動模擬世界演化”,為構建可交互的通用世界模擬器提供了關鍵技術路徑。
相比谷歌,此次阿里發布的HappyOyster采用了時間跨度更長的世界演化建模方式,使得模型能夠保持高保真、長時序的動態場景生成。同時在建模初始就設計了多樣的控制信號,使模型能夠在統一的時序框架下同時實現生成質量、長時序與實時可控性的協同優化。在產品能力上,HappyOyster呈現出差異化優勢。不僅能支持Wander漫游探索,還獨家提供實時導演功能,用戶可通過自然語言指令隨時介入世界演化、調度角色事件,實現從被動探索到主動創作的跨越。在視覺表現上,HappyOyster漫游模式的畫面質量更高,風格泛化能力更強,動態性更好。

漫游模式暢游世界名畫
漫游模式控制人物運動
通過漫游和導演的雙模式,HappyOyster能夠為用戶帶來沉浸式的世界交互體驗。在漫游模式中,用戶僅需一句話或一張圖,即可生成具備物理一致性的完整空間,物體位置穩定、場景持久存在,視角與光照也能跟隨第一人稱視角持續移動;此外,用戶能自由切換方向與鏡頭運動,突破初始畫框的邊界,體驗無限延展的探索樂趣。目前Happy Oyster支持長達1分鐘的連續實時位移與鏡頭控制,并支持多樣化的風格切換;在導演模式下,用戶能夠在視頻的任意節點,通過文字、語音或圖像等多模態輸入,隨時實現鏡頭切換、劇情改寫、角色調度,在充分的交互中生成一個光照、重力、角色動作與場景因果持續演化的世界,并能選擇題材風格。目前,HappyOyster的導演模式支持連續生成 3 分鐘以上的480p或720p實時畫面。當前漫游與導演兩大模式尚未完全打通,但未來用戶有望在漫游過程中直接與世界深度互動、實時改寫場景規則,真正實現邊探索、邊創造的無縫融合體驗。

導演模式可在任意節點改變劇情走向
世界模型的發展仍處于早期階段,但在實際應用中,HappyOyster已在改變傳統的內容創作模式和交互體驗。例如,在游戲領域,開發者可快速生成可玩原型,玩家能實時驅動世界演化,無需預設腳本即可實現動態劇情分支與開放世界探索,大幅降低內容生產成本并提升沉浸感;在影視創作中,導演無需等待漫長的渲染周期,只需用自然語言描述創意,系統即可實時生成分鏡畫面,并支持在視頻的任意節點改變鏡頭、角色、和劇情,讓創意驗證時間大大縮小;在文旅與教育領域,用戶不再被動觀看歷史復原視頻,而是能以第一視角走進名畫現場或過往文明,在交互中探索因果、改寫走向,實現從知識傳遞到沉浸體驗的躍遷。在未來,HappyOyster還能應用于線下智能空間或娛樂場景,例如與穿戴設備等智能硬件結合,根據人的位置、動作與語言動態,實時生成沉浸式內容,讓數字世界與現實共振。
*附HappyOyster官網鏈接:
https://www.happyoyster.cn/
雷峰網(公眾號:雷峰網)
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。