Genie 3 引發遊戲股暴跌,但遊戲的真正靈魂 AI 永遠得不到

愛範兒 於 4 小時前發表 收藏文章
上週,Google DeepMind 發佈了第三代視覺語言模型 Genie 3。緊接着,全球遊戲公司股價應聲下跌。

引擎巨頭 Unity 暴跌一度超過 24%,頂級製作商 Take-Two、任天堂、CD Projekt Red 等無一倖免。下跌的趨勢,也持續到本週。


資本市場劇烈的反應背後,邏輯簡單又粗暴:

引用既然模型能快速生成以假亂真且可交互的 3D 世界,任何人都能做出 AAA 級別的遊戲。那些投入上億美元、耗時十年打磨一款遊戲/開發工具的公司,豈不都完蛋了?

乍一聽上去有點道理,但仔細一想,似乎不太對。

在我看來這是膝跳反應式的恐慌,暴露了一個認知誤區:把視覺細節的生成,等同於完整世界的構建。
不是所有會畫圖的人都能成為建築師。遊戲開發的世界構建,也是這個道理。

《GTA》《荒野大鏢客》《魔獸世界》《塞爾達傳説》……問任何一個曾深度沉浸於開放遊戲世界的玩家,他們大概都有類似的感受:

真正讓遊戲世界「活」起來的,從來不是美輪美奐的場景,或者簡單的交互性,而是那種見微知著、難以言説的「生命感」。


Demo 只是 demo

Genie 3 的演示視頻確實震撼。

給它一段文字、參考圖、手繪圖之類的,它的確能在令人難以置信的時間裏,實時生成類似《GTA》《塞爾達傳説》風格的場景。玩家可以在其中探索一段時間,扮演「遊戲角色」在以假亂真的世界裏遊蕩。


對於缺乏技術細節瞭解的旁觀者而言,Genie 3 看起來確實像是「遊戲開發的終結者」。

但 demo 只是 demo,甚至離遊戲行業能夠接受的「可遊玩」或者「技術 demo」相去甚遠。

Genie 3 本質上是一個自迴歸式的「幀生成」(frame generation) 模型。而「幀生成」也不是什麼新鮮玩意,在遊戲和顯卡技術行業早已存在。它的工作原理,用最簡單的話來説,就是看着前幾幀畫面,猜測下一幀的像素排列,生成新的幀,循環往復。

關鍵在於,Genie 3 的幀生成是靠「猜」的,而非硬編程,沒有可靠的邏輯計算。

在一個真實的遊戲中,當玩家扔出一個鐵球,遊戲引擎利用經典物理公式來計算它的下落速度。當玩家打開手電筒然後在房間裏亂跑,遊戲引擎模擬「光線追蹤」和被照物體的材質,來實時渲染光照的效果。

但 Genie 3 沒有這些能力,它只是在觀察了數以千萬記的視頻片段之後,形成一個大概的「感受」,猜測物體在掉下去的時候可能會加速,光會在物體的身後打出一個影子。

Genie 3 「猜」出來的這些效果,並不真實。而在遊戲世界裏,不真實會嚴重破壞沉浸感。

在各種 demo 中,齣戲的情況時有發生。

Genie 3 有個致命短板:缺乏長期一致性。它的記憶窗口(在目前的 demo 版本)只有最多 1 分鐘。一旦超過這個時間,Genie 3 可能就會開始遺忘初始場景,世界結構隨之崩潰。

與之相對,傳統遊戲能夠保存確定性的狀態。世界的構成,每一個素材都刻寫在遊戲文件裏,遊玩上百小時後的每一草一木依舊如故(除非碰到像《荒野大鏢客2》這樣的,能保留一具 NPC 的屍骨或樹木上的彈痕直到天荒地老……)

你能接受在一個遊戲裏,同一個地方每次去都不太一樣,甚至剛一回頭就變了樣嗎?

RDR2 遊戲中遺體隨時間腐爛的過程

不僅缺乏記憶,模型猜想出來的世界,也不具備複雜邏輯。
在 GTA 裏攻擊一個 NPC,基於該 NPC 的平民、幫派成員、警察等不同身份,可能會產生不同的後果。但這種複雜的邏輯鏈條需要明確的框架——需要硬編程。

但 Genie 3 只能根據連續幀來做出反饋。雖然模型能力提升能夠強化邏輯感,但沒有硬編程,反饋註定只是概率的。換言之,在模型生成的世界裏沒有因果,只有模糊的猜測。

需要明確的是,相比前代以及其他視覺語言模型/世界模型,Genie 3 的一致性、穩定性已經強出不少。但齣戲的情況仍然有相當大的概率出現,這在遊戲裏不可接受。

缺乏確定性的世界,就像沒有筋骨的皮肉,看起來能動,但立不起來。

Unity CEO Matt Bromberg 指出:世界模型的輸出是「概率性」的,缺乏傳統遊戲引擎那種結構化的、具有確定性的模擬能力,無法維持連貫的玩家體驗。


精雕細琢才有「生命感」

説到遊戲世界的構建,R星的《荒野大鏢客 2》(RDR2) 是個繞不開的標杆。

這款開放世界大作的研發數據令人咋舌:主創 Dan Houser 透露,RDR2 的開發週期長達 8 年,團隊上千人,劇本堆起來有幾英尺高,動捕的總素材時長達到上千天,超過千名演員參演,研發和營銷預算超過 5 億美元。

這些數字共同造就了 RDR2 令人着迷的細節還原度。為了打造一個真實的 19 世紀末的美國,R星團隊做過大量的調研,從現實中取材並加以演繹,造就了雜亂而具有生氣的城市,以及荒廢且令人窒息的邊境小鎮。絕大多數主要和次要角色的台詞、動作經過充分的雕琢。甚至具體到成千上萬個 NPC ,每一個都有着專屬的、符合身份和所處環境的行為邏輯。

但這些只是表面。R星的恐怖之處,是對那些玩家幾乎不會長期觀察的細節,仍有着瘋魔般的執着。

YouTuber Any Austin 對 RDR2 做了些「刁鑽」的研究,揭示了 RDR2 其實有一套完整、自洽、規模令人驚歎的「電力系統」:

幾乎每一個擁有電燈的建築,房檐下都連着電線,這些電線跨越雪山草地、河流沼澤,最終都匯入同一棟建築 Lanik Electric Co。深山老林裏的房屋,有些裝了電燈但處於關閉或破損狀態,而有人居住的則點燃蠟燭或瓦斯燈照明。


AI 當然能生成一段 60 秒的,神似蠻荒西部的 demo,但它填充不了如此細緻、精確、符實「電力系統」的細節。而正是無數這樣看似不足為奇,甚至在整個遊戲生命週期都不會被人注意到的細節,卻共同構成了遊戲世界的「生命感」。

以上討論,僅僅是「視覺」層面。對於 R星來説,世界構建遠不止於視覺,更重要的往往是「世界觀」。

以 GTA5 為例,它對現實世界的諸多諷刺中有一項令我格外印象深刻,就是對於「媒介生態」的觀察和體現。

遊戲內嵌了海量的電台、電視、互聯網內容。電台廣告裏賣着「印度神油」,主持人爭論着極左或極右的論點。你在任務裏炸死了一個科技公司 CEO,不僅很快能看到新聞報道,甚至在虛構的社交媒體上也能看到網友的吐槽。


再回到 RDR2,整部作品的主線、支線劇情和世界構建,其實是一場對時代精神的結構盛宴。

在新舊世紀的交界點上,蠻荒逐漸被文明所吞噬,但文明又帶來了預料之外的問題。主角所在的範德林德幫代表了近現代美國的基石——無政府主義,靠道義與私刑維持的草莽社會;而平克頓偵探社,以及各處的商界政界大亨則代表了潮水的方向——現代秩序。

不僅如此,在繁華腐敗轟隆向前的時代大背景下,亞瑟遊走在法律之外和人情之中的個體體驗,也更令玩家感受到「好人不長命」的逼仄、窒息感。

一款遊戲的真正特色,在於人物、任務、故事、世界觀。沒有這些細節雕琢的世界,註定是空曠的。

在大模型可以瞬間生成像素的今天,R星的這種「笨功夫」反而凸顯出「手搓」藝術作品的人文主義價值。當然,AI 一定會越變越強,但它恐怕很難模擬出帶有特定的歷史偏見、文學厚度的「靈魂」。而正是這些所謂的靈魂,才是優秀的遊戲真正被玩家所熱愛的理由。

AI 生成不了 IP——最多隻會抄襲

另一個不得不提的本質問題:玩家玩遊戲,到底熱愛的是什麼?

答案很多時候除了遊戲(劇情、機制設定等)本身,還有遊戲的 IP。

IP 的價值,遠超出單一作品本身。

以任天堂為例,馬力歐這個 IP 誕生於 1985 年,近 40 年來,任天堂圍繞這個戴紅帽子的水管工,推出了超過 200 款遊戲,橫跨平台遊戲、賽車、體育、RPG 等幾乎所有品類。

從《超級馬力歐兄弟》到《馬力歐奧德賽》,從《馬力歐賽車》到《馬力歐派對》,每一作都在強化玩家對這個 IP 的認知和情感。
2023 年上映的《超級馬力歐兄弟大電影》全球票房超過 13 億美元,成為有史以來票房最高的遊戲改編電影。這個成績不是因為電影本身有多麼驚世駭俗,而是因為幾代人對馬力歐這個 IP 積累下來的情感。

IP 的構建需要時間,需要一致性,需要創作者的長期投入和精心運營。

好的遊戲 IP,不光是做好遊戲,而是一直不停地做好遊戲。王權沒有永恆。育碧的《刺客信條》,動視的《使命召喚》,這兩個知名 IP 最近多年以來的頹勢,都是這個邏輯的絕佳證明。

R星從 1997 年的《GTA》初代開始,用了近 30 年時間,才把這個系列打磨成今天這個能夠代表開放世界遊戲巔峯的 IP。每一代 GTA 都在延續核心的諷刺精神和犯罪題材,同時不斷創新玩法和敍事手法。

這種持續性讓玩家對 GTA 產生了信任:我知道下一部 GTA 會是什麼樣的基調,但我更期待它會帶來什麼新的驚喜。

這種信任關係,是 AI 無法在真空中生成的。 


更重要的是,IP 運營是一個複雜的系統工程。哪些元素可以變,哪些必須不變?你需要在不同作品之間建立連貫性,讓粉絲感到「這就是那個世界」。在該推出續作的時候推出續作,在該跳出思維慣性和肌肉記憶的時候就該跳出來。IP 需要處理版權、授權、跨媒體改編等一系列商業和法律問題……

小島秀夫的《合金裝備》系列是一個典型案例。從 1987 年到 2015 年,小島用近 30 年時間,通過 5 部正傳和多部衍生作品,構建了一個涵蓋冷戰、核威懾、信息時代、生物科技等多個主題的龐大世界觀。

每一作都在延續前作的角色和故事線索,但對他們做出富有創意的「微調」,同時引入新的哲學思考。這種跨越數十年的敍事連貫性和主題深度,讓《合金裝備》成為遊戲史上最受尊敬的 IP 之一。

科樂美在 2015 年踢走了小島,雖然他們仍然擁有《合金裝備》的版權,但粉絲普遍認為這個 IP 的靈魂已經離開了。即使後來的重製版畫面再精美、玩法再完善,也很難再獲得玩家同樣的情感認同。

這揭示了一個殘酷的真相:IP 的核心價值不在於素材和代碼,而在於創作者的持續投入和玩家的情感積累。 

Genie 3 可以在 1 分鐘內生成一個看起來像《塞爾達傳説》的世界,但它生成不了玩家對林克、塞爾達、海拉魯的情感寄託。它可以模仿《巫師》的中世紀奇幻風格,但它給不了玩家傑洛特那種遊走於灰色地帶的道德選擇所帶來的思考。

所以當投資者恐慌地拋售遊戲公司股票時,他們可能忽略了一個關鍵問題:那些真正有價值的遊戲公司,手裏握着的不只是開發工具和技術,更是經過數十年經營、已經深深紮根在玩家心中的 IP。

AI 能做的是快速生產素材,但 IP 需要的是緩慢積累。這是兩個完全不同的時間尺度。去年是馬力歐 40 週年,今年則是塞爾達傳説 40 週年——這些 IP 的價值,不是 AI 在短期內能夠撼動的。


AI 是畫筆,人才是畫家

這些道理,當然不需要專門寫一篇文章來講。任何對遊戲有審美,對遊玩體驗有追求的人,都應該明白。

所以我相信,片刻的認知偏差和恐慌肯定會過去。優秀的遊戲開發者,會獲得與他們的作品質量、實力和創造力所匹配的市場公允價值。

但是,Genie 3 所展現出的技術發展的方向,當然值得探討。

在 AAA 級別遊戲工作室的實際流程中,AI 確實已經開始發揮一定的作用。比如在概念設計階段,通過提示詞來生成圖片或 3D 場景來快速預覽風格,構建原型;在素材生產的環節,使用 AI 工具來快速生成多種紋理的素材。

這些工具交給大工作室,能夠一定程度上提高生產效率,給到個人開發者的手上,也可以顯著降低開發者的負擔。

同理,對於遊戲開發者,乃至整個遊戲行業而言,Genie 3 本來應該是個重大利好——正因為此,它引發的遊戲公司股價暴跌才讓我十分費解。

等到 GTA7 的時候,R星可能會利用 Genie 3 生成路邊垃圾桶、NPC 的閒聊對話,甚至是完整的關卡、場景、人物。

但這些素材放在哪裏、怎麼放,它們在一個具體的任務,以及在整個宏觀的世界中所扮演的角色,仍將由 R星的人物、任務、關卡、環境、世界設計師們決定。

AI 會成為遊戲開發者的超級畫筆。但只有在人類「畫家」的手中,它才能畫出具有文化深度和社會影響力的曠世佳作。



資料來源:愛範兒(ifanr)
標籤: Genie 3  AI  遊戲  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→