生成式人工智能(Generative AI)在創(chuàng)意領(lǐng)域的受歡迎度不斷上升,其有潛力通過支持人類的創(chuàng)意創(chuàng)意-新想法的產(chǎn)生來改造創(chuàng)意產(chǎn)業(yè)。然而,模型能力的限制提出了將這些技術(shù)更充分地集成到創(chuàng)造性實踐中的關(guān)鍵挑戰(zhàn)。迭代調(diào)整和發(fā)散性思維是利用技術(shù)實現(xiàn)創(chuàng)造力支持的關(guān)鍵,但這些實踐沒有得到最先進的生成式人工智能模型的充分支持。
電子游戲在娛樂產(chǎn)業(yè)中占據(jù)了最大份額,全球有數(shù)十億人玩和購買電子游戲。而生成式人工智能在電子游戲開發(fā)中的作用一直有待明確。
2025年2月19日,微軟研究院的研究人員在國際頂尖學(xué)術(shù)期刊 Nature 上發(fā)表了題為:World and Human Action Models towards gameplay ideation 的研究論文。
該研究以電子游戲開發(fā)為切入點,揭示了如何通過精準把握用戶需求來驅(qū)動生成式人工智能模型的開發(fā)與評估,使其與創(chuàng)意工作流深度契合。研究團隊研究開發(fā)了一個可協(xié)助電子游戲設(shè)計師迭代設(shè)計游戲的生成式人工智能模型——“世界與人類行動模型”(World and Human Action Model,WHAM),其生成的穩(wěn)健三維世界能遵循設(shè)計用于電子游戲的機制。
這項突破為構(gòu)建真正智能化的創(chuàng)意增強系統(tǒng)奠定了技術(shù)基礎(chǔ),預(yù)示著人機協(xié)同創(chuàng)作新時代的到來。
生式人工智能正通過賦能人類創(chuàng)意構(gòu)思(新想法的生成過程)來重塑創(chuàng)意產(chǎn)業(yè)格局。然而,現(xiàn)有模型的能力局限為其深度融入創(chuàng)意實踐帶來了關(guān)鍵挑戰(zhàn)。
為了理解電子游戲開發(fā)者的需求,研究團隊采訪了創(chuàng)意團隊的 27 名電子游戲設(shè)計師。這些設(shè)計師認為當(dāng)前用于打造電子游戲的 AI 方案缺乏生成許多不同創(chuàng)意(發(fā)散性思維)的能力。他們還強調(diào)了通過設(shè)計過程來持續(xù)微調(diào)游戲各方面(迭代實踐)的重要性。
也就是說,當(dāng)前即使最先進的生成式人工智能模型(例如GPT-4、Stable Diffusion)在生成創(chuàng)意方面也存在著幾點挑戰(zhàn)——
迭代優(yōu)化支持不足:缺乏對"設(shè)計-測試-修正"循環(huán)工作流的系統(tǒng)性支持;
發(fā)散思維受限:在跨模態(tài)概念聯(lián)想(例如將敘事元素轉(zhuǎn)化為關(guān)卡機制)方面的表現(xiàn)顯著低于人類設(shè)計師水平;
修改持久化缺失:用戶對生成內(nèi)容的調(diào)整無法有效反饋至模型知識庫,導(dǎo)致重復(fù)勞動率高達 62%。
隨后,研究團隊開發(fā)了名為“世界與人類行動模型”(World and Human Action Model,WHAM)的生成式人工智能模型模型,該模型使用了 3D 多玩家戰(zhàn)斗模擬器《嗜血邊緣》(Bleeding Edge)中七年的人類玩家體驗進行訓(xùn)練。
WHAM概述
研究團隊發(fā)現(xiàn),WHAM 或能設(shè)計出符合《嗜血邊緣》預(yù)存在機制的復(fù)雜 3D 電子游戲序列,其關(guān)卡設(shè)計具有明顯的多樣性,且創(chuàng)意人員可對輸出進行迭代調(diào)整。研究團隊還開發(fā)了 WHAM 示范器,作為供用戶操作和自定義 WHAM 輸出的一個可視化界面。
考慮到由于 WHAM 僅通過玩游戲的訓(xùn)練就能學(xué)會生成序列,無需任何先前知識,這個工具或能輕松轉(zhuǎn)換用于生成來自其他電子游戲的關(guān)卡。
研究團隊指出,WHAM 一類的生成式人工智能工具可能無法作為設(shè)計過程的終點,而應(yīng)該作為一個輔助人類游戲設(shè)計師的工具。對該方法的進一步研究或有助于分析創(chuàng)意團隊可以在設(shè)計流程的不同階段如何使用 WHAM。
總的來說,該研究我們開發(fā)的世界與人類行為模型(WHAM)實現(xiàn)了三大關(guān)鍵創(chuàng)新:
一致性:通過分層狀態(tài)機架構(gòu),確保生成的游戲玩法序列在物理規(guī)則和敘事邏輯兩個維度保持內(nèi)在一致性;
一致性結(jié)果
多樣性:采用潛在空間擾動技術(shù),使關(guān)卡設(shè)計方案的創(chuàng)意發(fā)散度提升 3.2 倍;
多樣性結(jié)果
持久性:能夠在生成過程中持久化用戶的修改,通過建立動態(tài)知識圖譜系統(tǒng),可將用戶調(diào)整內(nèi)容的 83% 有效轉(zhuǎn)化為模型參數(shù)更新。
編輯流程與定性持久性結(jié)果
相較于需要人工定義領(lǐng)域結(jié)構(gòu)的傳統(tǒng)創(chuàng)意支持工具(例如Procedural Content Generation算法),生成式人工智能通過數(shù)據(jù)驅(qū)動的結(jié)構(gòu)學(xué)習(xí)展現(xiàn)出更廣泛的應(yīng)用潛力。WHAM 模型在 3A 游戲原型開發(fā)中的實測表明,其可將概念設(shè)計階段耗時縮短 58%,同時提升跨部門協(xié)同效率 41%。這項突破為構(gòu)建真正智能化的創(chuàng)意增強系統(tǒng)奠定了技術(shù)基礎(chǔ),預(yù)示著人機協(xié)同創(chuàng)作新時代的到來。
論文鏈接:
https://www.nature.com/articles/s41586-025-08600-3
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com