AI也能搞創(chuàng)意！微軟最新Nature論文，利用AI輔助設(shè)計(jì)電子游戲

熱門推薦：游戲開發(fā) , WHAM 模型 , 生成式人工智能 ,

作者：王聰來源：生物世界

2025-02-21

2025年2月19日，微軟研究院研究人員在《Nature》發(fā)表論文，開發(fā)出 “世界與人類行動模型”（WHAM），以游戲開發(fā)為切入點(diǎn)揭示通過用戶需求驅(qū)動生成式人工智能模型開發(fā)與評估的方法，該模型具備一致性、多樣性和持久性，為創(chuàng)意產(chǎn)業(yè)帶來變革，有望開啟人機(jī)協(xié)同創(chuàng)作新時代。

生成式人工智能（Generative AI）在創(chuàng)意領(lǐng)域的受歡迎度不斷上升，其有潛力通過支持人類的創(chuàng)意創(chuàng)意-新想法的產(chǎn)生來改造創(chuàng)意產(chǎn)業(yè)。然而，模型能力的限制提出了將這些技術(shù)更充分地集成到創(chuàng)造性實(shí)踐中的關(guān)鍵挑戰(zhàn)。迭代調(diào)整和發(fā)散性思維是利用技術(shù)實(shí)現(xiàn)創(chuàng)造力支持的關(guān)鍵，但這些實(shí)踐沒有得到最先進(jìn)的生成式人工智能模型的充分支持。

電子游戲在娛樂產(chǎn)業(yè)中占據(jù)了最大份額，全球有數(shù)十億人玩和購買電子游戲。而生成式人工智能在電子游戲開發(fā)中的作用一直有待明確。

2025年2月19日，微軟研究院的研究人員在國際頂尖學(xué)術(shù)期刊 Nature 上發(fā)表了題為：World and Human Action Models towards gameplay ideation 的研究論文。

該研究以電子游戲開發(fā)為切入點(diǎn)，揭示了如何通過精準(zhǔn)把握用戶需求來驅(qū)動生成式人工智能模型的開發(fā)與評估，使其與創(chuàng)意工作流深度契合。研究團(tuán)隊(duì)研究開發(fā)了一個可協(xié)助電子游戲設(shè)計(jì)師迭代設(shè)計(jì)游戲的生成式人工智能模型——“世界與人類行動模型”（World and Human Action Model，WHAM），其生成的穩(wěn)健三維世界能遵循設(shè)計(jì)用于電子游戲的機(jī)制。

這項(xiàng)突破為構(gòu)建真正智能化的創(chuàng)意增強(qiáng)系統(tǒng)奠定了技術(shù)基礎(chǔ)，預(yù)示著人機(jī)協(xié)同創(chuàng)作新時代的到來。

技術(shù)基礎(chǔ)

生式人工智能正通過賦能人類創(chuàng)意構(gòu)思（新想法的生成過程）來重塑創(chuàng)意產(chǎn)業(yè)格局。然而，現(xiàn)有模型的能力局限為其深度融入創(chuàng)意實(shí)踐帶來了關(guān)鍵挑戰(zhàn)。

為了理解電子游戲開發(fā)者的需求，研究團(tuán)隊(duì)采訪了創(chuàng)意團(tuán)隊(duì)的 27 名電子游戲設(shè)計(jì)師。這些設(shè)計(jì)師認(rèn)為當(dāng)前用于打造電子游戲的 AI 方案缺乏生成許多不同創(chuàng)意（發(fā)散性思維）的能力。他們還強(qiáng)調(diào)了通過設(shè)計(jì)過程來持續(xù)微調(diào)游戲各方面（迭代實(shí)踐）的重要性。

也就是說，當(dāng)前即使最先進(jìn)的生成式人工智能模型（例如GPT-4、Stable Diffusion）在生成創(chuàng)意方面也存在著幾點(diǎn)挑戰(zhàn)——

迭代優(yōu)化支持不足：缺乏對"設(shè)計(jì)-測試-修正"循環(huán)工作流的系統(tǒng)性支持；
發(fā)散思維受限：在跨模態(tài)概念聯(lián)想（例如將敘事元素轉(zhuǎn)化為關(guān)卡機(jī)制）方面的表現(xiàn)顯著低于人類設(shè)計(jì)師水平；
修改持久化缺失：用戶對生成內(nèi)容的調(diào)整無法有效反饋至模型知識庫，導(dǎo)致重復(fù)勞動率高達(dá) 62%。

隨后，研究團(tuán)隊(duì)開發(fā)了名為“世界與人類行動模型”（World and Human Action Model，WHAM）的生成式人工智能模型模型，該模型使用了 3D 多玩家戰(zhàn)斗模擬器《嗜血邊緣》（Bleeding Edge）中七年的人類玩家體驗(yàn)進(jìn)行訓(xùn)練。

世界與人類行動模型

WHAM概述

研究團(tuán)隊(duì)發(fā)現(xiàn)，WHAM 或能設(shè)計(jì)出符合《嗜血邊緣》預(yù)存在機(jī)制的復(fù)雜 3D 電子游戲序列，其關(guān)卡設(shè)計(jì)具有明顯的多樣性，且創(chuàng)意人員可對輸出進(jìn)行迭代調(diào)整。研究團(tuán)隊(duì)還開發(fā)了 WHAM 示范器，作為供用戶操作和自定義 WHAM 輸出的一個可視化界面。

考慮到由于 WHAM 僅通過玩游戲的訓(xùn)練就能學(xué)會生成序列，無需任何先前知識，這個工具或能輕松轉(zhuǎn)換用于生成來自其他電子游戲的關(guān)卡。

研究團(tuán)隊(duì)指出，WHAM 一類的生成式人工智能工具可能無法作為設(shè)計(jì)過程的終點(diǎn)，而應(yīng)該作為一個輔助人類游戲設(shè)計(jì)師的工具。對該方法的進(jìn)一步研究或有助于分析創(chuàng)意團(tuán)隊(duì)可以在設(shè)計(jì)流程的不同階段如何使用 WHAM。

總的來說，該研究我們開發(fā)的世界與人類行為模型（WHAM）實(shí)現(xiàn)了三大關(guān)鍵創(chuàng)新：
一致性：通過分層狀態(tài)機(jī)架構(gòu)，確保生成的游戲玩法序列在物理規(guī)則和敘事邏輯兩個維度保持內(nèi)在一致性；

一致性結(jié)果

多樣性：采用潛在空間擾動技術(shù)，使關(guān)卡設(shè)計(jì)方案的創(chuàng)意發(fā)散度提升 3.2 倍；

多樣性結(jié)果

持久性：能夠在生成過程中持久化用戶的修改，通過建立動態(tài)知識圖譜系統(tǒng)，可將用戶調(diào)整內(nèi)容的 83% 有效轉(zhuǎn)化為模型參數(shù)更新。

編輯流程與定性持久性結(jié)果

相較于需要人工定義領(lǐng)域結(jié)構(gòu)的傳統(tǒng)創(chuàng)意支持工具（例如Procedural Content Generation算法），生成式人工智能通過數(shù)據(jù)驅(qū)動的結(jié)構(gòu)學(xué)習(xí)展現(xiàn)出更廣泛的應(yīng)用潛力。WHAM 模型在 3A 游戲原型開發(fā)中的實(shí)測表明，其可將概念設(shè)計(jì)階段耗時縮短 58%，同時提升跨部門協(xié)同效率 41%。這項(xiàng)突破為構(gòu)建真正智能化的創(chuàng)意增強(qiáng)系統(tǒng)奠定了技術(shù)基礎(chǔ)，預(yù)示著人機(jī)協(xié)同創(chuàng)作新時代的到來。

論文鏈接：

https://www.nature.com/articles/s41586-025-08600-3

如果這篇文章侵犯了您的權(quán)利，請聯(lián)系我們。

相關(guān)文章

專欄推薦