要砸1000億！米哈遊準備認真做AI

5月15日，米哈遊於北京舉辦AI大模型技術分享會暨頂尖校招宣講，以非公開形式面向高校頂尖人才與技術圈核心人士，官宣千億級AI投入與全棧自研路線，標誌米哈遊發展戰略將朝向AI驅動科技企業進一步押注。

在本次分享會中，米哈遊聯合創始人劉偉（大偉哥）也登臺分享了自己對於AI業務的願景，並拋出了一個頗爲震撼的數字：未來三年，最多投入1000億元以深耕AI領域。他坦言，“就算最終不成功，沒做出來，也認了，就當放一場大煙花。”這份決絕，彰顯出米哈遊深耕AI領域的堅定決心。

戰略層面不搞“大公司病”

在本次分享會中，大偉哥首先提到：“公司的創始人也必須是技術負責人，必須在一線做所有的事情，只有這種方式才能將大模型做成。”

當今時代下，AI大模型範式迭代極快，決策層若脫離了技術一線，只靠彙報來做決策，高昂的管理成本不僅會拖垮團隊，更會讓企業被時代淘汰。因此，最高決策者必須紮根在代碼與訓練曲線一線，只有這樣才能守住極致的技術敏銳度。

事實上，米哈遊早已踐行這一理念。在遊戲日報此前關於劉偉在上海交通大學演講的報道中便提及，聯合創始人蔡浩宇無論公司規模如何擴張，始終堅守技術一線；在AI大模型時代來臨後，他義無反顧的把米哈遊所有東西都拋在身後，從零開始學習鑽研。最近Agent技術十分火熱，蔡浩宇也會親手搭建Agent，即便每日睡眠不足五六小時也始終保持極高的研發熱情。

另外，組建團隊做AI需要警惕“大牛陷阱”，堅持扁平化優先。大偉哥提到，“我們不希望招一個大牛。大牛有自己很強的ego（自我），有自己的scope（負責內容）......但只有一個年輕的、志同道合的團隊，纔有可能真正實現彎道超車。”

這其實指出，傳統AI經驗在LLM時代反而可能成爲“負資產”，影響項目的推進。一些固守局部優化，執着於“守邊界”、“搶地盤”的資深管理者，往往有強烈的自我意識，但這會扼殺全局視角的創新。在今天，從數據、模型到Infra，真正能實現突破的，是志同道合、扁平化的年輕團隊，而非沉迷於個人Scope的“大牛”。

此外，在研發效率層面，大偉哥還提出了“AI for AI，Model with Model”的核心邏輯，讓AI進入自主研發循環。真正的效率提升並非盲目擴招，而是讓大模型自主分析訓練瓶頸、編寫複雜的GPU內核代碼、定位程序漏洞。誰能率先搭建“自動調優沙盒”，誰就能在迭代速度上實現降維打擊。

技術層面的“薪火”

除了在公司戰略層面，遊戲日報也整理了大偉哥在前沿技術層面的一些洞見。

在基建層面，米哈遊重新定義了AI Infra的價值邊界，大偉哥指出，模型能力的上限正由基礎設施重新界定。在萬卡規模下，通信、計算、數據的協同設計早已不是簡單的“底層修管道”，而是直接決定算法模型能跑多大參數、支撐多長的Context。系統工程的核心，就是在正確性與極致性能之間找到最優解。

而在AI預訓練環節，米哈遊強調數據與工程的關係博弈。大偉哥認爲，數據是要佔據0~90分的量級，模型則是做90~95分的突破。在此前提下，數據清洗、去重與配比決定了模型的基礎，小規模訓練下看似有效的模型Trick，在極限Scale下往往會失效，唯有優質的數據分佈才能帶來穩定收益。

同時，大規模訓練的本質是消滅“小概率事件”，要把小概率事件變成一個確定性的工程，不然的話，“一個簡單的Loss Spike（損失值異常飆升）會導致整個模型去瘋。”

即便是在單卡上無足輕重的Token異常、算子Bug，看起來可能毫無波瀾，但在萬卡集羣中則會被無限放大，直接導致模型的災難性崩潰。因此，擁有從梯度到底層算子的全鏈路可觀測能力，是預訓練保持穩定、不被“炸燬”的唯一保障。

在後訓練與多模態領域，米哈遊則提出了通往AGI的真實路徑，提出智能的終極公式是“Context × Permission”，單純喂長文本，或給一個沒有環境的Function Call都毫無意義，真正的Agent需要讓模型讀取真實世界的上下文（如代碼庫、聊天記錄），並擁有執行修改的權限，二者相乘纔是智能的上限。

而在強化學習方面，米哈遊認爲簡單採用RLHF（人類反饋強化學習）已不是未來方向，下一代RL（強化學習）需要讓模型在真實交互環境中試錯，以“修改代碼導致pipeline崩潰”這類真實代價作爲Reward信號，解決長週期任務的學分分配問題。

未來的多模態也要摒棄簡單的“語音轉文字+文字轉語音”的外掛式流水線，而是在預訓練早期就將音頻等模態特徵融入基座，讓模型擁有原生物理感知能力的同時，保留其強大的邏輯推理內核。

米哈遊的野望

綜合遊戲日報之前的報道，不難發現米哈遊近日在AI領域動作頻頻。

米哈遊創始人蔡浩宇在硅谷的AI創業公司Anuttacon剛經歷了一次重大的戰略轉向。公司最初的目標是利用AI技術（包括大語言模型、語音、視頻）打造“像人”的互動系統，併發布了一款實驗性AI對話遊戲《Whispers from the Star》進行驗證。

如今，這款遊戲在Steam平臺的評分定位在特別好評（82%好評率），即便整體上得到認可，同時也有不少玩家反饋AI模型還不夠智能，未能完全實現玩法概念目標。

而最近，公司停止了多模態表演模型等原有方向的研發，將幾乎全部算力和核心團隊都集中投入到通用大語言模型（LLM）和智能體Agent的構建上，LLM相關團隊整體迴流國內，進入集中作戰狀態，蔡浩宇也將研發重心從美國轉移回了中國。

在前不久的大偉哥交大演講中，AI也是高頻出現的詞彙。大偉哥指出，人工智能的應用與影響已實現階段性躍遷，其範圍遠超早期的聊天對話（Chatbot）功能，如今已進入能夠自主規劃、使用工具並執行復雜任務的“智能體”（Agent）階段。當前，智能體已能深度參與大部分非圖形界面的軟件工程，成爲開發者的強大協作者。

在遊戲產業，這種變革尤爲顯著，其影響是雙重的。一方面，在遊戲製作端，AI正作爲“超級輔助”滲透到美術、敘事、設計、編程等全流程，極大地提升效率並降低創作門檻。另一方面，在遊戲體驗端，更具顛覆性的未來正在臨近：預計未來兩三年內，AI將實現“千人千面”的個性化遊戲體驗，能夠爲每位玩家實時生成獨一無二的劇情、任務和玩法，使遊戲從固定劇本進化爲動態世界。

在這種技術背景下，人類與AI的協作關係正在被重新定義。在當前階段，AI的核心角色是高效的“解題者”，擅長在人類設定的框架內執行任務、生成內容。而人類不可替代的獨特優勢，則在於成爲“出題者”——即擁有定義問題、設定願景和探索未知的能力。

而最近，米哈遊AI技術已實現部分落地——《崩壞：星穹鐵道》中的“帕姆幫幫”（測試版）AI助手就是一個具體運用的例子。通過自然語言交互，帕姆AI能夠主動理解並滿足玩家需求，不僅可以用它查詢攻略（如角色養成、配隊建議），還可以與扮演列車長帕姆的AI進行趣味互動，其回覆符合角色設定，體驗自然。

在技術層面，爲應對千萬級玩家的高併發挑戰，米哈遊採用了多模塊協同系統、將邏輯推理嵌入模型權重以提升響應速度、應用FP8混合精度訓練以降低成本。同時，通過深度定製化訓練將遊戲世界觀“刻入”模型基因，並採用知識庫與模型能力層分離的架構，使兩者能獨立優化，並讓模型具備基於反饋的在線強化學習能力，持續進化。

“帕姆幫幫”作爲米哈遊AI技術進入實際應用階段的標誌，儘管目前作爲“測試版”尚有改進空間，但其底層架構具備通用性，可擴展至其他NPC，就在此前，米哈遊已構想過如“星穹狼人殺”等AI驅動的新玩法，讓AI角色擁有自主行爲與策略。這標誌着遊戲交互方式從傳統UI向自然語言的變革，AI正從開發工具轉變爲遊戲體驗的核心組成部分，目前也收穫了良好的口碑。

同樣的，AI NPC系統也在不久前開啓二測的《星布穀地》中得到了應用。以咖啡店老闆娘“娜洛”爲例，其具備長線記憶功能、個性化的情感反應和擬人化的高自由度對話能力，旨在與玩家建立深度的情感連接，從而構成遊戲的核心差異化競爭力。即便有時回應略顯刻板，但也仍展現出了一定的邏輯反應潛力。

從戰略啓航到階段成果落地，米哈遊AI事業的版圖已然越來越清晰。從短期看，AI是革新遊戲生產方式、重構玩家交互體驗的核心工具；從長期看，集中攻堅通用AI與智能體，是米哈遊佈局下一代數字內容、探索AI原生數字世界的關鍵一步。隨着技術持續迭代與團隊整合完成，這場由米哈遊主導的遊戲AI革命，或將持續釋放更大的產業能量。

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

要砸1000億！米哈遊準備認真做AI

相關資訊 更多

熱點資訊

热门游戏

相關資訊更多