在高科技領域,中國與世界最高水平仍有較大差距的兩大核心領域,一是光刻機,二是 GPU 芯片 —— 二者正是全球 AI 競爭的關鍵基石。
5 年時間,摩爾線程基於自研全功能 GPU,構建起軟硬兼備的全棧產品體系,覆蓋幾乎所有 GPU 相關領域:從消費級遊戲顯卡(S80/S70)到專業視覺加速顯卡(X300/S50)、數字辦公顯卡(S30/S10);從 AI 算力本(AIBOOK)到臺式機(智娛摩方);從算力加速卡(S5000/S4000)到服務器(MCCX D800 X1/X2)、智算中心(誇娥集羣);從基礎軟件、AI 套件到雲原生軟件、圖形與多媒體軟件;從 AI 模型(MUSAChat)到 AI 應用(魔筆馬良 / 魔筆天書),摩爾線程在傳統與新興領域均表現亮眼。所以,摩爾線程是時候做一次總體彙報,也是時候展望一下未來了!
第一屆MUSA開發者大會,恐怕超出了每一位與會者的意料與期待! 這場大會的乾貨密度,遠超所有與會者的期待:新架構 ×1、新芯片 ×3、新整機 ×2、新集羣 ×1,外加衆多開發工具與生態升級,盡顯 5 歲摩爾線程的全面爆發!
![]()
我們先來總結剖析以上這些數據包含了什麼:
架構層面
:花港架構是核心護城河,全精度支持 + 高能效 + 高擴展性,爲全系產品打下基礎;
芯片層面
:華山主攻智算、廬山聚焦圖形、長江發力端側,三條賽道精準覆蓋不同需求;
生態層面
:從個人算力本到十萬卡集羣,實現 “芯 - 邊 - 端 - 雲” 全場景覆蓋,開發者友好屬性拉滿。
接下來讓我們看看這些芯片的詳細信息。
![]()
新一代 GPU 架構:花港
自 2022 年起,摩爾線程 MUSA GPU 架構保持每年一代的迭代速度,先後推出 “蘇堤”“春曉”“麴院”“平湖”(架構代號均源自 “西湖十景”),此次發佈的新一代架構,代號 “花港”。
核心性能突破
“花港” 架構採用新一代指令集,在相同工藝條件下,算力密度提升 50%,能效更是實現 10 倍飛躍。支持 FP4 到 FP64 的全精度端到端加速計算,新增 MTFP6、MTFP4 支持,優化 FP8、FP6、FP4 低精度計算,通過混合計算模式提升能效。
內置第一代 AI 生成式渲染架構(AGR),以 AI 重構傳統渲染流水線,搭配第二代光追硬件加速引擎,生成速度較上代提升 5-6 倍,完美支持 DX12 Ultimate 全功能。同時,新一代異步編程技術優化任務調度與並行機制,結合自研 MTLink 高速互聯技術,可支撐 10 萬卡及以上超大規模智算集羣擴展。
未來產品規劃
基於 “花港” 架構,推出兩大核心芯片:高性能 AI 訓推一體的 “華山” 芯片,以及高性能圖形渲染的 “廬山” 芯片,覆蓋智算與消費級市場。

![]()
十萬卡集羣基石:AI 訓推一體芯片 “華山”
“華山” 芯片基於花港架構打造,爲 AI 訓練與推理一體化設計,構建下一代 “AI 工廠”。其性能全面超越 NVIDIA 上一代 Hopper 架構,在訪存容量上優於新一代 Blackwell 架構,訪存帶寬與之持平。
核心技術優勢
異步編程技術:通過線程同步效應實現負載自動均衡分配,讓每個計算單元持續高效運轉,避免 “一核有難多核圍觀”。
Tensor 張量計算系統:支持從 32 位到 4 位全精度整數、浮點、張量數據格式,重點提升 FP6、FP4 張量運算性能,支持 MTFP8/6/4 混合精度計算;新增 TCE-PAIR 模式,實現兩個 TCE 單元數據共享,增強內部數據重用,提升算子效率。
多元互聯與高可靠性:支持自研 MTLink 4.0 互連技術及多種主流開發互聯協議,兼容不同硬件生態;內置 RAS 2.0 技術,通過 SRAM 奇偶校驗、ECC、強化錯誤檢測上報與隔離等功能提升集羣可靠性;新一代異步通信引擎 ACE 2.0 讓通信與計算並行執行,大幅提升整體效率。
集羣擴展能力
“華山” 芯片可輕鬆構建十萬卡級別智算集羣,單個節點最多支持 1024 塊加速卡。
![]()
![]()
新一代遊戲卡:圖形渲染芯片 “廬山”
對於普通用戶與遊戲玩家,消費級顯卡是焦點。摩爾線程 MTT S80/S70 作爲目前唯一可購的國產遊戲卡,硬件性能對標 RTX 3060,說實話還是有些不夠看的。
性能飛躍式提升
新一代圖形渲染芯片 “廬山” 同樣基於花港架構,性能突破:遊戲性能理論上提升 15 倍、光追性能提升 50 倍、AI 性能提升 64 倍、幾何處理性能提升 16 倍、紋理填充性能提升 4 倍、原子訪存性能提升 8 倍,顯存容量最大可達 64GB(較上代增大 4 倍),亦可應對 CAD、CAE 等工業設計任務。
核心技術亮點
AI 生成式渲染 MTAGR:融入 AI 賦能,覆蓋幾何着色器、網格着色器、像素着色器等環節,集成 AI 超分、多幀生成、光流、降噪等功能,類似於DLSS/FSR,支持 DirectX、Vulkan 及自研 MUSA 多渲染後端,兼容 Windows、Linux 系統與主流 CPU 架構。
統一任務引擎架構(United Task Engine):實現 GPU 內部計算單元充分並行,避免任務分配不均,最大化核心利用率。
新一代光追技術:內置專用光追計算模塊(RTU),支持硬件加速全場景遍歷求交,自主設計 BVH 加速結構算法,兼顧高效生成與顯存節省,完美支持微軟 DXR 1.1 標準。
![]()
![]()
![]()
大一統 SoC 芯片 “長江” 與兩款整機
本次發佈的第三顆芯片 “長江”,是摩爾線程首款完整的 SoC 片上系統,打造異構計算核心:
CPU:8 個 Arm 架構全大核,主頻最高 2.65GHz,兼顧高性能與低功耗;
GPU:自研全功能 GPU,支持高性能 3D 渲染與大模型端側推理;
NPU:可編程雙核心,專注語音、圖像多模態加速處理;
VPU:支持 H.264、AV1 等格式編解碼,適配 8K30、4K60 超高清需求;
DPU:支持雙屏 8K60、八屏 4K60 高清多屏輸出;
DSP:高性能雙核設計,支持 AI 降噪、Hi-Fi 音效;
ISP:最高支持 3200 萬像素攝像頭,兼容 HDR;
內存:支持 32/64GB LPDDR5X,帶寬超 100GB/s;
異構 AI 總算力超 50 TOPS,支持 FP64、FP32、FP16 等多精度計算。
基於 “長江” SoC,摩爾線程同步推出三款產品:AI 算力本 AIBOOK、迷你機 MTT AICube、MTT E300 AI 模組。
![]()
AI 算力本 MTT AIBOOK
專爲 AI 學習與開發者設計的個人智算平臺,兼顧日常使用場景,售價 9999 元,現已開放預售,2026 年 1 月 10 日正式開售。
系統兼容:默認運行 Linux 內核的 MT AIOS 操作系統,支持 Windows 虛擬機、Android 容器及主流國產操作系統;
開發環境:預置 VS Code、Jupyter Notebook、Python、PyTorch、vLLM 等全套 AI 開發工具,簡化開發部署流程;
模型支持:端側最高可運行 30B 參數大模型,預裝阿里 Qwen3-8B、智源悟界 Emu 3.5 多模態模型,支持視覺指導、文本生圖等功能;
智能體驗:內置數字人智能體 “小麥” 與 MUSAChat-72B 大模型,支持模型 API 靈活調用,提供開箱即用的 AI 體驗,“小麥” 核心能力已開放雲端 API 與本地 SDK;
硬件配置:航空級鋁合金一體成型設計,薄至 12.4 毫米、輕至 1.35 千克;14 寸 OLED 屏幕(91%屏佔比、2.8K 分辨率、120Hz 刷新率);4 揚聲器、4 麥克風陣列、1080p 攝像頭;1.5 毫米鍵程鍵盤、12×7.5 毫米觸摸板;1TB SSD、70Whr 電池;三個 USB-C 接口、Wi-Fi 6、藍牙 5.2。
![]()
迷你機 MTT AICube
支持多系統兼容與端雲大模型部署,定位類似 AMD 395、NVIDIA DGX Spark 的個人開發迷你機。
![]()
MTT E300 AI 模組
提供高性能、低延遲、高可靠的國產邊緣 AI 解決方案,適用於工業、能源、教育、交通、醫療等行業場景。

十萬卡級智算重器:誇娥智算集羣
“誇娥” 萬卡智算集羣(KUAE 2.0)是本次大會的重點,作爲國家 AI 算力核心基礎設施,支撐着海量 AI 服務的後臺運行。摩爾線程從千卡集羣起步,現已實現萬卡規模。
![]()
核心性能指標
該集羣浮點運算能力達 10 Exa-Flops,成功攻克萬卡級硬件篩選、高速互聯、系統級容錯等工程難題,可支撐萬億參數大模型訓練與部署。
![]()
軟件與生態優化
集羣守護系統:KUAE RAS System Daemon 可在不影響客戶系統運行的情況下,快速定位並替換故障節點、慢節點、SDC 節點。
推理性能突破:聯合硅基流動完成全棧優化,基於 MTT S5000 AI 加速卡運行 DeepSeek R1 671B 全量模型,單卡 Prefill 吞吐突破 4000 tokens/s,Decode 吞吐突破 1000 tokens/s,支持高併發、低延遲大模型服務。
未來規劃:推出 MTT C256 超級節點產品,通過一層 scale-up 網絡實現兩臺機櫃 256 塊加速卡全互聯,規避多層網絡帶來的帶寬損失與延遲,提升智算集羣 GPU 部署密度。
![]()
生態落地:千行百業的算力賦能
大會現場設置超 1000 平方米主題展區,充分展現摩爾線程 GPU 的廣泛落地成果:
工業與邊緣智能
ME10 工業級智算 BOX(天思智慧):基於 “長江” SoC,最大支持 32GB LPDDR5/5X 內存,具備寬溫適應性與豐富接口,適用於智能製造、智慧城市等領域;
SD5600MX100(國儀海聚):爲智能系統提供高算力核心,滿足車規、工業自動化、醫療等行業需求,成本控制與 I/O 設計靈活;
柳工 CLG922E 挖掘機:基於 MindEdge L100 邊緣計算平臺,整合設備運行數據與音視頻信息,優化故障診斷、自動駕駛等 AI 模型,解決複雜工況下的安全與能效難題;
盾構機 “盾構大腦”(雪浪雲):打通七大控制系統與外部感知、運維繫統,打造自適應控制中樞,解決隧道施工 “掘不快、掘不準、掘不穩” 的核心痛點。
端側 AI 終端
B700 AI BOX(聯達興):支持 4K60Hz 超清雙顯,集成雙千兆網口、Wi-Fi 6、藍牙 5.3,配備專業音頻接口與 DC 供電,適配智能會議、數字標牌等 AIoT 場景;
ME21 AI 迷你機:基於 “長江” SoC,專爲本地大模型部署設計,適用於智能辦公、邊緣計算、AI 教育等場景;
后羿智盒 HOUYI-1000B/HOUYI-Pi-B(全愛科技):前者爲 3.5 寸工業主板形態,無風扇散熱,支持 32B 大模型端側部署,適用於安防、交通等嚴苛場景;後者體積超小,可廣泛應用於機器人、無人機等設備。
專業計算與仿真
紫光計算機 UltiStation 800H 工作站:旗艦級國產化單路工作站,搭載海光 C86-4G 處理器,最高支持 128GB DDR5 內存與 PCIe 5.0 存儲 / 顯卡,搭配摩爾線程專業顯卡,適用於政府、教育等領域的圖形處理、仿真與 AI 計算;
紫光計算機 100P 智算集羣:基於摩爾線程 MTT S4000,構建高效集羣計算能力;
微視威 eVTOL 全動飛行模擬器:全鏈路自主研發,1:1 封閉座艙與六自由度運動平臺,搭載北京大學 ViWo 引擎視景系統,國內首個通過民航局 5 級鑑定的國產視景系統,已出口海外;基於 MTT X300 專業顯卡打通全國產化視景渲染鏈路,適用於飛行員訓練與機型工程驗證。
行業解決方案
羅拉超算體 LoLR CUBE(法律版 / 財稅版):搭載 MTT E300 64GB 模組,端側全棧算力支持 300 億大模型推理;法律版閱卷解析快至 10 秒 / 頁,效率提升 100 倍,支持法律文書生成優化;財稅版集成 2000 + 專業指標與 300 億 AI 風控大模型,7X24 小時監控。
景業智能 VR 遙操作機器人系統:適配 MTT E300 模組與 MTT S80 顯卡,操作人員通過 VR 眼鏡遠程控制特種機器人,在輻射等高風險環境完成精細任務,構建超低延遲、高可靠的操控閉環;
景業智能巡檢機器狗:適配 MTT S4000 顯卡,通過 Qwen 大模型部署,具備場景理解與實時推理能力,可自主完成人員識別、隱患排查、設備監測等任務;
中望軟件三維 CAD 解決方案:基於 MTT X300 專業顯卡,適配多款國產 CPU 與操作系統,可流暢渲染複雜三維模型;
ADAI ADXL Pro Max/AD Edit 模型:服務數十萬 C 端用戶與 500 多家行業客戶,累計生成圖像超 8000 萬張,已深度適配摩爾線程 GPU;
北太天元科學計算軟件:國內首款通用型科學計算與系統仿真軟件,全鏈條自主可控,集成 MUSA 加速計算能力,成爲全球首款原生集成 AI 能力的科學計算工具,可全面替代 MATLAB、Simulink;
微眸醫療眼科手術機器人:基於摩爾線程 GPU 實現手術過程本地化實時感知與智能決策,滿足微米級操作精度、高安全性與隱私保護需求。
技術創新應用
物流無人機(紫光計算機):小載重四旋翼末端配送設備,支持 1 千克包裹運輸,兼容 4G/5G / 專網通信,採用 RTK + 視覺融合精準降落,搭配訂單 APP 與飛行管理平臺,可自主完成投遞任務;
數字人應用:覆蓋文旅、政務、面試培訓等領域,依託摩爾線程 GPU 實現高效渲染與智能交互;
MTVSR 實時視頻超分技術:端側運行,分辨率可提升 2-4 倍,多檔質量可調,將以 SDK 形式支持播放器、瀏覽器等 App 集成。
從 “花港” 架構的全棧突破到三大核心芯片的精準佈局,從端側 AI 設備到十萬卡級智算集羣,從開發者生態構建到千行百業的深度落地,摩爾線程用五年時間完成了國產 GPU 的跨越式發展。這場 MUSA 開發者大會既是成果彙報,更是國產算力突圍的宣言 —— 在主權 AI 的賽道上,摩爾線程正以 “芯 - 邊 - 端 - 雲” 全棧體系,爲算力自主、算法自強、生態自立提供堅實支撐,書寫國產 GPU 的全新篇章。
![]()
本文數據來來源:MUSA開發者大會 · 2025
以上是本篇文章全部內容,如果有什麼缺失,歡迎評論區補充!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
