摩爾線程的報告也是預告：5歲的摩爾線程徹底爆發了！

在高科技領域，中國與世界最高水平仍有較大差距的兩大核心領域，一是光刻機，二是 GPU 芯片 —— 二者正是全球 AI 競爭的關鍵基石。

5 年時間，摩爾線程基於自研全功能 GPU，構建起軟硬兼備的全棧產品體系，覆蓋幾乎所有 GPU 相關領域：從消費級遊戲顯卡（S80/S70）到專業視覺加速顯卡（X300/S50）、數字辦公顯卡（S30/S10）；從 AI 算力本（AIBOOK）到臺式機（智娛摩方）；從算力加速卡（S5000/S4000）到服務器（MCCX D800 X1/X2）、智算中心（誇娥集羣）；從基礎軟件、AI 套件到雲原生軟件、圖形與多媒體軟件；從 AI 模型（MUSAChat）到 AI 應用（魔筆馬良 / 魔筆天書），摩爾線程在傳統與新興領域均表現亮眼。所以，摩爾線程是時候做一次總體彙報，也是時候展望一下未來了！

第一屆MUSA開發者大會，恐怕超出了每一位與會者的意料與期待！這場大會的乾貨密度，遠超所有與會者的期待：新架構 ×1、新芯片 ×3、新整機 ×2、新集羣 ×1，外加衆多開發工具與生態升級，盡顯 5 歲摩爾線程的全面爆發！

我們先來總結剖析以上這些數據包含了什麼：

架構層面
：花港架構是核心護城河，全精度支持 + 高能效 + 高擴展性，爲全系產品打下基礎；
芯片層面
：華山主攻智算、廬山聚焦圖形、長江發力端側，三條賽道精準覆蓋不同需求；
生態層面
：從個人算力本到十萬卡集羣，實現 “芯 - 邊 - 端 - 雲” 全場景覆蓋，開發者友好屬性拉滿。

接下來讓我們看看這些芯片的詳細信息。

新一代 GPU 架構：花港

自 2022 年起，摩爾線程 MUSA GPU 架構保持每年一代的迭代速度，先後推出 “蘇堤”“春曉”“麴院”“平湖”（架構代號均源自 “西湖十景”），此次發佈的新一代架構，代號 “花港”。

核心性能突破

“花港” 架構採用新一代指令集，在相同工藝條件下，算力密度提升 50％，能效更是實現 10 倍飛躍。支持 FP4 到 FP64 的全精度端到端加速計算，新增 MTFP6、MTFP4 支持，優化 FP8、FP6、FP4 低精度計算，通過混合計算模式提升能效。

內置第一代 AI 生成式渲染架構（AGR），以 AI 重構傳統渲染流水線，搭配第二代光追硬件加速引擎，生成速度較上代提升 5-6 倍，完美支持 DX12 Ultimate 全功能。同時，新一代異步編程技術優化任務調度與並行機制，結合自研 MTLink 高速互聯技術，可支撐 10 萬卡及以上超大規模智算集羣擴展。

未來產品規劃

基於 “花港” 架構，推出兩大核心芯片：高性能 AI 訓推一體的 “華山” 芯片，以及高性能圖形渲染的 “廬山” 芯片，覆蓋智算與消費級市場。

十萬卡集羣基石：AI 訓推一體芯片 “華山”

“華山” 芯片基於花港架構打造，爲 AI 訓練與推理一體化設計，構建下一代 “AI 工廠”。其性能全面超越 NVIDIA 上一代 Hopper 架構，在訪存容量上優於新一代 Blackwell 架構，訪存帶寬與之持平。

核心技術優勢

異步編程技術：通過線程同步效應實現負載自動均衡分配，讓每個計算單元持續高效運轉，避免 “一核有難多核圍觀”。
Tensor 張量計算系統：支持從 32 位到 4 位全精度整數、浮點、張量數據格式，重點提升 FP6、FP4 張量運算性能，支持 MTFP8/6/4 混合精度計算；新增 TCE-PAIR 模式，實現兩個 TCE 單元數據共享，增強內部數據重用，提升算子效率。
多元互聯與高可靠性：支持自研 MTLink 4.0 互連技術及多種主流開發互聯協議，兼容不同硬件生態；內置 RAS 2.0 技術，通過 SRAM 奇偶校驗、ECC、強化錯誤檢測上報與隔離等功能提升集羣可靠性；新一代異步通信引擎 ACE 2.0 讓通信與計算並行執行，大幅提升整體效率。

集羣擴展能力

“華山” 芯片可輕鬆構建十萬卡級別智算集羣，單個節點最多支持 1024 塊加速卡。

新一代遊戲卡：圖形渲染芯片 “廬山”

對於普通用戶與遊戲玩家，消費級顯卡是焦點。摩爾線程 MTT S80/S70 作爲目前唯一可購的國產遊戲卡，硬件性能對標 RTX 3060，說實話還是有些不夠看的。

性能飛躍式提升

新一代圖形渲染芯片 “廬山” 同樣基於花港架構，性能突破：遊戲性能理論上提升 15 倍、光追性能提升 50 倍、AI 性能提升 64 倍、幾何處理性能提升 16 倍、紋理填充性能提升 4 倍、原子訪存性能提升 8 倍，顯存容量最大可達 64GB（較上代增大 4 倍），亦可應對 CAD、CAE 等工業設計任務。

核心技術亮點

AI 生成式渲染 MTAGR：融入 AI 賦能，覆蓋幾何着色器、網格着色器、像素着色器等環節，集成 AI 超分、多幀生成、光流、降噪等功能，類似於DLSS/FSR，支持 DirectX、Vulkan 及自研 MUSA 多渲染後端，兼容 Windows、Linux 系統與主流 CPU 架構。
統一任務引擎架構（United Task Engine）：實現 GPU 內部計算單元充分並行，避免任務分配不均，最大化核心利用率。
新一代光追技術：內置專用光追計算模塊（RTU），支持硬件加速全場景遍歷求交，自主設計 BVH 加速結構算法，兼顧高效生成與顯存節省，完美支持微軟 DXR 1.1 標準。

大一統 SoC 芯片 “長江” 與兩款整機

本次發佈的第三顆芯片 “長江”，是摩爾線程首款完整的 SoC 片上系統，打造異構計算核心：

CPU：8 個 Arm 架構全大核，主頻最高 2.65GHz，兼顧高性能與低功耗；
GPU：自研全功能 GPU，支持高性能 3D 渲染與大模型端側推理；
NPU：可編程雙核心，專注語音、圖像多模態加速處理；
VPU：支持 H.264、AV1 等格式編解碼，適配 8K30、4K60 超高清需求；
DPU：支持雙屏 8K60、八屏 4K60 高清多屏輸出；
DSP：高性能雙核設計，支持 AI 降噪、Hi-Fi 音效；
ISP：最高支持 3200 萬像素攝像頭，兼容 HDR；
內存：支持 32/64GB LPDDR5X，帶寬超 100GB/s；
異構 AI 總算力超 50 TOPS，支持 FP64、FP32、FP16 等多精度計算。

基於 “長江” SoC，摩爾線程同步推出三款產品：AI 算力本 AIBOOK、迷你機 MTT AICube、MTT E300 AI 模組。

AI 算力本 MTT AIBOOK

專爲 AI 學習與開發者設計的個人智算平臺，兼顧日常使用場景，售價 9999 元，現已開放預售，2026 年 1 月 10 日正式開售。

系統兼容：默認運行 Linux 內核的 MT AIOS 操作系統，支持 Windows 虛擬機、Android 容器及主流國產操作系統；
開發環境：預置 VS Code、Jupyter Notebook、Python、PyTorch、vLLM 等全套 AI 開發工具，簡化開發部署流程；
模型支持：端側最高可運行 30B 參數大模型，預裝阿里 Qwen3-8B、智源悟界 Emu 3.5 多模態模型，支持視覺指導、文本生圖等功能；
智能體驗：內置數字人智能體 “小麥” 與 MUSAChat-72B 大模型，支持模型 API 靈活調用，提供開箱即用的 AI 體驗，“小麥” 核心能力已開放雲端 API 與本地 SDK；
硬件配置：航空級鋁合金一體成型設計，薄至 12.4 毫米、輕至 1.35 千克；14 寸 OLED 屏幕（91％屏佔比、2.8K 分辨率、120Hz 刷新率）；4 揚聲器、4 麥克風陣列、1080p 攝像頭；1.5 毫米鍵程鍵盤、12×7.5 毫米觸摸板；1TB SSD、70Whr 電池；三個 USB-C 接口、Wi-Fi 6、藍牙 5.2。

迷你機 MTT AICube

支持多系統兼容與端雲大模型部署，定位類似 AMD 395、NVIDIA DGX Spark 的個人開發迷你機。

MTT E300 AI 模組

提供高性能、低延遲、高可靠的國產邊緣 AI 解決方案，適用於工業、能源、教育、交通、醫療等行業場景。

十萬卡級智算重器：誇娥智算集羣

“誇娥” 萬卡智算集羣（KUAE 2.0）是本次大會的重點，作爲國家 AI 算力核心基礎設施，支撐着海量 AI 服務的後臺運行。摩爾線程從千卡集羣起步，現已實現萬卡規模。

核心性能指標

該集羣浮點運算能力達 10 Exa-Flops，成功攻克萬卡級硬件篩選、高速互聯、系統級容錯等工程難題，可支撐萬億參數大模型訓練與部署。

軟件與生態優化

集羣守護系統：KUAE RAS System Daemon 可在不影響客戶系統運行的情況下，快速定位並替換故障節點、慢節點、SDC 節點。
推理性能突破：聯合硅基流動完成全棧優化，基於 MTT S5000 AI 加速卡運行 DeepSeek R1 671B 全量模型，單卡 Prefill 吞吐突破 4000 tokens/s，Decode 吞吐突破 1000 tokens/s，支持高併發、低延遲大模型服務。
未來規劃：推出 MTT C256 超級節點產品，通過一層 scale-up 網絡實現兩臺機櫃 256 塊加速卡全互聯，規避多層網絡帶來的帶寬損失與延遲，提升智算集羣 GPU 部署密度。

生態落地：千行百業的算力賦能

大會現場設置超 1000 平方米主題展區，充分展現摩爾線程 GPU 的廣泛落地成果：

工業與邊緣智能

ME10 工業級智算 BOX（天思智慧）：基於 “長江” SoC，最大支持 32GB LPDDR5/5X 內存，具備寬溫適應性與豐富接口，適用於智能製造、智慧城市等領域；
SD5600MX100（國儀海聚）：爲智能系統提供高算力核心，滿足車規、工業自動化、醫療等行業需求，成本控制與 I/O 設計靈活；
柳工 CLG922E 挖掘機：基於 MindEdge L100 邊緣計算平臺，整合設備運行數據與音視頻信息，優化故障診斷、自動駕駛等 AI 模型，解決複雜工況下的安全與能效難題；
盾構機 “盾構大腦”（雪浪雲）：打通七大控制系統與外部感知、運維繫統，打造自適應控制中樞，解決隧道施工 “掘不快、掘不準、掘不穩” 的核心痛點。

端側 AI 終端

B700 AI BOX（聯達興）：支持 4K60Hz 超清雙顯，集成雙千兆網口、Wi-Fi 6、藍牙 5.3，配備專業音頻接口與 DC 供電，適配智能會議、數字標牌等 AIoT 場景；
ME21 AI 迷你機：基於 “長江” SoC，專爲本地大模型部署設計，適用於智能辦公、邊緣計算、AI 教育等場景；
后羿智盒 HOUYI-1000B/HOUYI-Pi-B（全愛科技）：前者爲 3.5 寸工業主板形態，無風扇散熱，支持 32B 大模型端側部署，適用於安防、交通等嚴苛場景；後者體積超小，可廣泛應用於機器人、無人機等設備。

專業計算與仿真

紫光計算機 UltiStation 800H 工作站：旗艦級國產化單路工作站，搭載海光 C86-4G 處理器，最高支持 128GB DDR5 內存與 PCIe 5.0 存儲 / 顯卡，搭配摩爾線程專業顯卡，適用於政府、教育等領域的圖形處理、仿真與 AI 計算；
紫光計算機 100P 智算集羣：基於摩爾線程 MTT S4000，構建高效集羣計算能力；
微視威 eVTOL 全動飛行模擬器：全鏈路自主研發，1:1 封閉座艙與六自由度運動平臺，搭載北京大學 ViWo 引擎視景系統，國內首個通過民航局 5 級鑑定的國產視景系統，已出口海外；基於 MTT X300 專業顯卡打通全國產化視景渲染鏈路，適用於飛行員訓練與機型工程驗證。

行業解決方案

羅拉超算體 LoLR CUBE（法律版 / 財稅版）：搭載 MTT E300 64GB 模組，端側全棧算力支持 300 億大模型推理；法律版閱卷解析快至 10 秒 / 頁，效率提升 100 倍，支持法律文書生成優化；財稅版集成 2000 + 專業指標與 300 億 AI 風控大模型，7X24 小時監控。
景業智能 VR 遙操作機器人系統：適配 MTT E300 模組與 MTT S80 顯卡，操作人員通過 VR 眼鏡遠程控制特種機器人，在輻射等高風險環境完成精細任務，構建超低延遲、高可靠的操控閉環；
景業智能巡檢機器狗：適配 MTT S4000 顯卡，通過 Qwen 大模型部署，具備場景理解與實時推理能力，可自主完成人員識別、隱患排查、設備監測等任務；
中望軟件三維 CAD 解決方案：基於 MTT X300 專業顯卡，適配多款國產 CPU 與操作系統，可流暢渲染複雜三維模型；
ADAI ADXL Pro Max/AD Edit 模型：服務數十萬 C 端用戶與 500 多家行業客戶，累計生成圖像超 8000 萬張，已深度適配摩爾線程 GPU；
北太天元科學計算軟件：國內首款通用型科學計算與系統仿真軟件，全鏈條自主可控，集成 MUSA 加速計算能力，成爲全球首款原生集成 AI 能力的科學計算工具，可全面替代 MATLAB、Simulink；
微眸醫療眼科手術機器人：基於摩爾線程 GPU 實現手術過程本地化實時感知與智能決策，滿足微米級操作精度、高安全性與隱私保護需求。

技術創新應用

物流無人機（紫光計算機）：小載重四旋翼末端配送設備，支持 1 千克包裹運輸，兼容 4G/5G / 專網通信，採用 RTK + 視覺融合精準降落，搭配訂單 APP 與飛行管理平臺，可自主完成投遞任務；
數字人應用：覆蓋文旅、政務、面試培訓等領域，依託摩爾線程 GPU 實現高效渲染與智能交互；
MTVSR 實時視頻超分技術：端側運行，分辨率可提升 2-4 倍，多檔質量可調，將以 SDK 形式支持播放器、瀏覽器等 App 集成。

從 “花港” 架構的全棧突破到三大核心芯片的精準佈局，從端側 AI 設備到十萬卡級智算集羣，從開發者生態構建到千行百業的深度落地，摩爾線程用五年時間完成了國產 GPU 的跨越式發展。這場 MUSA 開發者大會既是成果彙報，更是國產算力突圍的宣言 —— 在主權 AI 的賽道上，摩爾線程正以 “芯 - 邊 - 端 - 雲” 全棧體系，爲算力自主、算法自強、生態自立提供堅實支撐，書寫國產 GPU 的全新篇章。