龍芯3C6000系列揭祕64核超越三代至強只是開始!下代媲美7nm x86

來源——硬件世界

盼望着,盼望着,在衆多行業夥伴的見證下,龍芯3C6000系列處理器終於發佈了!

可以說,這是龍芯乃至國產芯片歷史上的里程碑時刻!

龍芯3C6000系列的誕生,意味着龍芯在經過十多年的“補課”、基本完成單核性能對國際主流水平的追趕之後,開始重點發力多核性能,雙軌並舉,雙管齊下。

同時,龍芯3C6000系列也標誌着龍芯開始大規模進軍服務器市場,涵蓋通用高性能計算服務器、AI智算服務器、存儲服務器、密碼服務器、工業服務器、網絡安全服務器等各種細分領域,也包括工作站。

當然,龍芯3C6000系列也再次證明,從指令集架構、技術,到製造工藝,再到解決方案,走完全國產化之路,不依賴國外技術授權,不依賴境外供應鏈,是完全走得通的,是完全可以走出一條康莊大道的!

中國科學院計算技術研究所研究員、龍芯總設計師胡偉武介紹,3C6000的性能相當於2023年或者2024年市場主流產品的水平,是一個土生土長的CPU。它沒有任何境外技術授權,也不依賴任何境外的供應鏈,從指令系統到各種IP核都是自己研發出來的。

胡偉武指出,我國信息產業的根本出路在於構建獨立於X86和ARM體系之外的第三套生態體系。

因此,龍芯中科堅持自力更生、將自主進行到底,從基於自主IP的芯片研發、基於自主工藝的芯片生產、基於自主指令系統的軟件生態三方面打牢自主信息技術體系底座,本次大會發布的龍芯3C6000和2K3000龍芯CPU不依賴任何國外技術授權和境外供應鏈。

展望未來,美國對華芯片出口限制的升級(如針對AI芯片的性能閾值管控)將倒逼國內加速替代進程,而龍芯作爲 “非美技術路線” 的代表,其不受出口管制影響的特性將進一步凸顯戰略價值。

工業和信息化部電子信息司副司長史惠康在大會致辭中表示,過去,我國指令集架構嚴重依賴國外授權,今天,基於自主指令集LoongArch的產品不斷豐富,背後體現的是自主能力的快速提升。

正是因爲底層核心技術CPU指令集架構牢牢掌握在自己手中,才能在桌面計算、服務器集羣、工業控制、移動設備等全場景產品矩陣中,既有量的不斷擴展,更有質的有效提升,從而實現產業生態跨越式發展,將自主信息技術體系的底座推上了新臺階。

【龍芯3C6000系列技術解析】

龍芯中科董事長鬍偉武老師在主題演講中引用了《大學》中的“知所先後,則近道也”,闡述了龍芯的發展思路。

首先是“先單後多”,也就是首先致力於提升單核性能,夯實基礎,然後再增加核心數量,而不是上來就盲目地堆砌核心。

事實上,龍芯在這方面有着慘痛的教訓,曾經一度達到“世界先進水平”,距離Intel並不算太遙遠,但之後差距反而被不斷拉大。

爲此,從2010年到2020年,龍芯花了十年時間,專心研究單核性能,也就是改進提升架構設計,核心數最多隻有4個,也因此遭來不少質疑,但龍芯都堅持了下來。

2023年,龍芯3A6000發佈,單核性能終於達到了國際市場主流水平,“補課”終於完成,可以開始大規模增加核心數,大舉進軍服務器市場的時機也終於成熟。

其次是“先通後專”,也就是先做好CPU通用處理器,然後再做GPU圖形處理器,最後一步則是GPGPU通用目的圖形處理器。

做好CPU意味着可以完成數字化,加入GPU就能實現網絡化,而加上GPGPU才能完成全面的智能化。

目前,龍芯“三層樓”的第一層已經基本夯實,第二層初見成效,第三層終於開始開工了。這部分我們單獨再講。

龍芯3C6000系列基於和龍芯3A6000相同的第四代微架構“LA664”,採用成熟的1xnm工藝,完全自主。

之所以稱其爲系列,因爲它分爲三個不同版本,實現橫向擴展。

龍芯3C6000/S是基礎版,單顆硅片,FCBGA2422封裝,尺寸50×50毫米,最多16核心32線程。

基礎主頻2.2GHz,32MB三級緩存,四個72位DDR4內存通道,四組PCIe 4.0 x16通道,I/O能力比上代實現數量級的提升,還支持SM2/SM3/SM4國密加解密算法,帶寬超過40Gbps,熱設計功耗150W,支持雙路配置。

龍芯3C6000/D(又稱龍芯3D6000)通過LCL龍鏈技術封裝雙硅片,達成最多32核心64線程,封裝改爲FCLGA4129,尺寸75.4×58.5毫米。

基礎主頻率微降至2.1GHz,三級緩存順應翻番到64MB,支持八個72位DDR4通道、八組PCIe x16通道,熱設計功耗來到220W,可以配置爲雙路、四路,也是唯一支持四路的。

龍芯3C6000/Q(又稱龍芯3E6000)是終極版,通過LCL龍鏈技術封裝四硅片,做到最多64核心128線程,封裝爲FCLGA6128,尺寸達到75.4×72毫米。

基礎主頻2.0GHz,三級緩存多達128MB,仍然是四個DDR4通道、八組PCIe通道,而熱設計功耗來到300W,最多雙路配置。

值得一提的是,龍芯3C6000系列處理器已獲得《安全可靠測評公告》當前最高等級Ⅱ級認證,可確保關鍵領域應用安全。

龍芯3C6000系列的關鍵核心技術就是LCL龍鏈,正是有了它才實現了高帶寬、低延遲的chiplets芯粒封裝。

龍鏈是龍芯自研的物理層接口,同時兼容PCIe電氣標準,可以實現硅片、芯片之間的互聯,而且帶寬利用率絲毫不弱甚至部分強於Intel、AMD、NVIDIA等巨頭的類似互聯協議。

它支持高速緩存一致性協議,同時精簡了協議,將協議層、鏈路層合二爲一,從而大幅降低延遲,還加入了壓縮技術,有效提升帶寬效率。

根據中國電子技術標準化研究院賽西實驗室測試報告,龍芯3C6000對比上代龍芯3C5000,單核整數、浮點性能分別大幅提升了70%、60%,多核性能更是大幅躍進了3.3倍、2.4倍。

I/O性能同樣實現了翻天覆地的變化,磁盤讀寫速度分別提升提升了驚人的5.4倍、3.5倍,網絡磁盤性能同樣有着3.7倍、6.2倍的飛躍。

作爲第一顆大規模進軍服務器市場的芯片,龍芯3C6000系列的野心並不大,將對標競爭對手定位爲Intel 2021年4月發佈的第三代至強可擴展處理器,用的還是10nm工藝、Ice Lake架構。

別看Intel已經發布了第六代至強6系列,但是服務器和數據中心領域不同於消費級市場,更新換代的節奏並不快。

事實上,直到2023年,三代至強才達到自己的巔峯,出貨量超過1000萬顆,在Intel至強家族中的佔比超過68%,到了2024年依然有29%

下滑這麼多,更多還是因爲後續四五六代至強的節奏太快了。

龍芯3C6000系列16核心、32核心、64核心各自的對手,分別是16核心2.4GHz的至強銀牌4314、32核心2.0GHz的至強金牌6338、40核心2.3GHz的至強鉑金8380——因爲三代至強最多隻有40個核心。

龍芯3C6000系列在覈心相同或略多、頻率基本相同或略低的情況下,在單核心、多核心整數性能上取得全面領先,單核心、多核心浮點性能差距也不大。

如今服務器配置主流是雙路,四路並不太多,但對於需要更高性能、更多擴展的系統來說,四路還是很有必要的。

龍芯3C6000/D組成四路系統後,可以提供多達32個內存通道、32條PCIe通道,優於龍芯3C6000/Q雙路的16個內存通道,因此尤爲適合需要大內存的場景。

四路龍芯3C6000/D和雙路龍芯3C6000/Q同樣都是128核心256線程,後者可以達成更高的整數和浮點計算性能。

龍芯3C6000系列還標誌着龍芯的另一個轉變,那就是從主打自主性,逐步變爲主打性價比,只有這樣才能打動更多客戶、擴大普及規模,畢竟靠情懷買單,市場是不能持久的。

正因如此,目前已有40多家行業夥伴,已經或即將陸續發佈基於龍芯3C600系列的板卡和整機產品。

龍芯3C6000系列具備高性能、高可靠、高安全、高能效、低成本的一系列自主可控技術優勢,可以打造從16核心到128核心的全棧解決方案,包括單雙路龍芯3C6000/S、雙四路龍芯3C6000/D、雙路龍芯3C6000/Q,匹配多樣化的市場需求。

工控服務器、存儲服務器、通用計算服務器、AI智算服務器、工作站等等,諸多細分領域,龍芯3C6000都可以輕鬆滿足。

其中,AI智算服務器基於開放平臺設計,支持4U4K、4U8卡、8U8模組等不同規格,可以搭配各家的國產AI加速卡,包括但不限於:太初元碁、寒武紀、天數智芯、燧原、崑崙芯、算能、雲飛勵天、松科智能,等等。

比如中國電信天翼雲,承擔了央企應有的責任,堅持推動關鍵領域的自主可控。

天翼雲曾批量採購近千臺龍芯3C5000服務器,交付後穩定運行超過1000天,充分驗證了其高性能與高穩定性。

天翼雲的龍芯3C6000/D服務器部署,也正在積極推進中。

龍芯3C600系列雖然剛剛發佈,但事實上已經經過了廣泛深入的行業驗證,並有不少成功案例。

比如中國核建已經階段性完成下一代核電精益管理平臺(RISE)和龍芯3C6000的適配,開始全面支撐中過第三代核電華龍一號的生產建設任務。

再比如高陽科技已經完成基於龍架構的核心交易系統的調優,某頭部商城已穩定運行金融核心業務系統,批量採購龍芯3C6000系列服務器。

發佈會上,48家企業共同發佈了基於龍芯3C6000系列處理器的多款主板、整機及解決方案產品,廣泛覆蓋黨政、國防、金融、能源、電信、雲計算、AI等關鍵領域,其中部分主板和整機核心元器件實現了100%國產化。

這些企業分別是:浪潮計算機、中興通訊、聯想開天、軟通計算機、航天706所、超越科技、超雲、誠邁科技、雲尖、國鑫、國光、寶德網安、207所、中核華輝、升騰、大唐科研總院、太初元碁、華清同創、航天龍夢、聯碩、黃河信產、航天聯誠、天融信、上海寬域、雷神、騰凌科技、鯨鯊軟件、百代存儲、上海芮宣、銨泰克、衆達科技、湖南興天、深圳芯創、原基科技、湖南博匠、萬數科技、儲跡、恒生數字、北聯國芯、攀升科技、派能信創、通明智雲、國建大數據、擎毅科技、天安星控、中博數智、天創者、雲曉科技。

【龍芯3C6000系列生態展示】

本次大會的參展廠商和參會企業名錄,其中鉑金展位就有29家,黃金展位也有18家,參會企業更是超過了1100家。

龍芯3C6000系列三大成員實物近照,可以直觀地感受到其大小差異。

雙路龍芯3C6000/D主板。

四路龍芯3C6000/D主板,每路支持八條內存。

單路龍芯3C6000/S服務器。

方案最多的,還是雙路龍芯3C6000/D服務器。

雙路龍芯3C6000/D搭配六張AI加速卡。

雙路龍芯3C6000/D搭配八張AI加速卡。

單路多卡風冷、水冷工作站,可以自由增減加速卡的數量,支持不同國產品牌。

單路服務器。

大家非常熟悉的攀升,也展示了基於龍芯3C6000/D的雙路服務器,以及基於龍芯3A6000的臺式機、一體機、筆記本。

可惜,現場沒看到雷神的展臺。

最後和大家分享一下胡偉武老師的演講總結,總是如此充滿激情,令人振奮!

【龍芯官宣第五代CPU微架構:性能提升超30%!媲美x86 7nm】

龍芯新發布的龍芯3C6000系列服務器處理器,和此前的龍芯3A6000桌面端處理器一樣,都採用了第四代自研微架構LA664,那麼下一步呢?

龍芯3C6000系列發佈的同時,龍芯首次官宣了第五代微架構——LA864!

龍芯中科董事長鬍偉武在演講中強調,實現自力更生、自主可控只是第一步,算是零的突破,但要想真正普及開來,還得做到成本更省、性能更高、生態更好。

比如龍芯3A6000比龍芯3A5000硅片面積就縮小了20%,性能則成倍提高。

龍芯3C6000也比龍芯3C5000縮小了20%,性能同樣成倍提高。

當然,系統和軟件生態在很大程度上比硬件更難做,但只要有了好的硬件,就打下了堅實的基礎,應用軟件問題將是下一個階段的發展重點。

LA864作爲龍芯的第五代微架構,對比現在的LA664,同頻性能將提升30%以上,也就是IPC大漲30%,從而使得每GHz性能達到世界領先行列。

這無疑是非常了不起的,因爲提升架構性能要比提升頻率、堆砌核心難得多,總是AMD Zen系列架構如此優秀,每次迭代最多也就提升十幾二十多個百分點(第一代超過40%是因爲推土機太弱了)。

龍芯的一貫劣勢就是主頻太低了,這也是受制於國產自主工藝,即便是LA864架構也只會提升5-10%,依然不會超過3GHz,但好處是硅片面積只增加區區3%。

同時,LA864架構將實現二進制翻譯指令,也就是通過轉譯層,以更高的性能、更高的效率兼容Windows,從而流暢運行主流桌面應用。

基於LA864架構的下一代處理器公佈了三款:

一是龍芯3A6600,面向高性能桌面市場,包括8個通用核心、4個專用核心,理論性能對比龍芯3A6000提升大約25-45%。

二是龍芯3B6600,面向主流桌面,通用核心減半爲4個,專用核心還是4個。

三是龍芯3D7000,面向服務器領域,升級國產的xnm,也就是終於進入10nm以下,單硅片核心數量也翻番到32個,繼續支持多硅片封裝。

短期內,國產芯片在製程工藝方面不太可能和國際水平競爭,所以只能通過不斷地設計優化進行彌補,而龍芯的一貫思路,就是堅持自主工藝,不受境外限制。

按照龍芯的說法,LA864架構通過設計優化,可以達到x86 7nm工藝下的水平,這和之前說的追趕12/13代酷睿i5/i7系列,也是同一個意思。

通過二進制翻譯,龍芯平臺也可以運行x86應用。

尤其是打印機和瀏覽器兩個關鍵點,龍芯都取得了突破,兼容市面上的幾乎所有打印機產品,包括越來越多的國產打印機,而與Windows瀏覽器的兼容可以大幅降低很多行業業務遷移的適配難度,特別是金融類。

此外,與Windows窗口、文件系統、I/O設備的融合問題,也已經基本解決。

可以說,只要能保證翻譯效率,龍芯平臺上一樣可以獲得與Windows下無二的體驗。

除了LA864微架構,龍芯也在繼續推進其他自主IP核的研發,包括LG210 GPU、PCIe 5.0通道、DDR5/LPDDR5內存。

龍芯3C6000系列用的還是DDR4、PCIe 4.0,落後世界主流一代,接下來的龍芯3D7000就能追上了!

【龍芯2K3000/3B6000M發佈:首次一心兩用、極致性價比】

相較於耀眼的龍芯3C6000系列,同場發佈的龍芯2K3000/3B6000M就低調了很多,但它們同樣意義非凡!

龍芯2K3000/3B6000M其實就是同一顆芯片在不同領域的不同名稱,其中龍芯2K3000面向工控應用領域,硅片裸露在外,龍芯3B6000M則面向移動終端領域,覆蓋了散熱頂蓋。

龍芯2K3000/3B6000M的研製成功,標誌着龍芯經過20多年的積累,已經系統性地掌握了CPU通用處理器、GPU圖形處理器、AI處理器、基礎軟件設計的關鍵核心基礎,鞏固已有產品和技術的基礎上開始進入大力發展AI能力的新時期。

龍芯2K3000/3B6000M是基於龍芯第四代微架構打造的“三劍客”之一,與服務器市場的龍芯3C6000系列、桌面端的龍芯3A6000有着同等重要的地位,都代表着龍芯從量變到質變的突破。

至此,龍芯通用CPU形成了覆蓋桌面、服務器、終端三條線路的完整產品系列,能夠爲不同領域提供高性能、高性價比的CPU產品。

按照理論性能、成本分析,它們的性價比都達到了上代產品的3倍以上,而性價比將是龍芯下一步所有產品的核心關鍵點,也是廣泛奪取開放市場的制勝因素。

龍芯2K3000/3B6000M擁有八個LA364內核、6MB三級緩存,同時集成GPGPU通用圖形與AI處理器LG200、VPU視頻處理器、SPU可編程密碼安全處理器,具有極高的集成度。

這也是龍芯第一款標配GPGPU的產品,900MHz頻率下FP16單精度浮點性能230.4GFlops(2304億次每秒)、INT8整數性能7.2 TOPS(7.2萬億次每秒)。

VPU視頻處理器支持多種格式的硬件編解碼,最高可以做到4K60,同時支持eDP+HDMI/DP雙路三顯輸出,最高4K60。

高質量等級的龍芯2K3000,可以在1.1V下做到2.2GHz頻率,而商業級的龍芯3B6000M可以達到1.1V電壓、2.5GHz頻率,並且它們都支持最低0.7V電壓的低功耗模式。

內存支持雙通道32位LPDDR4、單通道64位DDR4-3200/DDR3-1600。

安全方面集成LA264專用核心,支持可信賴啓動,支持SM2/SM3/SM4國密算法,內置可重構密碼器。

作爲工業用產品,豐富的I/O接口是必不可少的,不但有通用的兩組PCIe 3.0 x4(可拆分x2/x1)、四個USB 3.0、兩個USB 2.0、一個SATA 3.0 6Gbps,支持HDMI、eDP、DP視頻輸出和eMMC HS400、兩個SDIO存儲,還有兩個RapidIO(RIO) x4、兩個GMAC(RGMII)、一個SPI、一個LPC、七個UART、兩個I2C、四個PWM、四個CAN-FD,以及多達58個通用型的GPIO,支持HEPT、RTC、ACPI、DPM等等。

類似服務器領域的龍芯3C6000系列,龍芯2K3000/3B6000M開始,性價比也將取代自主可控,成爲工控、終端領域首選龍芯的主要原因。

也正是這一點,吸引了30多家合作伙伴第一時間發佈相關板卡、整機產品,涵蓋各個品類。

會上,多達35家企業現場發佈了基於龍芯2K3000/3B6000M處理器的板卡、工業控制器、工控一體機、工業平板、筆記本、雲終端、筆記本等工控及終端產品,具有高性能、高可靠、強安全等特點,適用於複雜工業環境、推理場景,可廣泛應用於能源、智能交通、工業化製造等領域。

他們分別是:華龍訊達、盛博科技、道蒞智遠科技、衆達科技、米聯客、湖南興天、國科億道、北方星空、航宇創通、航力安太、新松佳和、眺望電子、嘉擎信息、中嵌科技、上海寬域、中科雲、中邦自控、吉斯凱達、賽飛特、上海合億、瑞騰信息、國科鴻飛、研域、迅龍軟件、艾寶科技、升騰、航天龍夢、卓怡恆通、創智成、六聯智能、寶新創、智微智能、高能計算機、麒麟信安、艾訊雲。

龍芯2K3000渲染圖、實物照。

龍芯3B6000M渲染圖、實物照。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com