龙芯3C6000系列揭秘64核超越三代至强只是开始!下代媲美7nm x86

来源——硬件世界

盼望着,盼望着,在众多行业伙伴的见证下,龙芯3C6000系列处理器终于发布了!

可以说,这是龙芯乃至国产芯片历史上的里程碑时刻!

龙芯3C6000系列的诞生,意味着龙芯在经过十多年的“补课”、基本完成单核性能对国际主流水平的追赶之后,开始重点发力多核性能,双轨并举,双管齐下。

同时,龙芯3C6000系列也标志着龙芯开始大规模进军服务器市场,涵盖通用高性能计算服务器、AI智算服务器、存储服务器、密码服务器、工业服务器、网络安全服务器等各种细分领域,也包括工作站。

当然,龙芯3C6000系列也再次证明,从指令集架构、技术,到制造工艺,再到解决方案,走完全国产化之路,不依赖国外技术授权,不依赖境外供应链,是完全走得通的,是完全可以走出一条康庄大道的!

中国科学院计算技术研究所研究员、龙芯总设计师胡伟武介绍,3C6000的性能相当于2023年或者2024年市场主流产品的水平,是一个土生土长的CPU。它没有任何境外技术授权,也不依赖任何境外的供应链,从指令系统到各种IP核都是自己研发出来的。

胡伟武指出,我国信息产业的根本出路在于构建独立于X86和ARM体系之外的第三套生态体系。

因此,龙芯中科坚持自力更生、将自主进行到底,从基于自主IP的芯片研发、基于自主工艺的芯片生产、基于自主指令系统的软件生态三方面打牢自主信息技术体系底座,本次大会发布的龙芯3C6000和2K3000龙芯CPU不依赖任何国外技术授权和境外供应链。

展望未来,美国对华芯片出口限制的升级(如针对AI芯片的性能阈值管控)将倒逼国内加速替代进程,而龙芯作为 “非美技术路线” 的代表,其不受出口管制影响的特性将进一步凸显战略价值。

工业和信息化部电子信息司副司长史惠康在大会致辞中表示,过去,我国指令集架构严重依赖国外授权,今天,基于自主指令集LoongArch的产品不断丰富,背后体现的是自主能力的快速提升。

正是因为底层核心技术CPU指令集架构牢牢掌握在自己手中,才能在桌面计算、服务器集群、工业控制、移动设备等全场景产品矩阵中,既有量的不断扩展,更有质的有效提升,从而实现产业生态跨越式发展,将自主信息技术体系的底座推上了新台阶。

【龙芯3C6000系列技术解析】

龙芯中科董事长胡伟武老师在主题演讲中引用了《大学》中的“知所先后,则近道也”,阐述了龙芯的发展思路。

首先是“先单后多”,也就是首先致力于提升单核性能,夯实基础,然后再增加核心数量,而不是上来就盲目地堆砌核心。

事实上,龙芯在这方面有着惨痛的教训,曾经一度达到“世界先进水平”,距离Intel并不算太遥远,但之后差距反而被不断拉大。

为此,从2010年到2020年,龙芯花了十年时间,专心研究单核性能,也就是改进提升架构设计,核心数最多只有4个,也因此遭来不少质疑,但龙芯都坚持了下来。

2023年,龙芯3A6000发布,单核性能终于达到了国际市场主流水平,“补课”终于完成,可以开始大规模增加核心数,大举进军服务器市场的时机也终于成熟。

其次是“先通后专”,也就是先做好CPU通用处理器,然后再做GPU图形处理器,最后一步则是GPGPU通用目的图形处理器。

做好CPU意味着可以完成数字化,加入GPU就能实现网络化,而加上GPGPU才能完成全面的智能化。

目前,龙芯“三层楼”的第一层已经基本夯实,第二层初见成效,第三层终于开始开工了。这部分我们单独再讲。

龙芯3C6000系列基于和龙芯3A6000相同的第四代微架构“LA664”,采用成熟的1xnm工艺,完全自主。

之所以称其为系列,因为它分为三个不同版本,实现横向扩展。

龙芯3C6000/S是基础版,单颗硅片,FCBGA2422封装,尺寸50×50毫米,最多16核心32线程。

基础主频2.2GHz,32MB三级缓存,四个72位DDR4内存通道,四组PCIe 4.0 x16通道,I/O能力比上代实现数量级的提升,还支持SM2/SM3/SM4国密加解密算法,带宽超过40Gbps,热设计功耗150W,支持双路配置。

龙芯3C6000/D(又称龙芯3D6000)通过LCL龙链技术封装双硅片,达成最多32核心64线程,封装改为FCLGA4129,尺寸75.4×58.5毫米。

基础主频率微降至2.1GHz,三级缓存顺应翻番到64MB,支持八个72位DDR4通道、八组PCIe x16通道,热设计功耗来到220W,可以配置为双路、四路,也是唯一支持四路的。

龙芯3C6000/Q(又称龙芯3E6000)是终极版,通过LCL龙链技术封装四硅片,做到最多64核心128线程,封装为FCLGA6128,尺寸达到75.4×72毫米。

基础主频2.0GHz,三级缓存多达128MB,仍然是四个DDR4通道、八组PCIe通道,而热设计功耗来到300W,最多双路配置。

值得一提的是,龙芯3C6000系列处理器已获得《安全可靠测评公告》当前最高等级Ⅱ级认证,可确保关键领域应用安全。

龙芯3C6000系列的关键核心技术就是LCL龙链,正是有了它才实现了高带宽、低延迟的chiplets芯粒封装。

龙链是龙芯自研的物理层接口,同时兼容PCIe电气标准,可以实现硅片、芯片之间的互联,而且带宽利用率丝毫不弱甚至部分强于Intel、AMD、NVIDIA等巨头的类似互联协议。

它支持高速缓存一致性协议,同时精简了协议,将协议层、链路层合二为一,从而大幅降低延迟,还加入了压缩技术,有效提升带宽效率。

根据中国电子技术标准化研究院赛西实验室测试报告,龙芯3C6000对比上代龙芯3C5000,单核整数、浮点性能分别大幅提升了70%、60%,多核性能更是大幅跃进了3.3倍、2.4倍。

I/O性能同样实现了翻天覆地的变化,磁盘读写速度分别提升提升了惊人的5.4倍、3.5倍,网络磁盘性能同样有着3.7倍、6.2倍的飞跃。

作为第一颗大规模进军服务器市场的芯片,龙芯3C6000系列的野心并不大,将对标竞争对手定位为Intel 2021年4月发布的第三代至强可扩展处理器,用的还是10nm工艺、Ice Lake架构。

别看Intel已经发布了第六代至强6系列,但是服务器和数据中心领域不同于消费级市场,更新换代的节奏并不快。

事实上,直到2023年,三代至强才达到自己的巅峰,出货量超过1000万颗,在Intel至强家族中的占比超过68%,到了2024年依然有29%

下滑这么多,更多还是因为后续四五六代至强的节奏太快了。

龙芯3C6000系列16核心、32核心、64核心各自的对手,分别是16核心2.4GHz的至强银牌4314、32核心2.0GHz的至强金牌6338、40核心2.3GHz的至强铂金8380——因为三代至强最多只有40个核心。

龙芯3C6000系列在核心相同或略多、频率基本相同或略低的情况下,在单核心、多核心整数性能上取得全面领先,单核心、多核心浮点性能差距也不大。

如今服务器配置主流是双路,四路并不太多,但对于需要更高性能、更多扩展的系统来说,四路还是很有必要的。

龙芯3C6000/D组成四路系统后,可以提供多达32个内存通道、32条PCIe通道,优于龙芯3C6000/Q双路的16个内存通道,因此尤为适合需要大内存的场景。

四路龙芯3C6000/D和双路龙芯3C6000/Q同样都是128核心256线程,后者可以达成更高的整数和浮点计算性能。

龙芯3C6000系列还标志着龙芯的另一个转变,那就是从主打自主性,逐步变为主打性价比,只有这样才能打动更多客户、扩大普及规模,毕竟靠情怀买单,市场是不能持久的。

正因如此,目前已有40多家行业伙伴,已经或即将陆续发布基于龙芯3C600系列的板卡和整机产品。

龙芯3C6000系列具备高性能、高可靠、高安全、高能效、低成本的一系列自主可控技术优势,可以打造从16核心到128核心的全栈解决方案,包括单双路龙芯3C6000/S、双四路龙芯3C6000/D、双路龙芯3C6000/Q,匹配多样化的市场需求。

工控服务器、存储服务器、通用计算服务器、AI智算服务器、工作站等等,诸多细分领域,龙芯3C6000都可以轻松满足。

其中,AI智算服务器基于开放平台设计,支持4U4K、4U8卡、8U8模组等不同规格,可以搭配各家的国产AI加速卡,包括但不限于:太初元碁、寒武纪、天数智芯、燧原、昆仑芯、算能、云飞励天、松科智能,等等。

比如中国电信天翼云,承担了央企应有的责任,坚持推动关键领域的自主可控。

天翼云曾批量采购近千台龙芯3C5000服务器,交付后稳定运行超过1000天,充分验证了其高性能与高稳定性。

天翼云的龙芯3C6000/D服务器部署,也正在积极推进中。

龙芯3C600系列虽然刚刚发布,但事实上已经经过了广泛深入的行业验证,并有不少成功案例。

比如中国核建已经阶段性完成下一代核电精益管理平台(RISE)和龙芯3C6000的适配,开始全面支撑中过第三代核电华龙一号的生产建设任务。

再比如高阳科技已经完成基于龙架构的核心交易系统的调优,某头部商城已稳定运行金融核心业务系统,批量采购龙芯3C6000系列服务器。

发布会上,48家企业共同发布了基于龙芯3C6000系列处理器的多款主板、整机及解决方案产品,广泛覆盖党政、国防、金融、能源、电信、云计算、AI等关键领域,其中部分主板和整机核心元器件实现了100%国产化。

这些企业分别是:浪潮计算机、中兴通讯、联想开天、软通计算机、航天706所、超越科技、超云、诚迈科技、云尖、国鑫、国光、宝德网安、207所、中核华辉、升腾、大唐科研总院、太初元碁、华清同创、航天龙梦、联硕、黄河信产、航天联诚、天融信、上海宽域、雷神、腾凌科技、鲸鲨软件、百代存储、上海芮宣、铵泰克、众达科技、湖南兴天、深圳芯创、原基科技、湖南博匠、万数科技、储迹、恒生数字、北联国芯、攀升科技、派能信创、通明智云、国建大数据、擎毅科技、天安星控、中博数智、天创者、云晓科技。

【龙芯3C6000系列生态展示】

本次大会的参展厂商和参会企业名录,其中铂金展位就有29家,黄金展位也有18家,参会企业更是超过了1100家。

龙芯3C6000系列三大成员实物近照,可以直观地感受到其大小差异。

双路龙芯3C6000/D主板。

四路龙芯3C6000/D主板,每路支持八条内存。

单路龙芯3C6000/S服务器。

方案最多的,还是双路龙芯3C6000/D服务器。

双路龙芯3C6000/D搭配六张AI加速卡。

双路龙芯3C6000/D搭配八张AI加速卡。

单路多卡风冷、水冷工作站,可以自由增减加速卡的数量,支持不同国产品牌。

单路服务器。

大家非常熟悉的攀升,也展示了基于龙芯3C6000/D的双路服务器,以及基于龙芯3A6000的台式机、一体机、笔记本。

可惜,现场没看到雷神的展台。

最后和大家分享一下胡伟武老师的演讲总结,总是如此充满激情,令人振奋!

【龙芯官宣第五代CPU微架构:性能提升超30%!媲美x86 7nm】

龙芯新发布的龙芯3C6000系列服务器处理器,和此前的龙芯3A6000桌面端处理器一样,都采用了第四代自研微架构LA664,那么下一步呢?

龙芯3C6000系列发布的同时,龙芯首次官宣了第五代微架构——LA864!

龙芯中科董事长胡伟武在演讲中强调,实现自力更生、自主可控只是第一步,算是零的突破,但要想真正普及开来,还得做到成本更省、性能更高、生态更好。

比如龙芯3A6000比龙芯3A5000硅片面积就缩小了20%,性能则成倍提高。

龙芯3C6000也比龙芯3C5000缩小了20%,性能同样成倍提高。

当然,系统和软件生态在很大程度上比硬件更难做,但只要有了好的硬件,就打下了坚实的基础,应用软件问题将是下一个阶段的发展重点。

LA864作为龙芯的第五代微架构,对比现在的LA664,同频性能将提升30%以上,也就是IPC大涨30%,从而使得每GHz性能达到世界领先行列。

这无疑是非常了不起的,因为提升架构性能要比提升频率、堆砌核心难得多,总是AMD Zen系列架构如此优秀,每次迭代最多也就提升十几二十多个百分点(第一代超过40%是因为推土机太弱了)。

龙芯的一贯劣势就是主频太低了,这也是受制于国产自主工艺,即便是LA864架构也只会提升5-10%,依然不会超过3GHz,但好处是硅片面积只增加区区3%。

同时,LA864架构将实现二进制翻译指令,也就是通过转译层,以更高的性能、更高的效率兼容Windows,从而流畅运行主流桌面应用。

基于LA864架构的下一代处理器公布了三款:

一是龙芯3A6600,面向高性能桌面市场,包括8个通用核心、4个专用核心,理论性能对比龙芯3A6000提升大约25-45%。

二是龙芯3B6600,面向主流桌面,通用核心减半为4个,专用核心还是4个。

三是龙芯3D7000,面向服务器领域,升级国产的xnm,也就是终于进入10nm以下,单硅片核心数量也翻番到32个,继续支持多硅片封装。

短期内,国产芯片在制程工艺方面不太可能和国际水平竞争,所以只能通过不断地设计优化进行弥补,而龙芯的一贯思路,就是坚持自主工艺,不受境外限制。

按照龙芯的说法,LA864架构通过设计优化,可以达到x86 7nm工艺下的水平,这和之前说的追赶12/13代酷睿i5/i7系列,也是同一个意思。

通过二进制翻译,龙芯平台也可以运行x86应用。

尤其是打印机和浏览器两个关键点,龙芯都取得了突破,兼容市面上的几乎所有打印机产品,包括越来越多的国产打印机,而与Windows浏览器的兼容可以大幅降低很多行业业务迁移的适配难度,特别是金融类。

此外,与Windows窗口、文件系统、I/O设备的融合问题,也已经基本解决。

可以说,只要能保证翻译效率,龙芯平台上一样可以获得与Windows下无二的体验。

除了LA864微架构,龙芯也在继续推进其他自主IP核的研发,包括LG210 GPU、PCIe 5.0通道、DDR5/LPDDR5内存。

龙芯3C6000系列用的还是DDR4、PCIe 4.0,落后世界主流一代,接下来的龙芯3D7000就能追上了!

【龙芯2K3000/3B6000M发布:首次一心两用、极致性价比】

相较于耀眼的龙芯3C6000系列,同场发布的龙芯2K3000/3B6000M就低调了很多,但它们同样意义非凡!

龙芯2K3000/3B6000M其实就是同一颗芯片在不同领域的不同名称,其中龙芯2K3000面向工控应用领域,硅片裸露在外,龙芯3B6000M则面向移动终端领域,覆盖了散热顶盖。

龙芯2K3000/3B6000M的研制成功,标志着龙芯经过20多年的积累,已经系统性地掌握了CPU通用处理器、GPU图形处理器、AI处理器、基础软件设计的关键核心基础,巩固已有产品和技术的基础上开始进入大力发展AI能力的新时期。

龙芯2K3000/3B6000M是基于龙芯第四代微架构打造的“三剑客”之一,与服务器市场的龙芯3C6000系列、桌面端的龙芯3A6000有着同等重要的地位,都代表着龙芯从量变到质变的突破。

至此,龙芯通用CPU形成了覆盖桌面、服务器、终端三条线路的完整产品系列,能够为不同领域提供高性能、高性价比的CPU产品。

按照理论性能、成本分析,它们的性价比都达到了上代产品的3倍以上,而性价比将是龙芯下一步所有产品的核心关键点,也是广泛夺取开放市场的制胜因素。

龙芯2K3000/3B6000M拥有八个LA364内核、6MB三级缓存,同时集成GPGPU通用图形与AI处理器LG200、VPU视频处理器、SPU可编程密码安全处理器,具有极高的集成度。

这也是龙芯第一款标配GPGPU的产品,900MHz频率下FP16单精度浮点性能230.4GFlops(2304亿次每秒)、INT8整数性能7.2 TOPS(7.2万亿次每秒)。

VPU视频处理器支持多种格式的硬件编解码,最高可以做到4K60,同时支持eDP+HDMI/DP双路三显输出,最高4K60。

高质量等级的龙芯2K3000,可以在1.1V下做到2.2GHz频率,而商业级的龙芯3B6000M可以达到1.1V电压、2.5GHz频率,并且它们都支持最低0.7V电压的低功耗模式。

内存支持双通道32位LPDDR4、单通道64位DDR4-3200/DDR3-1600。

安全方面集成LA264专用核心,支持可信赖启动,支持SM2/SM3/SM4国密算法,内置可重构密码器。

作为工业用产品,丰富的I/O接口是必不可少的,不但有通用的两组PCIe 3.0 x4(可拆分x2/x1)、四个USB 3.0、两个USB 2.0、一个SATA 3.0 6Gbps,支持HDMI、eDP、DP视频输出和eMMC HS400、两个SDIO存储,还有两个RapidIO(RIO) x4、两个GMAC(RGMII)、一个SPI、一个LPC、七个UART、两个I2C、四个PWM、四个CAN-FD,以及多达58个通用型的GPIO,支持HEPT、RTC、ACPI、DPM等等。

类似服务器领域的龙芯3C6000系列,龙芯2K3000/3B6000M开始,性价比也将取代自主可控,成为工控、终端领域首选龙芯的主要原因。

也正是这一点,吸引了30多家合作伙伴第一时间发布相关板卡、整机产品,涵盖各个品类。

会上,多达35家企业现场发布了基于龙芯2K3000/3B6000M处理器的板卡、工业控制器、工控一体机、工业平板、笔记本、云终端、笔记本等工控及终端产品,具有高性能、高可靠、强安全等特点,适用于复杂工业环境、推理场景,可广泛应用于能源、智能交通、工业化制造等领域。

他们分别是:华龙讯达、盛博科技、道莅智远科技、众达科技、米联客、湖南兴天、国科亿道、北方星空、航宇创通、航力安太、新松佳和、眺望电子、嘉擎信息、中嵌科技、上海宽域、中科云、中邦自控、吉斯凯达、赛飞特、上海合亿、瑞腾信息、国科鸿飞、研域、迅龙软件、艾宝科技、升腾、航天龙梦、卓怡恒通、创智成、六联智能、宝新创、智微智能、高能计算机、麒麟信安、艾讯云。

龙芯2K3000渲染图、实物照。

龙芯3B6000M渲染图、实物照。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com