AMD 正传:苏姿丰时代

来源——头发实验室

上一回我们介绍了 AMD 的黑暗时代。尽管苏姿丰(Lisa Su)博士带领 AMD 走出黑暗有目共睹。但实际上,在苏姿丰接任 CEO 的前两年,AMD 的情况并没有好转,反而越来越糟糕了。
本文将带您回顾自2014年以来,AMD在苏姿丰博士的带领下筚路蓝缕的极限翻盘之路。

苏博士的决定

1969年出生于台**南,3岁时随父母移居美国。

本科至博士均就读于麻省理工学院(MIT),主修电机工程,1994年获得博士学位,研究方向为硅绝缘体(SOI)技术

自小对工程充满兴趣,10岁时便开始拆解并修复电子玩具。

苏姿丰职业生涯的第一站是德州仪器(1994-1995),但很快入职 IBM 并历任多个工程与管理职位(1995-2007),最终担任半导体研发中心副总裁,领导硅技术和研发战略。

在 IBM 期间领导了用于索尼游戏主机的芯片 Cell 的开发并对chiplets 技术有所研究;她更是担任 IBM CEO 郭士纳的助理,耳闻目睹了后者是如何管理这个蓝色巨人。这两个关键履历对她日后能够“拯救”AMD至关重要。

此后,她入职原摩托罗拉半导体部分飞思卡尔(Freescale Semiconductor)担任首席技术官(CTO)及网络与多媒体业务高级副总裁,负责技术路线图和全球战略。在此期间,她结识了同在飞思卡尔的 Intel 现任 CEO 陈立武。

截至到2012年,苏姿丰的职业生涯不可谓不完美。但这一年,她做出了一个令许多人惊讶的决定:加入 AMD。


苏姿丰成为CEO时,AMD每股股价已不足5美元

当时,苏姿丰的朋友圈大都并不理解。苏的职业生涯导师提醒她,这不利于她的职业生涯,并且对她领导AMD「对抗英特尔」感到不可思议。

显然,当时业内没什么人认为 AMD 会翻盘。不过有趣的是,我们前文提到过的陈立武倒是鼓励苏姿丰“接受挑战”。


苏在后来的采访中透露,她认为 AMD 是巨大的潜力股,它拥有苏姿丰看好的资源(笔者注:指 AMD 是当时世界上唯一有能力同时制造CPU与高性能GPU的半导体公司),只不过没有发挥好。

2012年苏姿丰刚加入AMD,就为其带来了一个难得的赚钱的业务——以优惠的价格和高度宽松的定制条款,拿下了索尼PS游戏主机芯片的大单,随后又获得了微软游戏主机XBOX的青睐。苏姿丰在IBM时参与过游戏主机CPU Cell的研发工作,此经历可能帮助她能够为AMD获得类似订单。

目标,活下去

在游戏主机领域,原本不被市场青睐的APU获得新生——异构统一内存架构正是游戏主机芯片需要的技术。AMD采用了田忌赛马的战术:虽然我CPU不如Intel,但iGPU比它强;虽然我GPU不如NVIDIA,但它的CPU不如我。

这颗为PS4定制的APU,其CPU部分采用Jaguar架构,GPU部分是20CU的GCN架构。这两个当初原没能带来利润的架构,也都在游戏主机里焕发了新生。

当然,AMD能拿下索尼PS和微软XBOX的原因还在于,N/I两家彼时都如日中天,而定制业务是反规模效应的。老黄全力梭哈CUDA,能够提供半定制的空间不大,报价也不美丽;Intel报价同样不低,而且Intel核显打游戏还是太弱了。

主机半定制业务几乎在当时一众亏损的各个业务中一枝独秀,为 AMD 赢得了宝贵的喘息之机。

不过,苏姿丰此时同时将市场目标对准了数据中心。为此,AMD 需要一大笔资金支撑一款高性能 CPU 架构的研发。但在此之前,AMD 还有一个更为迫切的目标——活下去。

为此,苏开始了她的开源节流三部曲:

第一步,大砍项目,裁员,精简开支。

硅仙人(Jim Keller)负责的K12也在其中,JK后来带着K12的部分成员和成果加入了Zen项目组(所以,将Jim Keller称为Zen架构之父是不正确的,Jim Keller 第二次加入 AMD 后,并没有负责Zen架构的开发,他介入Zen项目组是后来的事。Mike Clark 更有资格获得 ‘Zen Daddy’ 的称号 )。

第二步,卖大楼。

AMD于2013年第一季度将位于德克萨斯州奥斯汀的总部大楼卖给了一家房地产公司,获得现金1.64亿美元,然后租回原来的大楼。就是说,虽然AMD把自家办公楼卖了,但不必搬迁另寻他处。

AMD选择卖大楼的时机非常不错,当时奥斯汀房地产市场繁荣,这才使得 AMD 卖大楼如此顺利。

第三步,开授权,办合资。

至2016年,Zen架构产品面世前夕,AMD仍然在继续亏损,原有产品组合在全球市场占有率已跌破5%,公司已经处于崩溃的边缘。

在这种情况下,苏姿丰大胆地将尚未面世的Zen架构向中国推销。最终,中科海光以2.93亿美元获得了AMD Zen架构的永久授权。注意,是初代Zen架构的永久授权。

这里需要说明几点:

首先,中科海光和AMD是通过一系列复杂的股权架构,成立了数家经营实体,分别负责两家公司相关IP的交叉授权买卖、CPU生产制造、产品销售等不同环节的。此举可能是为了规避美国政府的一些限制。但总之,在这场交易中,海光获得了Zen架构的技术授权和在中国大陆的销售许可;AMD获得了一笔可观的救命钱。

其次,中科海光只是获得了Zen架构的永久授权,并非x86指令集相关知识产权的永久授权。

第三,根据相关协议,海光虽然可以有限度地集成一部分自主设计,却不能自由地修改CPU核心部分。其关键部分只能由AMD指定的GF负责生产,不得交给其他代工厂。不过,该协议的更多细节,我们就不知道了。

2015年,AMD还与中国企业通富微电成立了合资公司,负责集成电路封装测试。与此同时,AMD将中国苏州(就是Ruiz当年推行中国战略时设立的部门)和马来西亚槟城的制造部门移交给新的合资公司,获得收益3.2亿美元

正是这两个极限操作,使得AMD顶着巨额亏损全力推进Zen架构研发,苏妈领导下的AMD挺过了黎明前最后的黑暗。

除此之外,AMD还通过技术外包等操作,精简了自己的工程研发队伍——把PC和服务器平台所需的桥片外包。

超能网2012年的报道

有迹象表明,苏姿丰在此前的职业生涯中,就结识了中国台湾的林哲伟。

林哲伟是2000年前后台湾VIA威盛科技的一个部门经理,曾负责过x86芯片组和各种IO控制器芯片的研发。2007年,林从VIA离职。不久,林带着原VIA部门的技术骨干,加入了华硕旗下新成立的芯片研发公司ASMedia(祥硕)。

插播一条八卦:因为林以及原VIA部分成员的跳槽,还引发了VIA和ASMedia的官司,甚至在2008年闹出了台JF包围祥硕总部大楼的大新闻。

有传闻称(注:这部分我没查到相关新闻),林在2012年苏姿丰加入AMD之后,就开始“忽悠”时任副总裁苏妈,力劝AMD专注于CPU等高性能计算芯片研发,将桥片外包给祥硕……

苏显然是听进去了,从Zen架构发布开始,自桌面平台至HEDT/服务器平台的大部分FCH(Fusion Controller Hub,即南桥,相当于Intel的PCH),都交给了祥硕操刀。

野望:三大战略

AMD 在 2006年之后,在CPU领域几乎都采取比较保守的策略。

农用机械架构,本质上是希望以较小的面积换多核性能,成本优先取向明显;Jaguar等猫系小核主打低功耗但也低性能;ARM 战略初代采用的是 Cortex-A57 架构,熟悉数码的朋友都知道,这玩意就是手机上的“小核”,哪怕高端一些的家用路由器ARM核心都比这强。

而苏姿丰反其道而行之,她一直强调的一个词是:High Performance Computing。并且,还特地强调了HPC战略聚焦的三大目标市场:数据中心、游戏、沉浸式场景。 苏认为,这是时下三个高增长、高利润的领域,拿下这几个高利润市场,才是扭亏为盈的关键。

但若只有目标和口号,当然不可能成功。她上任时接受采访时提出了上述目标,许多人认为,这不过是车轱辘话罢了。AMD 已经濒临破产了,哪来的能力搞HPC?

我们现在知道,她带领AMD做到了。

我认为,苏姿丰成功的关键,有以下几点。

第一点,苏在裁员的同时,也大幅简化了公司的组织架构和管理流程,有效地增强了AMD的公司治理。

得益于此,AMD保持了一个精简、高效的研发队伍。苏姿丰还在Mike Clark、Mark Papermaster、 Jim Keller 等人的帮助下,重组了技术团队,使之可以紧密协作,快速反应。

Jim Keller 在从AMD离职数年后,在一次采访中还提到,Zen 架构能够成功,与研发团队采用了新的组织形式密不可分。也有其他AMD离职高管接受采访时提到,苏姿丰对AMD的管理是“高压”、“高期望值”的,这可能也是AMD能够走出亏损的关键。

软件架构师届不是也有一句名言么:“组织架构即系统架构”。

我本人没有搜索到确切的 AMD、Intel、Qualcomm 的 CPU 工程技术团队规模对比。但有资料说,至 2022年,AMD 的 Zen 架构团队人数仅有Intel的约20%。要知道,2022年,已经是 Zen4 年份,比起2017年团队规模增加了许多。

至少从人力配比上而言,AMD 以这么少的人力,能够做出Zen系列CPU,也显示出了其团队的高效。而这,得益于外界不常提到、详细资料甚少的管理上的改革。

第二点,苏非常重视维护客户关系。

苏执掌AMD以来,对团队和业界反复强调的一件事就是“交付纪律”,即按时交付达到预期目标的产品。这可能是吸取当年K10延期、翻车的教训。这种交付纪律的树立,极大地改善了AMD的商业声誉以及在大客户中的口碑。这也是AMD能不断蚕食这个Intel占99%份额市场的关键因素。

而几乎同时期的反面教材则是Intel——

由于10nm延期,Intel 无法按时向 Nokia 交付 用于 5G RAN 的芯片,这直接导致了 Nokia 在欧美的 5G 建设浪潮中丢失大量市场。时任 Nokia 总裁 Rajeev Suri 不得不因为此事于2020年下台。

同样由于 Intel 10nm 进度不利,Cannon Lake 仅以个别低功耗产品、以极低的出货量出现在笔记本市场;受制于 10nm 性能和良率, Ice Lake-X也一再被推迟。Intel不得不在数据中心和HEDT领域推出14nm的Cascade Lake(Sky Lake-X的变体,并不是新一代架构)应对市场。

尽管AMD的客户支持还不如Intel成熟,初代 Zen 架构还存在一些小问题。但这一正一反对比之下,一些原本Intel的数据中心领域的大客户,仍然开始转向AMD下单。

苏对客户关系的重视,还表现在对客户需求的重视方面。

我个人猜测,APU、AMD-ARM CPU 之所以没能成功,主要原因就是没能深入市场调研和倾听客户的需求,最终做出的东西并不是客户急需的,自然也推不开。

而苏上任后,对最看重的数据中心市场,进行了深入的需求调研,最终确定了重视多核性能、IO密集、重视功耗控制等设计目标。

这才有了初代 EPYC,32核、8内存通道、128条PCIe 3.0——它最初在性能上未必比 Skylake-X 更强,但合理的报价和刚好命中需求,使得Zen架构初期即获得了不错的订单量。

第三点,用她的原话是:打造卓越的产品。 所谓卓越产品,就是高品质、高利润的产品。

其实核心(至少在最初阶段)还是Zen架构,并且把之前的所有其他研发,什么猫系、ARM K12、APU,全部暂停。由 Zen 架构通吃桌面、数据中心/服务器、嵌入式、笔电、半定制主机芯片这些所有领域——打得一拳开,免得百拳来。

Zen 架构的商业逻辑

Zen 架构最初的研发并非一帆风顺,即使在AMD内部也面临强大的质疑,一度导致连续三位高管从 AMD 离职。

Zen 架构核心的小芯片(chiplets)架构与其背后的 Infinity Fabric 互联技术,也反应了苏姿丰在技术和商业上的双重远见。

随着芯片面积的增加,芯片的良率会逐渐下降,叠加每晶圆产出芯片的减少,其生产成本是指数级提高的。这也是 Intel 在 Xeon 长期(2020年之前)停留在单路28核的重要原因。

Naples Substrate Shot

而chiplets架构将CPU的cores、uncore 等拆在了不同的小芯片上,其研发、验证和制造流程与monolithic chip 有显著的不同。并且,如何将这些模块高效地互联在一起,不会造成通信不稳定或性能瓶颈,也是一个重要的难题。

当时,Intel 和台积电都分别有各自的先进封装技术,解决这类问题,比如Intel的EMIB、台积电的CoWoS。但Zen架构出于成本考虑,采用了最直接的2D封装——所有DIE没有任何中介层,直接将导线埋入高密度PCB板(Substrate)上,也被戏称为“胶水大法”,前文中提到的 Pentium D 就是这种。

有未经证实的传言称,当 Intel 在得知 AMD 正在研发的架构是如此“胶水”时,曾进行过评估。

Intel 技术团队得出的结论是,这种互联技术将不仅功耗高、互联密度低,并且通信延迟过高。这些劣势将限制CPU架构性能,因此,Zen架构后续产品并不能对Intel构成威胁。

Navi31

AMD后来的 GPU Navi 32,只是采用了台积电相对廉价的 InFO-R(其互联介质层是一种有机物,不是硅,因此成本比CoWoS-oS低得多),就声称把IO密度提高了10倍;Ryzen 自从 Zen2 以来,也一直存在内存延迟偏高的问题;另有研究指出,基于高密度PCB的数据传输,每bit消耗能量是硅中介层、垂直硅通孔的10倍不止。

尽管这种封装有这样或那样的问题,AMD仍然凭借优秀的通信架构设计与核心架构设计,尽可能扬长避短,使得这项技术的收益总体大于缺陷。

AMD 还凭借一套统一的 serdes,同时支持了 PCIe、USB、D2D 等不同的IO场景。

Infinity Fabric 也从D2D扩展到NUMA乃至机架级的通信,成为AMD在HPC领域有资本在NVIDIA地盘抢占市场的基石。

而这一切,都始于苏姿丰上任以来对这几项关键技术的押注。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com