知名科技公司英偉達,市值突破了4萬億美元,超過微軟和蘋果,成爲全球市值最高的公司,在過去的30年時間裏,英偉達從一家開發圖形處理遊戲顯卡的小公司,一路成長爲全球AI巨擘!歡迎大家來到老黃髮家史的第十期,今天承接前九期內容,繼續聊老黃的創業史!
![]()
01 至暗時刻
上文講到英偉達初代Xbox供貨後與微軟分道揚鑣,
微軟轉投ATI,老黃尋求破局之道,
開始祕密啓動CUDA項目,調動1200名工程師投入研發,
但導致遊戲業務擱置、顯卡成本激增,
爆發“凸點門事件”,英偉達股價暴跌,
斯坦福大學計算機系主任比爾·戴利加入英偉達,
召開全球的GTC學術大會,推銷CUDA英偉達科學計算,
2009年,CUDA下載量達30萬次後連續3年下滑,
2012年僅10萬次新安裝,
華爾街嘲諷老黃,英偉達的科學計算是小衆市場,
投入數十億美元純屬浪費,
投資人傑夫·史密斯做空英偉達,
要求砍掉CUDA、專注遊戲顯卡,
與此同時英偉達大股東富達(Fidelity)以撤資威脅英偉達,
此時英偉達外部有AMD競爭,內部員工股東不和,
老黃再次陷入了至暗時刻。
![]()
02 堅持CUDA
平日裏,老黃每週工作80小時,錯過了自己兒女的成長時光,
老黃的兒子赴芝加哥藝術學院學攝影,
女兒遠赴巴黎藍帶學院學烹飪,
老黃的愛犬"壽司"也在此時離世,
沒有人可以幫助老黃分擔壓力,
危機之中,老黃仍然將CUDA視爲核心戰略,
在英偉達董事會成員吉姆·蓋瑟律師的斡旋下,
黃仁勳親赴波士頓與富達一方會面,
然後再前往紐約接連拜會了其他6家機構的投資者,
竭盡全力遊說這些金融巨頭支持CUDA。
老黃掛在嘴邊最多的一本書是《創新者的窘境》,
他經常給華爾街講書中真實的案例,
比如17世紀初期,荷蘭的工匠在眼鏡製造過程中意識到,
重新排列鏡片便能觀察遠處的物體,
於是這些工匠向荷蘭專利局提交了大量的望遠鏡設計方案,
他們自身只懂製造望遠鏡的技術,不懂任何天文知識,
然而短短一年內,伽利略便用其中一款望遠鏡觀測星空,
成爲首位描繪金星相位、木星衛星以及土星光環的人,
老黃自比是17世紀的工匠,
英偉達的CUDA就是給全球的科學家提供低成本的超級計算機,
然後引發一場類似的跨時代的技術躍遷!
![]()
03 內心的茫然
很多人認爲老黃如此堅持CUDA,
他的內心裏一定有一條直通AI的技術路線,
不過老黃接受採訪時坦白,他其實對未來的技術沒有明確的構想,
老黃還把自己和馬斯克對比,
老馬先從設想自己站在火星表面的場景開始,
然後逆向構建所需技術去實現目標,
老黃自己則恰恰相反,他從眼前電路的功能出發,
極力向前推測潛能,把自己侷限在理性的邊界內,
只允許稍作逾越,涉足其他朦朧未知的領域。
這種內心中的迷茫,老黃自然不會告訴華爾街,
但他依然堅持CUDA技術,尊重科學家們的觀點,
每次開發佈會或者GTC大會時,
營銷人員、新聞媒體總是被安排在後排,科學家則位居前列。
![]()
到了2010年左右,
老黃冥冥之中突然感受到了突破的曙光,
原來在與比爾·戴利、約翰·尼科爾斯和伊恩·巴克這些科學家交流時,
他能感受到這些天才們的熱忱,
多年以後老黃回憶,正是這些感受,
足以讓他毅然割捨部分利潤,去探索未來,
老黃深信在某處,定有某位研究人員將跳過大學裏的煩瑣官L,
通過攢錢購買一塊英偉達GPU,從而掀起一場技術革命,
只是在當時,老黃還不知道哪個角落會有這樣的奇蹟誕生。
![]()
04 技術偶然
當我們在回顧人類這場AI算力的技術革命,
會發現很多非常偶然、非常有趣的事情,
那就是這場技術革命中有太多太多偶然的巧合,
隨着命運的齒輪轉動,
幾個巧合碰撞到一起,造就了英偉達的成功。
回到2006年,從浙**田走出來的老黃,
在硅谷的GTC大會上隆重推出了CUDA,
與此同時,在斯坦福大學裏,
也有一位從成都七中畢業的華人科學家,
出於對物理的喜愛,她前往錢老的母校加州理工學院讀博,
2005年,經過五年學習,她獲得加州理工博士學位,
然後受聘加入斯坦福大學任教,
這位正是號稱“AI教母”的華人科學家李飛飛,
33歲成爲斯坦福終身教授,
40歲成爲美國藝術與科學院、工程院和醫學院三院院士。
![]()
05 AI教母
2006年,李飛飛繼續自己博士階段的神經科學和計算機視覺課題,
希望在實驗中探索人類如何利用算法,去快速準確地識別視覺場景,
不過傳統學者比較喜歡去研究優化算法,
而李飛飛雖然不太瞭解英偉達這家公司,
但她敏銳洞察到數據的重要性,
在新時代算法是引擎,數據纔是真正的燃料,
當時李飛飛找到語言學家克里斯蒂安·費爾鮑姆,
交流後得知了心理學項目WordNet。
![]()
WordNet是一個語言類的數據集,用層級結構組織15.5萬個英文詞彙,
李飛飛想到可以把語言推廣到圖像上面,
因爲主流的數據集僅有數千張圖像,
算法過度依賴特徵工程,泛化能力極差,
例如,識別“貓”僅用5張樣本,
無法覆蓋光線、角度、品種的多樣性,
所以李飛飛希望構建一個圖像版的大型數據集,
通過海量標註圖像映射現實世界。
![]()
06 標註勞工
2006年,李飛飛規劃構建人類歷史上最龐大的圖像數據集,
涵蓋22000個類別、每類1000張圖像,
總量達到2200萬張圖像的超級數據庫,
規模達當時同類數據集的1000倍,
覆蓋從具體物體(如熊貓)到抽象概念(如愛情)的語義層級,
一開始,李飛飛招募了自己的本科生手動下載標註圖像,
時薪僅有10美元,基本相當於本科生免費當苦力,
李飛飛發現需要90年才能夠完成,
而且在蒐集圖像時,她自己的賬號還因爲搜索引擎請求限制被谷歌封了。
![]()
一位研究生孫民建議李飛飛,
可以採用亞馬遜衆包平臺 Mechanical Turk(AMT),
這個平臺允許全球用戶以微酬參與標註,一張成本僅有0.01美元,
高峯期數據庫共吸引了167個國家4.8萬名標註者,效率提升6倍,
爲了保證數據庫的準確,李飛飛設計了三重驗證機制,
每張圖由3人獨立標註,衝突結果由專家仲裁,
開發統計模型過濾欺詐標註,確保錯誤率<5%。
![]()
07 ImageNet
基於WordNet層級結構,李飛飛將圖像分類爲12個子樹,
由於部分類別圖像不足,未達2200萬的目標,
最終整合了1500萬張圖像、22000個類別,
耗時3年完成19年的工作量!
2009年,在計算機視覺的頂級會議CVPR上,
李飛飛將這個使用大量苦力勞工標註的數據集命名爲ImageNet,
同時在CVPR上公開展示,
不過數據集的展示位僅僅只有一張海報,還放在角落裏面,
因爲學界普遍有一點質疑,即要這麼多圖片有什麼用,
當時並沒有算法可以同時處理如此巨量的數據,
李飛飛乾的這件事完全是喫力不討好。
![]()
接下來的幾年裏,李飛飛爲了讓ImageNet有推廣度,
還讓自己其中一位博士生帶着其他研究生,
去免費派發ImageNet品牌鋼筆,
希望吸引關注,但仍反響寥寥,
值得一提的是,這位博士生正是李飛飛的高徒Andrej Karpathy,
你可能並不知道他是誰,但他在博士畢業後,
就成爲特斯拉FSD自動駕駛部門的主管,
成爲馬斯克最器重的天才工程師,
並且還與馬斯克一起成爲了OpenAI創始人之一。
![]()
08 視覺識別大賽
當然,上面這些都是後話了,再回到李飛飛的ImageNet數據集上來,
2009年,ImageNet首次在CVPR亮相遇冷,
第二年,李飛飛聯合PASCAL VOC競賽團隊,
啓動了ImageNet大規模視覺識別挑戰賽(ILSVRC),
要求全球的高校實驗室團隊設計算法,
在1000類圖像中識別物體並計算錯誤率,
這1000個類別是從ImageNet裏隨機抽取的,
包含120萬訓練圖、5萬驗證圖、10萬測試圖(測試集標籤不公開),
核心任務是進行圖像分類,
比拼Top-5錯誤率(預測5個類別含正確答案即正確),
這裏我可以給大家劇透一下,英偉達顯卡和CUDA的崛起,
完全就始於李飛飛的這個ImageNet大賽,
但是在2009-2012年期間,
老黃自己其實並沒有注意到這個比賽,
也沒有想過自己的命運居然會在這個比賽上改變。
![]()
09 首屆ImageNet大賽
2010年,第一屆ImageNet大賽正式舉辦,
日本NEC北美研究室和UIUC大學的聯合團隊奪冠,
以28.2%的Top-5錯誤率贏得首屆ImageNet挑戰賽冠軍!
比較有趣的是,首屆冠軍團隊負責人均爲華人,
其中NEC的領隊爲中國科學家林元慶(清華畢業,後任百度研究院院長),
UIUC團隊由著名的華人教授黃煦濤(Thomas Huang)負責,
黃煦濤是CV領域的一代宗師、中國工程院外籍院士和中國科學院外籍院士
(你可能發現這場AI技術革命在海外,其實也是一堆華人大佬在卷)。
![]()
Thomas Huang
不過第一屆ImageNet大賽並沒有改變老黃的命運,
林元慶和黃煦濤提出了一種用於圖像分類的特徵編碼方法,
改進了傳統的詞袋模型(Bag-of-Features, BoF)和空間金字塔匹配(Spatial Pyramid Matching, SPM),
通過引入局部性約束提升特徵表達的判別力和計算效率,
分類器設計結合支持向量機(SVM)進行多類別分類,
這個方案其實還是把傳統特徵工程方法在大規模數據集上,
但也直接挖到了傳統方法的極限。
![]()
林元慶 AiBee
10 老黃的轉機
有趣的是,2012年後進入AI元年,
黃煦濤派遣博士生周曦、曹亮亮等到NEC參與研究,
雙方在稀疏編碼(Sparse Coding) 方向也取得突破,
相關論文成爲CVPR/ECCV的高引工作,
周曦博士回國後創立了雲從科技,入選福布斯中國青年海歸菁英100人,
曹亮亮先後在谷歌、蘋果任職,曾爲Vision Pro機器學習負責人,
主導Apple Intelligence的視覺算法開發,整合AR與AI交互技術,
這些也都是後話了。
![]()
回到2010年首屆ImageNet大賽,
我們可以看到當時仍然是傳統方法在統治比賽,
李飛飛所做的只不過是讓傳統方法在更大的數據集上拉到極限,
如果僅僅是這樣,李飛飛的地位可能遠沒有現在AI教母名頭這麼高,
而老黃的命運可能還要等很多年纔會改變,
接下來的2011年是整個AI爆發的前夜,
ImageNet大賽即將迎來一位AI領域的傳奇人物,
他是如何在2012年拿下ImageNet大賽的冠軍,
這個冠軍對李飛飛、黃仁勳,乃至整個世界有多大的影響,
欲知後事如何,且聽下回分解(答案全在下面這張圖中)。
![]()
遊戲&AI系列:
老黃髮家史——英偉達市值突破4萬億,老黃的傳奇人生!
老黃髮家史——傳奇AMD工程師,老黃人生的第一份工作!
老黃髮家史——世嘉主機拯救英偉達,老黃曾差點破產!
老黃髮家史——FPS天才成就英偉達,N卡的誕生!
老黃髮家史——N卡大戰A卡,上古芯片巨頭ATI!
老黃髮家史——英偉達創造顯卡,PC遊戲的崛起!
老黃髮家史——極客玩家的一次靈感,啓發英偉達進軍AI!
老黃髮家史——讓玩家爲 AI 買單,老黃成功的祕訣!
老黃髮家史——CUDA崛起,英偉達AI的護城河!
AI——是遊戲NPC的未來嗎?
巫師三——AI如何幫助老遊戲畫質重獲新生
你的遊戲存檔——正在改寫人類藥物研發史
無主之地3——臭打遊戲,竟能解決人類大腸便祕煩惱
一句話造GTA——全球首款A遊戲引擎Mirage上線
AI女裝換臉——FaceAPP應用和原理
AI捏臉技術——你想在遊戲中捏誰的臉?
Epic虛幻引擎——“元人類生成器”遊戲開發(附教程)
腦機接口——特斯拉、米哈遊的“魔幻未來技術”
白話科普——Bit到底是如何誕生的?
永劫無間——肌肉金輪,AI如何幫助玩家捏臉?
Adobe之父——發明PDF格式,助喬布斯封神
FPS遊戲之父——誰是最偉大的遊戲程序員?
《巫師3》MOD——製作教程,從零開始!
#gd的ai&遊戲雜談#
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
