老黃髮家史——華人AI教母李飛飛,老黃髮家的貴人!

知名科技公司英偉達,市值突破了4萬億美元,超過微軟和蘋果,成爲全球市值最高的公司,在過去的30年時間裏,英偉達從一家開發圖形處理遊戲顯卡的小公司,一路成長爲全球AI巨擘!歡迎大家來到老黃髮家史的第十期,今天承接前九期內容,繼續聊老黃的創業史!

01 至暗時刻

上文講到英偉達初代Xbox供貨後與微軟分道揚鑣,

微軟轉投ATI,老黃尋求破局之道,

開始祕密啓動CUDA項目,調動1200名工程師投入研發,

但導致遊戲業務擱置、顯卡成本激增,

爆發“凸點門事件”,英偉達股價暴跌,

斯坦福大學計算機系主任比爾·戴利加入英偉達,

召開全球的GTC學術大會,推銷CUDA英偉達科學計算,

2009年,CUDA下載量達30萬次後連續3年下滑,

2012年僅10萬次新安裝,

華爾街嘲諷老黃,英偉達的科學計算是小衆市場,

投入數十億美元純屬浪費,

投資人傑夫·史密斯做空英偉達,

要求砍掉CUDA、專注遊戲顯卡,

與此同時英偉達大股東富達(Fidelity)以撤資威脅英偉達,

此時英偉達外部有AMD競爭,內部員工股東不和,

老黃再次陷入了至暗時刻。

02 堅持CUDA

平日裏,老黃每週工作80小時,錯過了自己兒女的成長時光,

老黃的兒子赴芝加哥藝術學院學攝影,

女兒遠赴巴黎藍帶學院學烹飪,

老黃的愛犬"壽司"也在此時離世,

沒有人可以幫助老黃分擔壓力,

危機之中,老黃仍然將CUDA視爲核心戰略,

在英偉達董事會成員吉姆·蓋瑟律師的斡旋下,

黃仁勳親赴波士頓與富達一方會面,

然後再前往紐約接連拜會了其他6家機構的投資者,

竭盡全力遊說這些金融巨頭支持CUDA。

老黃掛在嘴邊最多的一本書是《創新者的窘境》,

他經常給華爾街講書中真實的案例,

比如17世紀初期,荷蘭的工匠在眼鏡製造過程中意識到,

重新排列鏡片便能觀察遠處的物體,

於是這些工匠向荷蘭專利局提交了大量的望遠鏡設計方案,

他們自身只懂製造望遠鏡的技術,不懂任何天文知識,

然而短短一年內,伽利略便用其中一款望遠鏡觀測星空,

成爲首位描繪金星相位、木星衛星以及土星光環的人,

老黃自比是17世紀的工匠,

英偉達的CUDA就是給全球的科學家提供低成本的超級計算機,

然後引發一場類似的跨時代的技術躍遷!

03 內心的茫然

很多人認爲老黃如此堅持CUDA,

他的內心裏一定有一條直通AI的技術路線,

不過老黃接受採訪時坦白,他其實對未來的技術沒有明確的構想,

老黃還把自己和馬斯克對比,

老馬先從設想自己站在火星表面的場景開始,

然後逆向構建所需技術去實現目標,

老黃自己則恰恰相反,他從眼前電路的功能出發,

極力向前推測潛能,把自己侷限在理性的邊界內,

只允許稍作逾越,涉足其他朦朧未知的領域。

這種內心中的迷茫,老黃自然不會告訴華爾街,

但他依然堅持CUDA技術,尊重科學家們的觀點,

每次開發佈會或者GTC大會時,

營銷人員、新聞媒體總是被安排在後排,科學家則位居前列。

到了2010年左右,

老黃冥冥之中突然感受到了突破的曙光,

原來在與比爾·戴利、約翰·尼科爾斯和伊恩·巴克這些科學家交流時,

他能感受到這些天才們的熱忱,

多年以後老黃回憶,正是這些感受,

足以讓他毅然割捨部分利潤,去探索未來,

老黃深信在某處,定有某位研究人員將跳過大學裏的煩瑣官L,

通過攢錢購買一塊英偉達GPU,從而掀起一場技術革命,

只是在當時,老黃還不知道哪個角落會有這樣的奇蹟誕生。

04 技術偶然

當我們在回顧人類這場AI算力的技術革命,

會發現很多非常偶然、非常有趣的事情,

那就是這場技術革命中有太多太多偶然的巧合,

隨着命運的齒輪轉動,

幾個巧合碰撞到一起,造就了英偉達的成功。

回到2006年,從浙**田走出來的老黃,

在硅谷的GTC大會上隆重推出了CUDA,

與此同時,在斯坦福大學裏,

也有一位從成都七中畢業的華人科學家,

出於對物理的喜愛,她前往錢老的母校加州理工學院讀博,

2005年,經過五年學習,她獲得加州理工博士學位,

然後受聘加入斯坦福大學任教,

這位正是號稱“AI教母”的華人科學家李飛飛,

33歲成爲斯坦福終身教授,

40歲成爲美國藝術與科學院、工程院和醫學院三院院士。

05 AI教母

2006年,李飛飛繼續自己博士階段的神經科學和計算機視覺課題,

希望在實驗中探索人類如何利用算法,去快速準確地識別視覺場景,

不過傳統學者比較喜歡去研究優化算法,

而李飛飛雖然不太瞭解英偉達這家公司,

但她敏銳洞察到數據的重要性,

在新時代算法是引擎,數據纔是真正的燃料,

當時李飛飛找到語言學家克里斯蒂安·費爾鮑姆,

交流後得知了心理學項目WordNet。

WordNet是一個語言類的數據集,用層級結構組織15.5萬個英文詞彙,

李飛飛想到可以把語言推廣到圖像上面,

因爲主流的數據集僅有數千張圖像,

算法過度依賴特徵工程,泛化能力極差,

例如,識別“貓”僅用5張樣本,

無法覆蓋光線、角度、品種的多樣性,

所以李飛飛希望構建一個圖像版的大型數據集,

通過海量標註圖像映射現實世界。

06 標註勞工

2006年,李飛飛規劃構建人類歷史上最龐大的圖像數據集,

涵蓋22000個類別、每類1000張圖像,

總量達到2200萬張圖像的超級數據庫,

規模達當時同類數據集的1000倍,

覆蓋從具體物體(如熊貓)到抽象概念(如愛情)的語義層級,

一開始,李飛飛招募了自己的本科生手動下載標註圖像,

時薪僅有10美元,基本相當於本科生免費當苦力,

李飛飛發現需要90年才能夠完成,

而且在蒐集圖像時,她自己的賬號還因爲搜索引擎請求限制被谷歌封了。

一位研究生孫民建議李飛飛,

可以採用亞馬遜衆包平臺 Mechanical Turk(AMT),

這個平臺允許全球用戶以微酬參與標註,一張成本僅有0.01美元,

高峯期數據庫共吸引了167個國家4.8萬名標註者,效率提升6倍,

爲了保證數據庫的準確,李飛飛設計了三重驗證機制,

每張圖由3人獨立標註,衝突結果由專家仲裁,

開發統計模型過濾欺詐標註,確保錯誤率<5%。

07 ImageNet

基於WordNet層級結構,李飛飛將圖像分類爲12個子樹,

由於部分類別圖像不足,未達2200萬的目標,

最終整合了1500萬張圖像、22000個類別,

耗時3年完成19年的工作量!

2009年,在計算機視覺的頂級會議CVPR上,

李飛飛將這個使用大量苦力勞工標註的數據集命名爲ImageNet,

同時在CVPR上公開展示,

不過數據集的展示位僅僅只有一張海報,還放在角落裏面,

因爲學界普遍有一點質疑,即要這麼多圖片有什麼用,

當時並沒有算法可以同時處理如此巨量的數據,

李飛飛乾的這件事完全是喫力不討好。

接下來的幾年裏,李飛飛爲了讓ImageNet有推廣度,

還讓自己其中一位博士生帶着其他研究生,

去免費派發ImageNet品牌鋼筆,

希望吸引關注,但仍反響寥寥,

值得一提的是,這位博士生正是李飛飛的高徒Andrej Karpathy,

你可能並不知道他是誰,但他在博士畢業後,

就成爲特斯拉FSD自動駕駛部門的主管,

成爲馬斯克最器重的天才工程師,

並且還與馬斯克一起成爲了OpenAI創始人之一。

08 視覺識別大賽

當然,上面這些都是後話了,再回到李飛飛的ImageNet數據集上來,

2009年,ImageNet首次在CVPR亮相遇冷,

第二年,李飛飛聯合PASCAL VOC競賽團隊,

啓動了ImageNet大規模視覺識別挑戰賽(ILSVRC),

要求全球的高校實驗室團隊設計算法,

在1000類圖像中識別物體並計算錯誤率,

這1000個類別是從ImageNet裏隨機抽取的,

包含120萬訓練圖、5萬驗證圖、10萬測試圖(測試集標籤不公開),

核心任務是進行圖像分類,

比拼Top-5錯誤率(預測5個類別含正確答案即正確),

這裏我可以給大家劇透一下,英偉達顯卡和CUDA的崛起,

完全就始於李飛飛的這個ImageNet大賽,

但是在2009-2012年期間,

老黃自己其實並沒有注意到這個比賽,

也沒有想過自己的命運居然會在這個比賽上改變。

09 首屆ImageNet大賽

2010年,第一屆ImageNet大賽正式舉辦,

日本NEC北美研究室和UIUC大學的聯合團隊奪冠,

以28.2%的Top-5錯誤率贏得首屆ImageNet挑戰賽冠軍!

比較有趣的是,首屆冠軍團隊負責人均爲華人,

其中NEC的領隊爲中國科學家林元慶(清華畢業,後任百度研究院院長),

UIUC團隊由著名的華人教授黃煦濤(Thomas Huang)負責,

黃煦濤是CV領域的一代宗師、中國工程院外籍院士和中國科學院外籍院士

(你可能發現這場AI技術革命在海外,其實也是一堆華人大佬在卷)。

Thomas Huang

不過第一屆ImageNet大賽並沒有改變老黃的命運,

林元慶和黃煦濤提出了一種用於圖像分類的特徵編碼方法,

改進了傳統的詞袋模型(Bag-of-Features, BoF)和空間金字塔匹配(Spatial Pyramid Matching, SPM),

通過引入局部性約束提升特徵表達的判別力和計算效率,

分類器設計結合支持向量機(SVM)進行多類別分類,

這個方案其實還是把傳統特徵工程方法在大規模數據集上,

但也直接挖到了傳統方法的極限。

林元慶 AiBee

10 老黃的轉機

有趣的是,2012年後進入AI元年,

黃煦濤派遣博士生周曦、曹亮亮等到NEC參與研究,

雙方在稀疏編碼(Sparse Coding) 方向也取得突破,

相關論文成爲CVPR/ECCV的高引工作,

周曦博士回國後創立了雲從科技,入選福布斯中國青年海歸菁英100人,

曹亮亮先後在谷歌、蘋果任職,曾爲Vision Pro機器學習負責人,

主導Apple Intelligence的視覺算法開發,整合AR與AI交互技術,

這些也都是後話了。

回到2010年首屆ImageNet大賽,

我們可以看到當時仍然是傳統方法在統治比賽,

李飛飛所做的只不過是讓傳統方法在更大的數據集上拉到極限,

如果僅僅是這樣,李飛飛的地位可能遠沒有現在AI教母名頭這麼高,

而老黃的命運可能還要等很多年纔會改變,

接下來的2011年是整個AI爆發的前夜,

ImageNet大賽即將迎來一位AI領域的傳奇人物,

他是如何在2012年拿下ImageNet大賽的冠軍,

這個冠軍對李飛飛、黃仁勳,乃至整個世界有多大的影響,

欲知後事如何,且聽下回分解(答案全在下面這張圖中)。

遊戲&AI系列:

老黃髮家史——英偉達市值突破4萬億,老黃的傳奇人生!

老黃髮家史——傳奇AMD工程師,老黃人生的第一份工作!

老黃髮家史——世嘉主機拯救英偉達,老黃曾差點破產!

老黃髮家史——FPS天才成就英偉達,N卡的誕生!

老黃髮家史——N卡大戰A卡,上古芯片巨頭ATI!

老黃髮家史——英偉達創造顯卡,PC遊戲的崛起!

老黃髮家史——極客玩家的一次靈感,啓發英偉達進軍AI!

老黃髮家史——讓玩家爲 AI 買單,老黃成功的祕訣!

老黃髮家史——CUDA崛起,英偉達AI的護城河!

AI——是遊戲NPC的未來嗎?

巫師三——AI如何幫助老遊戲畫質重獲新生

你的遊戲存檔——正在改寫人類藥物研發史

無主之地3——臭打遊戲,竟能解決人類大腸便祕煩惱

一句話造GTA——全球首款A遊戲引擎Mirage上線

AI女裝換臉——FaceAPP應用和原理

AI捏臉技術——你想在遊戲中捏誰的臉?

Epic虛幻引擎——“元人類生成器”遊戲開發(附教程)

腦機接口——特斯拉、米哈遊的“魔幻未來技術”

白話科普——Bit到底是如何誕生的?

永劫無間——肌肉金輪,AI如何幫助玩家捏臉?

Adobe之父——發明PDF格式,助喬布斯封神

FPS遊戲之父——誰是最偉大的遊戲程序員?

《巫師3》MOD——製作教程,從零開始!

#gd的ai&遊戲雜談#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com