近期,OpenAI再次迎來重大突破,發佈了一篇關於GPT-4語言模型解析神經元對齊(alignment)的研究成果,即利用GPT-4開源工具,嘗試去對GPT-2等大型語言模型的神經元行爲進行解釋評分,目標是使用AI來理解AI,OpenAI有望開闢一條研究人工智能可解釋性的新道路!
ChatGPT
自從去年底ChatGPT發佈後,OpenAI成爲全世界的焦點,引領人工智能技術方向的發展,3月15日,OpenAI推出史上最強大模型GPT-4,在衆多聊天機器人技術競爭中遙遙領先!
伴隨着語言模型變得更強大,部署更廣泛,以大語言模型LLM爲代表的項目,也遇到了和深度學習神經網絡同樣的問題——可解釋性,這也是目前AI一直難以解決的難題。
OpenAI宣稱,目前即使是他們對GPT內部工作原理的理解,仍然非常有限,更別提其他科技大廠,對於這些像“黑箱式”的工具,可解釋性一直是科研的重點方向。
AI學習AI
在GPT發展過程中,OpenAI遇到了很多可解釋性問題,比如很難從GPT的輸出中,檢測模型是使用有偏見的數據,或者是否進行了欺騙性的回答,而可解釋性就是爲了通過觀察模型內部過程,來發現更多的問題,從而對這些偏見和欺騙進行改善。
5月11日,OpenAI發佈了一個關於GPT-4語言模型解析神經元的對齊性研究成果(Language models can explain neurons in language models),傳統方法需要科研人員手動檢查神經元,來確定這些神經元代表數據的哪些特徵。
一旦擴大到數百或數千億個參數的神經網絡,就很難手動檢查了,OpenAI提出了一個自動化的過程,可以使用GPT-4來生成神經元行爲的自然語言解釋並對其進行評分,並將其應用於另一種語言模型中的神經元。
GPT4解釋GPT2
給定一個GPT2神經元,通過向GPT4顯示相關文本序列,觀測哪些特定神經元被頻繁“激活”,從而得出其行爲的解釋。例如讓GPT4閱讀文本和激活情況,來判斷漫威是否與電影、角色和娛樂有關。
OpenAI用GPT4模擬GPT2 的神經元接下來會做什麼,預測行爲,最後評估打分,對比GPT4模擬神經元和GPT2真實神經元的結果的準確度。
在上面這個例子中,GPT-4 的得分爲0.34。通過這種方式,OpenAI正在利用GPT4對GPT2所有的307200個神經元進行解釋,並開發可視化工具,未來同樣會將工具開源,並公開這些模型分數。OpenAI希望這能開闢一條研究人工智能柯潔式性有前途的途徑,從而讓AI未來能達到比肩人類大腦的想法和行爲!
機器學習基礎:
AI學術巨佬——何愷明,從遊戲中獲得論文靈感
AI領軍人物——孫劍,重劍無鋒的經典之作
張益唐——黎曼猜想,華人數學家再創重大突破!
機器學習入門——數學基礎(積分篇)
機器學習入門——數學基礎(代數篇)
機器學習入門——數學基礎(貝葉斯篇)
遊戲&AI系列:
賽博朋克——敏捷開發能挽救CDPR的口碑嗎?
巫師三——AI如何幫助老遊戲畫質重獲新生
AI女裝換臉——FaceAPP應用和原理
AI捏臉技術——你想在遊戲中捏誰的臉?
Epic虛幻引擎——“元人類生成器”遊戲開發(附教程)
腦機接口——特斯拉、米哈遊的“魔幻未來技術”
白話科普——Bitcoin到底是如何誕生的?
永劫無間——肌肉金輪,AI如何幫助玩家捏臉?
GTA6黑客——R星自導自演營銷?無稽之談!
ChatGPT:
聊天機器人——ChatGPT全網爆紅,馬斯克驚歎誇讚!
聊天機器人——ChatGPT小白註冊教程,勿被電商割韭菜!
ChatGPT王炸官宣——僅需2.7美元,即可輸出100萬詞!
火爆全網——AI生成的漂亮小姐姐,形象逼近真人!
微軟——ChatGPT下週史詩升級!百度也同期發佈“文心一言”!
ChatGPT免費開源平替——200億參數,前OpenAI團隊打造!
ChatGPT王炸升級——可識別圖片,考試成績超九成人類!
ChatGPT史詩升級——1秒生成網站,看圖玩梗能力堪比真人!
ChatGPT加強版——60秒生成彈球遊戲,零基礎也能開發遊戲!
ChatGPT王炸升級——解除“封印”,接入互聯網!
ChatGPT:預計3億人將失業,斯坦福封神開源GPT平替版!
ChatGPT:亞洲IP大面積被封,意大利停止服務!
ChatGPT突發:暫停關閉付費Plus,只因需求量太大!
ChatGPT突發:法國、西班牙或禁止GPT,只因數據安全問題!
ChatGPT:僅時隔一天,OpenAI重新開放付費訂閱!
ChatGPT手機版:近300萬年薪招募團隊,GPT5傳言被闢謠!
ChatGPT之父:重磅推出世界幣,將成爲AI時代“身份證”!
微軟神級開源:“傻瓜式”工具,人人可擁有自己的ChatGPT!
遊戲界大變天:斯坦福最新成果,AI角色可模擬真人小鎮!
淘汰ChatGPT:智械危機來了,AutoGPT可自動寫代碼!
人工智能“覺醒”:自主學習,AutoGPT會顛覆ChatGPT嗎?
ChatGPT最強挑戰者:谷歌Claude,免註冊支持中文!
ChatGPT:顯卡每日電費500萬,谷歌大腦合併阿爾法狗母公司
ChatGPT:玩轉《我的世界》,北京大學強化學習攻克複雜任務!
馬斯克重磅:推出“真相GPT”,保證不會毀滅人類!
青年文學論壇——GPT-4來臨,翻譯會被AI取代嗎?
百度文心一言:全球大廠首發,可幫助續寫《三體》!
百度文心一言:中國版ChatGPT,短視頻批量生成!
百度文心一言:超8萬家企業排隊合作!
百度文心千帆:比ChatGPT便宜,百萬字僅12元!
百度李彥宏:有錢買不到創新,銳評谷歌也未做出來ChatGPT!
國產ChatGPT:支持手機芯片推理,馬雲談用GPT解決實際問題!
華爲版ChatGPT:重磅出爐!盤古大模型將在4月發佈!
華爲重磅自研:盤古NLP大模型,不打算追隨ChatGPT!
中國最強ChatGPT:語言大模型“商量”,演示性能超文心一言!
ChatGPT清明節:上海雲生命公司“復原”逝者,數字生命丫丫!
360自研GPT:周鴻禕長文反駁馬斯克,自稱“拯救派”望彎道超車!
360版ChatGPT:實機演示“翻車”,答錯梅西進球數!
阿里版ChatGPT:發佈“通義千問”大模型,可在支付寶測試體驗!
百度打假蘋果:文心一言慘遭套皮,現已對蘋果發起訴訟!
元宇宙大會:6大國產GPT同日推出,華爲阿里等成立GPT聯盟!
復旦ChatGPT:開源MOSS大模型,3090顯卡即可運行!
搞錢GPT:國產首個帶貨AI,將顛覆全球千億美金市場!
國產GPT:推出AI數字人員工,元宇宙+GPT震撼登場!
稚暉君:賽博國風輪足機器人“哪吒”,未來或集成GPT大模型!
論文相關:
畢業季雜談——如何隨時免費使用中國知網?
畢業季雜談——論文降重的“奇技淫巧”
畢業季雜談——大學教材如何獲取
畢業論文——Latex論文排版語言介紹
ChatGPT:畢業論文降重必備,天才數學家盛讚論文功能!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com