微軟大模型性能逆天,數學推理能力超ChatGPT!

近日,微軟發佈了WizardMath大模型,參數規模爲700億,性能逆天非常強勁,在數學推理基準測試中,該模型比目前市面上所有的開源語言大模型都強!目前,WizardMath模型的論文、代碼均已開源,中科院團隊也參與項目,所有研發人員均爲華人!



ChatGPT

今年3月份,OpenAI隆重發布了GPT-4,成爲全球最火熱的科技公司,在推理能力和上下文能力上非常強大,微軟進一步給OpenAI提供源源不斷的資金,用來購買更多的英偉達H100和GH200芯片。

本週,微軟再發佈一個新的開源大模型WizardMath,並將論文、代碼和模型權重全部公開!

在最近幾天中,WizardMath在HuggingFace排行榜上一躍衝進前十,其中WizardMath-70B和WizardCoder-15B兩個參數版本的大模型,與Stable Diffusion和Llama-2等熱門模型並列在首頁!




在ChatGPT熱潮開始後,許多新進入這一領域的研究團隊,需要創建非常龐大、非常複雜,且已經標註過的數據,正如Geoffrey Hinton所言,“數據就是一切,越多越好。”

大量的數據可以提高GPT模型的泛化能力,然而並不是每家公司都有這個能力拿到這些數據,所以微軟團隊聯合中科院團隊,一起發表了論文《WizardLM: Empowering Large Language Models to Follow Complex Instructions》,希望使用一定的指令數據,來微調那些大模型,使其能夠遵循一些複雜的指令。

論文中詳細介紹了“Reinforced Evol-Instruct”方法,即在LLaMA模型的基礎上,利用AI來代替人類自動生成涵蓋各種難度級別開放域指令,然後利用該方法生成很多數學領域相關的指令,對羊駝進行微調得到了WizardMath。




數學推理

最令人振奮的就是WizardMath的數學推理能力,在兩個數學推理基準 GSM8k 和 MATH 的測試中,WizardMath 達到 SOTA 級別,優於所有其他開源 LLM!

WizardMath一共分爲70B、13B、7B三個參數規模,其中WizardMath-70B-V1.0 模型在 GSM8k 基準測試中達到 81.6 pass,比之前最強的大模型還要高出24.8分!

在目前衆多知名數學家中,陶哲軒是最早入坑ChatGPT的科學家之一,即使是3月份,ChatGPT不會解決雞兔同籠問題,Tao依然給出非常積極的評價,認爲ChatGPT完全能夠幫助他這個級別的數學家進行輔助性的工作.

在WizardMath基礎上,微軟團隊還開源了WizardCoder,專門用於代碼方向的Code LLM,在四個代碼生成基準HumanEval、HumanEval+、MBPP 和 DS-1000中,同樣取得了非常強的性能,效果超過了Claude和Bard!目前論文的9位作者均爲華人,通訊作者是姜大昕,微軟全球合夥人、副總裁、前微軟亞洲研究院首席科學家,曾爲微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,現已被曝離職投身大模型創業!此前,沈向洋帶讀論文系列,也邀請過姜大昕分享Knowledge Distillation相關論文。




機器學習基礎:

AI學術巨佬——何愷明,從遊戲中獲得論文靈感

AI領軍人物——孫劍,重劍無鋒的經典之作

張益唐——黎曼猜想,華人數學家再創重大突破!

B站大學——線代不掛科,MIT傳奇教授的最後一課!

機器學習入門——數學基礎(積分篇

機器學習入門——數學基礎(代數篇

機器學習入門——數學基礎(貝葉斯篇

ChatGPT:

聊天機器人——ChatGPT全網爆紅,馬斯克驚歎誇讚!

聊天機器人——ChatGPT小白註冊教程,勿被電商割韭菜!

ChatGPT移動端——使用教程,5分鐘註冊iOS賬號!

微軟——解散元宇宙,900億投資壓注ChatGPT!

ChatGPT王炸官宣——僅需2.7美元,即可輸出100萬詞!

微軟——ChatGPT下週史詩升級!百度也同期發佈“文心一言”!

英偉達重磅:史上最強AI算力芯片,老黃髮佈會終極大招!

英偉達重磅:AI讀取視頻,可直出3D遊戲模型!

黃仁勳:給AI圈一點小小的英偉達震撼,11分鐘訓練ChatGPT!

ChatGPT免費開源平替——200億參數,前OpenAI團隊打造!

ChatGPT王炸升級——可識別圖片,考試成績超九成人類!

ChatGPT史詩升級——1秒生成網站,看圖玩梗能力堪比真人!

ChatGPT加強版——60秒生成彈球遊戲,零基礎也能開發遊戲!

ChatGPT王炸升級——解除“封印”,接入互聯網!

ChatGPT王炸官宣——正式解除封印,接入互聯網開放插件!

ChatGPT重磅升級——新增函數功能,價格大幅下降!

ChatGPT:預計3億人將失業,斯坦福封神開源GPT平替版!

ChatGPT:亞洲IP大面積被封,意大利停止服務!

ChatGPT突發:暫停關閉付費Plus,只因需求量太大!

ChatGPT突發:法國、西班牙或禁止GPT,只因數據安全問題!

ChatGPT突發:iOS版應用上線,衝到總榜第二!

ChatGPT:僅時隔一天,OpenAI重新開放付費訂閱!

ChatGPT手機版:近300萬年薪招募團隊,GPT5傳言被闢謠!

ChatGPT之父:重磅推出世界幣,將成爲AI時代“身份證”!

ChatGPT之父:奧特曼沒有公司股份,因爲熱愛創造了GPT!

ChatGPT之父:奧特曼將重磅開源GPT-3,只因GPU供應不足!

ChatGPT之父奧特曼:發佈世界幣,大漲90%估值超兩千億!

ChatGPT:微軟聯手奧特曼,重磅投資核聚變發電!

ChatGPT:被起訴索賠30億美元,只因濫用個人數據!

微軟神級開源:“傻瓜式”工具,人人可擁有自己的ChatGPT

微軟頭顯AI助手:重磅推出Otter,能夠打麻將、開飛機!

遊戲界大變天:斯坦福最新成果,AI角色可模擬真人小鎮!

淘汰ChatGPT:智械危機來了,AutoGPT可自動寫代碼!

人工智能“覺醒”:自主學習,AutoGPT會顛覆ChatGPT嗎?

智械危機:AutoGPT嘗試“毀滅人類”,誘導發動核戰爭!

ChatGPT最強挑戰者:谷歌Claude,免註冊支持中文!

ChatGPT最強競品:谷歌免費升級克勞德,20秒逆天速通百頁論文!

ChatGPT:顯卡每日電費500萬,谷歌大腦合併阿爾法狗母公司

ChatGPT:玩轉《我的世界》,北京大學強化學習攻克複雜任務!

ChatGPT:接入奔馳汽車,文心一言也將上線國內車企!

ChatGPT:成功讓AI聽懂人話,學會與人類合作!

ChatGPT:7分鐘開發一款遊戲,成本僅0.3美元!

OpenAI重磅突破:用AI學習AI,開創人工智能新道路!

比爾蓋茨來了:盛讚中國的創新能力,捐款5000萬美元研發醫療!

人工智能之父、奧特曼嚴肅警告——AI未來將滅絕人類!

AI速通遊戲——兩小時超越玩家,阿爾法狗母公司攻克26款遊戲!

蘋果版GPT:將升級推出Siri大模型,禁止員工使用ChatGPT!

蘋果最強頭顯:售價3499美元,人類進入“空間計算”時代!

蘋果庫克:ChatGPT很強但需要監管,頭顯將成爲轉折點!

蘋果:收購任天堂明星合作公司,曾爲馬里奧賽車打造AR頭顯!

ChatGPT:AI女網紅交1000+男友周入50萬,未來AI會如何發展

論文相關:

畢業季雜談——如何隨時免費使用中國知網?

畢業季雜談——論文降重的“奇技淫巧”

畢業季雜談——大學教材如何獲取

畢業論文——Latex論文排版語言介紹

ChatGPT:畢業論文降重必備,天才數學家盛讚論文功能!

#gd的ai&遊戲雜談#

#ai人工智能#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com