“弱智吧”封神,成最佳中文AI訓練語料!

4月4日,“弱智吧”突然在中文AI領域刷屏,中科院用各大社交平臺的數據,作爲中文AI語料數據進行訓練,結果發現“弱智吧”居然是最棒的中文語料,在多項測試中取得最高分!




目前LLM大型語言模型中,英文語料佔到大多數,而中文數據集此前多半是先從英文翻譯再進行訓練,很多大模型的中文效果比英文差,爲了調侃AI,許多人也常常拿弱智吧的問題去挑戰AI。爲了更好地滿足中文大模型的需求,中科院聯合多所大學利用中文數據集來訓練中文大模型。

首先,團隊直接找到某乎、某瓣等社交網絡平臺,爬取數據並進行標註,打造了全新的中文指令微調數據集COIG-CQIA,再用這些數據集來訓練零一萬物開源大模型,並用GPT4在BELLE-Eval測試集上打分。

在340億參數版本的Yi-34B下,弱智吧的分數非常突出,可以說是一騎絕塵,在問答、分類、生成、總結、摘要和代碼上均取得極高的分數,數學某乎分數最高76分,但弱智吧也取得了72.6分的高分,最終均分76.9分遙遙領先!

弱智吧的出色成績也引起了大量的討論,對比其他專業的技術問答社區,弱智吧的數據集其實更加精煉有效,提高模型的邏輯推理能力,而且“弱智”的方向十分多元,文本質量極高,從而提高了模型性能。


而COIG-CQIA,也成爲目前相對來說相當高質量的中文指令微調數據集,收集了來自各種來源如社交媒體、百科知識、考試題庫等大量高質量的中文指令,弱智吧的出色表現,出在高質量中文知識學習方面的潛力,也給我們帶來更多深入的思(樂)考(子)。




AIGC:

聊天機器人——ChatGPT全網爆紅,馬斯克驚歎誇讚!

聊天機器人——ChatGPT小白註冊教程,勿被電商割韭菜!

火爆全網——AI生成的漂亮小姐姐,形象逼近真人!

AI動畫重磅上線——15種風格任選,支持圖片視頻輸入!

AI“核彈級”修圖神器——有手就能修圖,PS將被淘汰!

AI修圖神器升級:一鍵拖拽,即可精準P圖!

微軟頭顯AI助手:重磅推出Otter,能夠打麻將、開飛機!

遊戲界大變天:斯坦福最新成果,AI角色可模擬真人小鎮!

智械危機:AutoGPT嘗試“毀滅人類”,誘導發動核戰爭!

ChatGPT:玩轉《我的世界》,北京大學強化學習攻克複雜任務!

ChatGPT:成功讓AI聽懂人話,學會與人類合作!

ChatGPT:7分鐘開發一款遊戲,成本僅0.3美元!

OpenAI重磅突破:用AI學習AI,開創人工智能新道路!

AI速通遊戲——兩小時超越玩家,阿爾法狗母公司攻克26款遊戲!

占卜GPT問世:AI進軍玄學領域,將取代星座大V!

ChatGPT:AI女網紅交1000+男友周入50萬,未來AI會如何發展?

青年文學論壇——GPT-4來臨,翻譯會被AI取代嗎?

華爲&北大:識別ChatGPT造假,AI打假檢測器來了!

ChatGPT清明節:上海雲生命公司“復原”逝者,數字生命丫丫!

騰訊&劍:“熊貓GPT”重磅出爐,多模態超級大模型!

騰訊&南航:AI遊戲生成技術,3天可建設一座“機場”!

網易:ChatGPT自研課首發上架,AI爲遊戲賦能!

網易:AI孫燕姿真來了!網易雲音樂成立AI歌手廠牌!

搞錢GPT:國產首個帶貨AI,將顛覆全球千億美金市場!

國產GPT:推出AI數字人員工,元宇宙+GPT震撼登場!

稚暉君:賽博國風輪足機器人“哪吒”,未來或集成GPT大模型!

妙鴨相機:朋友圈刷屏!AI精修寫真,妙鴨相機爆紅!

視頻版GPT?斯坦福美女博士退學創業,AI生成視頻爆火!

科目三:讓馬斯克跳“科目三”,AI視頻新玩法!

AI網紅來了:半藏森林克隆人,月入10萬+!

AI金髮女友:月入3萬刀,每月收到20份求婚!

AI復活女兒:歌手包小柏,現實版圖桓宇!

AI圖生視頻:效果逼真,阿里雲推出EMO!

AI作曲爆紅:周杰倫歌曲爆改,人人都能寫歌!


#gd的ai&遊戲雜談#

#ai人工智能#

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com