4月4日,“弱智吧”突然在中文AI領域刷屏,中科院用各大社交平臺的數據,作爲中文AI語料數據進行訓練,結果發現“弱智吧”居然是最棒的中文語料,在多項測試中取得最高分!
目前LLM大型語言模型中,英文語料佔到大多數,而中文數據集此前多半是先從英文翻譯再進行訓練,很多大模型的中文效果比英文差,爲了調侃AI,許多人也常常拿弱智吧的問題去挑戰AI。爲了更好地滿足中文大模型的需求,中科院聯合多所大學利用中文數據集來訓練中文大模型。
首先,團隊直接找到某乎、某瓣等社交網絡平臺,爬取數據並進行標註,打造了全新的中文指令微調數據集COIG-CQIA,再用這些數據集來訓練零一萬物開源大模型,並用GPT4在BELLE-Eval測試集上打分。
在340億參數版本的Yi-34B下,弱智吧的分數非常突出,可以說是一騎絕塵,在問答、分類、生成、總結、摘要和代碼上均取得極高的分數,數學某乎分數最高76分,但弱智吧也取得了72.6分的高分,最終均分76.9分遙遙領先!
弱智吧的出色成績也引起了大量的討論,對比其他專業的技術問答社區,弱智吧的數據集其實更加精煉有效,提高模型的邏輯推理能力,而且“弱智”的方向十分多元,文本質量極高,從而提高了模型性能。
而COIG-CQIA,也成爲目前相對來說相當高質量的中文指令微調數據集,收集了來自各種來源如社交媒體、百科知識、考試題庫等大量高質量的中文指令,弱智吧的出色表現,出在高質量中文知識學習方面的潛力,也給我們帶來更多深入的思(樂)考(子)。
AIGC:
聊天機器人——ChatGPT全網爆紅,馬斯克驚歎誇讚!
聊天機器人——ChatGPT小白註冊教程,勿被電商割韭菜!
火爆全網——AI生成的漂亮小姐姐,形象逼近真人!
AI動畫重磅上線——15種風格任選,支持圖片視頻輸入!
AI“核彈級”修圖神器——有手就能修圖,PS將被淘汰!
AI修圖神器升級:一鍵拖拽,即可精準P圖!
微軟頭顯AI助手:重磅推出Otter,能夠打麻將、開飛機!
遊戲界大變天:斯坦福最新成果,AI角色可模擬真人小鎮!
ChatGPT:玩轉《我的世界》,北京大學強化學習攻克複雜任務!
ChatGPT:成功讓AI聽懂人話,學會與人類合作!
ChatGPT:7分鐘開發一款遊戲,成本僅0.3美元!
OpenAI重磅突破:用AI學習AI,開創人工智能新道路!
AI速通遊戲——兩小時超越玩家,阿爾法狗母公司攻克26款遊戲!
占卜GPT問世:AI進軍玄學領域,將取代星座大V!
ChatGPT:AI女網紅交1000+男友周入50萬,未來AI會如何發展?
青年文學論壇——GPT-4來臨,翻譯會被AI取代嗎?
華爲&北大:識別ChatGPT造假,AI打假檢測器來了!
ChatGPT清明節:上海雲生命公司“復原”逝者,數字生命丫丫!
騰訊&南航:AI遊戲生成技術,3天可建設一座“機場”!
搞錢GPT:國產首個帶貨AI,將顛覆全球千億美金市場!
國產GPT:推出AI數字人員工,元宇宙+GPT震撼登場!
稚暉君:賽博國風輪足機器人“哪吒”,未來或集成GPT大模型!
妙鴨相機:朋友圈刷屏!AI精修寫真,妙鴨相機爆紅!
視頻版GPT?斯坦福美女博士退學創業,AI生成視頻爆火!
AI網紅來了:半藏森林克隆人,月入10萬+!
AI金髮女友:月入3萬刀,每月收到20份求婚!
AI復活女兒:歌手包小柏,現實版圖桓宇!
AI圖生視頻:效果逼真,阿里雲推出EMO!
AI作曲爆紅:周杰倫歌曲爆改,人人都能寫歌!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com