AI高考數學全不及格 語數英最高分303

上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考“語數外”全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。

語數外三科加起來的滿分爲420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,爲303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com