563支AI隊伍做了姜萍同一份數學試卷: 結果最高分僅34

在最近舉辦的阿里巴巴全球數學競賽中,來自江蘇省漣水中等專業學校的17歲女生薑萍不僅成功入圍決賽,還以全球排名12的成績成爲了賽事歷史上首個進入決賽的中專生。

不僅如此,今年的阿里數賽還首次開放了AI大模型挑戰賽,共有563支由全球知名高校院所和企業組建的AI隊伍與姜萍解答了同一份試卷。

最終AI隊伍的平均分爲18分,這一成績已經接近人類選手的平均水平。但最高得分卻僅爲34分,與人類選手的最高分113分相差甚遠,並且AI隊伍在決賽中無一入圍。

AI隊伍中最高分由上海建平中學的塗津豪個人推出的AI方案獲得,他採用了一種讓多個大模型進行“自問自答自驗證”的方法,以尋求問題的最優解。

而西南交通大學的特工宇宙團隊和中國人民大學的SuperCarryMan團隊分別以27分的成績位列AI挑戰賽的亞軍和季軍。

儘管AI在數學競賽中的表現顯示出了一定的潛力,但專家分析指出,現有的大語言模型在完成複雜推理和嚴謹思考方面仍存在侷限。

AI在邏輯推理能力和證明題的得分上表現不佳,這表明在深層次邏輯推理和創新思維方面,人類選手依然保持着明顯的優勢。


來源:快科技

點擊此處查看原文>>>

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com