在諸多測試中表現比人類都好!GPT-4意味着什麼?它厲害在哪?

自舊金山初創公司OpenAI去年11月推出ChatGPT聊天機器人,並其迅速走紅後,“生成式人工智能”成爲了今年科技界最熱門的話題。ChatGPT允許用戶提出問題或請求,並給出十分世故和創造性的答案。目前,一些主要的大型科技公司均爭先恐後地將類似的功能引入其產品中。但是目前看來,其他的科技公司還是晚了一步。

就在今天,OpenAI公佈了其大型語言模型的最新版本GPT-4。GPT-4 是一個大型多模態模型,能接受圖像和文本輸入,再輸出正確的文本回復。實驗表明,GPT-4 在各種專業測試和學術基準上的表現與人類水平相當。


而相對於之前版本的GPT來說,GPT-4可以更準確地解決你的難題,多模態的GPT-4還可以生成、編輯具有創意性或技術性的文章,在高級推理方面的表現超過其前輩。

首先,看圖能力可以用來解釋表情包、梗圖。比如如果你提問這張圖哪裏好笑?GPT-4可以按順序描述出每一格的內容,並總結出笑點。

其次,GPT-4可以理解圖表中數據的含義,並做進一步計算。甚至可以直接把論文截圖發給它,GPT-4可以按像素處理其中的文字和圖片,並給出對整篇論文的總結摘要。


根據OpenAI表示,GPT-4錯誤答案更少,而且也會減少偏離話題的可能,也儘可能不會再談論禁忌話題,甚至在許多標準化測試中比人類表現得都要更好一些。例如,GPT-4在模擬律師考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,GPT-3.5在律師考試中的得分一般都是倒數10%左右。

在API方面,GPT-4還開放了一個使用功能,允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡,這是因爲系統提示中規定了“你只是一個語言模型……你的知識截止於2021年9月”。現在通過修改這句話,GPT-4就可以展現出更多樣的性格,比如帶入更多元化的思維方式,而不僅僅把自己侷限在一個語言模型中等等。


不僅如此,GPT-4比以前的版本更爲龐大,這意味着它已經藉助比前輩更多的數據進行了訓練,並且在模型文件中有更多的權重,從而使得它的運行成本更高。就任務而言,GPT-4的表現比前輩更好,它可以遵循自然語言的複雜指令並生成技術或創意內容,而且它可以還更深入地做到這一點:它支持生成和處理多達32768個標記(約25000個文本單詞),從而實現比前輩更長的內容創建或文本分析。

當然,AI畢竟是AI,OpenAI也表示目前GPT-4並不完美,它在很多場景下的能力都不如人類。儘管這個新的機器人似乎能對已經發生的事情進行推理,但當被要求對未來進行假設時,它就不那麼擅長了。它似乎是在借鑑別人的說法,而不是創造新的猜測。

不僅如此該模型仍然存在“幻覺”或編造事實的問題,並且在事實方面也不一定總是可靠的,“它傾向於堅持認爲它是正確的,即使它錯了”。OpenAI表示,GPT-4正在努力解決其侷限性,例如社會偏見、幻覺和對抗性提示。

#ai人工智能#


在小黑盒PC端加速器輸入Kenan66、wjb66或wow66,即可每月分別白嫖三天會員時長,鵝鵝殺必備的加速器加速器加速多個地區,支持steam微軟NS亞馬遜等商城,有多個小號每月穩定白嫖

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com