在諸多測試中表現比人類都好！GPT-4意味着什麼？它厲害在哪？

自舊金山初創公司OpenAI去年11月推出ChatGPT聊天機器人，並其迅速走紅後，“生成式人工智能”成爲了今年科技界最熱門的話題。ChatGPT允許用戶提出問題或請求，並給出十分世故和創造性的答案。目前，一些主要的大型科技公司均爭先恐後地將類似的功能引入其產品中。但是目前看來，其他的科技公司還是晚了一步。

就在今天，OpenAI公佈了其大型語言模型的最新版本GPT-4。GPT-4 是一個大型多模態模型，能接受圖像和文本輸入，再輸出正確的文本回復。實驗表明，GPT-4 在各種專業測試和學術基準上的表現與人類水平相當。

而相對於之前版本的GPT來說，GPT-4可以更準確地解決你的難題，多模態的GPT-4還可以生成、編輯具有創意性或技術性的文章，在高級推理方面的表現超過其前輩。

首先，看圖能力可以用來解釋表情包、梗圖。比如如果你提問這張圖哪裏好笑？GPT-4可以按順序描述出每一格的內容，並總結出笑點。

其次，GPT-4可以理解圖表中數據的含義，並做進一步計算。甚至可以直接把論文截圖發給它，GPT-4可以按像素處理其中的文字和圖片，並給出對整篇論文的總結摘要。

根據OpenAI表示，GPT-4錯誤答案更少，而且也會減少偏離話題的可能，也儘可能不會再談論禁忌話題，甚至在許多標準化測試中比人類表現得都要更好一些。例如，GPT-4在模擬律師考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數學考試中排名前11%左右。相比之下，GPT-3.5在律師考試中的得分一般都是倒數10%左右。

在API方面，GPT-4還開放了一個使用功能，允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡，這是因爲系統提示中規定了“你只是一個語言模型……你的知識截止於2021年9月”。現在通過修改這句話，GPT-4就可以展現出更多樣的性格，比如帶入更多元化的思維方式，而不僅僅把自己侷限在一個語言模型中等等。

不僅如此，GPT-4比以前的版本更爲龐大，這意味着它已經藉助比前輩更多的數據進行了訓練，並且在模型文件中有更多的權重，從而使得它的運行成本更高。就任務而言，GPT-4的表現比前輩更好，它可以遵循自然語言的複雜指令並生成技術或創意內容，而且它可以還更深入地做到這一點：它支持生成和處理多達32768個標記（約25000個文本單詞），從而實現比前輩更長的內容創建或文本分析。