在诸多测试中表现比人类都好!GPT-4意味着什么?它厉害在哪?

自旧金山初创公司OpenAI去年11月推出ChatGPT聊天机器人,并其迅速走红后,“生成式人工智能”成为了今年科技界最热门的话题。ChatGPT允许用户提出问题或请求,并给出十分世故和创造性的答案。目前,一些主要的大型科技公司均争先恐后地将类似的功能引入其产品中。但是目前看来,其他的科技公司还是晚了一步。

就在今天,OpenAI公布了其大型语言模型的最新版本GPT-4。GPT-4 是一个大型多模态模型,能接受图像和文本输入,再输出正确的文本回复。实验表明,GPT-4 在各种专业测试和学术基准上的表现与人类水平相当。


而相对于之前版本的GPT来说,GPT-4可以更准确地解决你的难题,多模态的GPT-4还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈。

首先,看图能力可以用来解释表情包、梗图。比如如果你提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点。

其次,GPT-4可以理解图表中数据的含义,并做进一步计算。甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。


根据OpenAI表示,GPT-4错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。相比之下,GPT-3.5在律师考试中的得分一般都是倒数10%左右。

在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如带入更多元化的思维方式,而不仅仅把自己局限在一个语言模型中等等。


不仅如此,GPT-4比以前的版本更为庞大,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。就任务而言,GPT-4的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达32768个标记(约25000个文本单词),从而实现比前辈更长的内容创建或文本分析。

当然,AI毕竟是AI,OpenAI也表示目前GPT-4并不完美,它在很多场景下的能力都不如人类。尽管这个新的机器人似乎能对已经发生的事情进行推理,但当被要求对未来进行假设时,它就不那么擅长了。它似乎是在借鉴别人的说法,而不是创造新的猜测。

不仅如此该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI表示,GPT-4正在努力解决其局限性,例如社会偏见、幻觉和对抗性提示。

#ai人工智能#


在小黑盒PC端加速器输入Kenan66、wjb66或wow66,即可每月分别白嫖三天会员时长,鹅鹅杀必备的加速器加速器加速多个地区,支持steam微软NS亚马逊等商城,有多个小号每月稳定白嫖

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com