微软牛逼!bing抢先gpt支持识图功能

近日 Reddit 有网友发现,自己的 Bing Chat 账号悄悄新增了一个上传图片的入口,把图片上传上去后,Bing Chat 竟然会识图回答!

我啪的一声,很快啊!

就打开了自己的edge,发现我根本没有识图的图标,只能把图片做成短链复制粘贴发给bing才可以识别。。

众所周知,微软曾透露 Bing Chat 使用的GPT-4 模型

而在上个月的大更新日志中有提到会为 Bing 加入多模态支持,综合来看,Bing Chat 很可能正在向用户逐步开放识图功能测试


那么问题来了?

ChatGPT能不能支持识图功能?

什么是多模态支持?

我详细查询后发现

今年的3月14日,ChatGPT的开发机构OpenAI正式发布其里程碑之作GPT-4。

GPT-4是一个多模态大模型(接受图像和文本输入,生成文本)

GPT-4可以接受图像和文本输入,而GPT-3.5只接受文本;GPT-4在各种专业和学术基准上的表现达到“人类水平”,在事实性、可引导性和可控制方面取得了“史上最佳结果”;当任务的复杂性达到足够的阈值时,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。

只可惜,OpenAI 表示图像输入功能仍然是研究预览阶段,还不能向公众公开。

虽然bingchat支持识图功能,但也有着不小的缺陷

例入:

上传一张《任天堂大乱斗》游戏的角色图,同一张图上有排列着非常多的角色,要求 Bing Chat 一一认出所有的角色。

结果是,Bing Chat 在 12 个角色中认出了 7 个,看来二次元问题对它来说还是有点难度

图来自贴吧,侵权联系删除

在此前ChatGPT 由于出色的文字理解和表达能力,已经被人们开发出了学外语、练口语的功能。

而从bingchat的表现来看

视觉识别推出后,大家不仅可以看懂医院医生开的药单,而且可以用bingchat或者chatgpt来完成复杂的数理化问题(作业帮第一个下架?)

甚至于可以帮助大家做基础的医疗判断

bing分析肾元过滤的原理

大小姐当网络医生来简单诊断皮肤病

当然bingchat回答终究只能起到参考作用,并不能做专业意见。

(此前曾有一位老律师因误信chatGPT而导致失业)


所以微软要完全开放识图功能还必然要做大量的限制和调试,这样才能保证公众不会因为盲目信ai的回答而引起安全问题。

bingchat的识图功能目前只开放了个别用户,如果你感兴趣 ,那就快点登录你的微软账号,在和bing的聊天框里多没多图标

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com