近日 Reddit 有网友发现,自己的 Bing Chat 账号悄悄新增了一个上传图片的入口,把图片上传上去后,Bing Chat 竟然会识图回答!
我啪的一声,很快啊!
就打开了自己的edge,发现我根本没有识图的图标,只能把图片做成短链复制粘贴发给bing才可以识别。。
众所周知,微软曾透露 Bing Chat 使用的GPT-4 模型
而在上个月的大更新日志中有提到会为 Bing 加入多模态支持,综合来看,Bing Chat 很可能正在向用户逐步开放识图功能测试
那么问题来了?
ChatGPT能不能支持识图功能?
什么是多模态支持?
我详细查询后发现
今年的3月14日,ChatGPT的开发机构OpenAI正式发布其里程碑之作GPT-4。
GPT-4是一个多模态大模型(接受图像和文本输入,生成文本)
GPT-4可以接受图像和文本输入,而GPT-3.5只接受文本;GPT-4在各种专业和学术基准上的表现达到“人类水平”,在事实性、可引导性和可控制方面取得了“史上最佳结果”;当任务的复杂性达到足够的阈值时,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。
只可惜,OpenAI 表示图像输入功能仍然是研究预览阶段,还不能向公众公开。
虽然bingchat支持识图功能,但也有着不小的缺陷
例入:
上传一张《任天堂大乱斗》游戏的角色图,同一张图上有排列着非常多的角色,要求 Bing Chat 一一认出所有的角色。
结果是,Bing Chat 在 12 个角色中认出了 7 个,看来二次元问题对它来说还是有点难度
图来自贴吧,侵权联系删除
在此前ChatGPT 由于出色的文字理解和表达能力,已经被人们开发出了学外语、练口语的功能。
而从bingchat的表现来看
视觉识别推出后,大家不仅可以看懂医院医生开的药单,而且可以用bingchat或者chatgpt来完成复杂的数理化问题(作业帮第一个下架?)
甚至于可以帮助大家做基础的医疗判断
bing分析肾元过滤的原理
大小姐当网络医生来简单诊断皮肤病
当然bingchat回答终究只能起到参考作用,并不能做专业意见。
(此前曾有一位老律师因误信chatGPT而导致失业)
所以微软要完全开放识图功能还必然要做大量的限制和调试,这样才能保证公众不会因为盲目信ai的回答而引起安全问题。
bingchat的识图功能目前只开放了个别用户,如果你感兴趣 ,那就快点登录你的微软账号,在和bing的聊天框里多没多图标
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com