微軟牛逼!bing搶先gpt支持識圖功能

近日 Reddit 有網友發現,自己的 Bing Chat 賬號悄悄新增了一個上傳圖片的入口,把圖片上傳上去後,Bing Chat 竟然會識圖回答!

我啪的一聲,很快啊!

就打開了自己的edge,發現我根本沒有識圖的圖標,只能把圖片做成短鏈複製粘貼發給bing纔可以識別。。

衆所周知,微軟曾透露 Bing Chat 使用的GPT-4 模型

而在上個月的大更新日誌中有提到會爲 Bing 加入多模態支持,綜合來看,Bing Chat 很可能正在向用戶逐步開放識圖功能測試


那麼問題來了?

ChatGPT能不能支持識圖功能?

什麼是多模態支持?

我詳細查詢後發現

今年的3月14日,ChatGPT的開發機構OpenAI正式發佈其里程碑之作GPT-4。

GPT-4是一個多模態大模型(接受圖像和文本輸入,生成文本)

GPT-4可以接受圖像和文本輸入,而GPT-3.5只接受文本;GPT-4在各種專業和學術基準上的表現達到“人類水平”,在事實性、可引導性和可控制方面取得了“史上最佳結果”;當任務的複雜性達到足夠的閾值時,GPT-4比GPT-3.5更可靠,更有創造力,能夠處理更細微的指令。

只可惜,OpenAI 表示圖像輸入功能仍然是研究預覽階段,還不能向公衆公開。

雖然bingchat支持識圖功能,但也有着不小的缺陷

例入:

上傳一張《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列着非常多的角色,要求 Bing Chat 一一認出所有的角色。

結果是,Bing Chat 在 12 個角色中認出了 7 個,看來二次元問題對它來說還是有點難度

圖來自貼吧,侵權聯繫刪除

在此前ChatGPT 由於出色的文字理解和表達能力,已經被人們開發出了學外語、練口語的功能。

而從bingchat的表現來看

視覺識別推出後,大家不僅可以看懂醫院醫生開的藥單,而且可以用bingchat或者chatgpt來完成複雜的數理化問題(作業幫第一個下架?)

甚至於可以幫助大家做基礎的醫療判斷

bing分析腎元過濾的原理

大小姐當網絡醫生來簡單診斷皮膚病

當然bingchat回答終究只能起到參考作用,並不能做專業意見。

(此前曾有一位老律師因誤信chatGPT而導致失業)


所以微軟要完全開放識圖功能還必然要做大量的限制和調試,這樣才能保證公衆不會因爲盲目信ai的回答而引起安全問題。

bingchat的識圖功能目前只開放了個別用戶,如果你感興趣 ,那就快點登錄你的微軟賬號,在和bing的聊天框裏多沒多圖標

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com