微軟牛逼！bing搶先gpt支持識圖功能

近日 Reddit 有網友發現，自己的 Bing Chat 賬號悄悄新增了一個上傳圖片的入口，把圖片上傳上去後，Bing Chat 竟然會識圖回答！

我啪的一聲，很快啊！

就打開了自己的edge，發現我根本沒有識圖的圖標，只能把圖片做成短鏈複製粘貼發給bing纔可以識別。。

衆所周知，微軟曾透露 Bing Chat 使用的GPT-4 模型

而在上個月的大更新日誌中有提到會爲 Bing 加入多模態支持，綜合來看，Bing Chat 很可能正在向用戶逐步開放識圖功能測試

那麼問題來了？

ChatGPT能不能支持識圖功能？

什麼是多模態支持？

我詳細查詢後發現

今年的3月14日，ChatGPT的開發機構OpenAI正式發佈其里程碑之作GPT-4。

GPT-4是一個多模態大模型（接受圖像和文本輸入，生成文本）

GPT-4可以接受圖像和文本輸入，而GPT-3.5只接受文本；GPT-4在各種專業和學術基準上的表現達到“人類水平”，在事實性、可引導性和可控制方面取得了“史上最佳結果”；當任務的複雜性達到足夠的閾值時，GPT-4比GPT-3.5更可靠，更有創造力，能夠處理更細微的指令。

雖然bingchat支持識圖功能，但也有着不小的缺陷

例入：

上傳一張《任天堂大亂鬥》遊戲的角色圖，同一張圖上有排列着非常多的角色，要求 Bing Chat 一一認出所有的角色。

結果是，Bing Chat 在 12 個角色中認出了 7 個，看來二次元問題對它來說還是有點難度

在此前ChatGPT 由於出色的文字理解和表達能力，已經被人們開發出了學外語、練口語的功能。

而從bingchat的表現來看

視覺識別推出後，大家不僅可以看懂醫院醫生開的藥單，而且可以用bingchat或者chatgpt來完成複雜的數理化問題（作業幫第一個下架？）

甚至於可以幫助大家做基礎的醫療判斷

當然bingchat回答終究只能起到參考作用，並不能做專業意見。

（此前曾有一位老律師因誤信chatGPT而導致失業）

所以微軟要完全開放識圖功能還必然要做大量的限制和調試，這樣才能保證公衆不會因爲盲目信ai的回答而引起安全問題。

bingchat的識圖功能目前只開放了個別用戶，如果你感興趣，那就快點登錄你的微軟賬號，在和bing的聊天框裏多沒多圖標

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

热门游戏

相關資訊 更多