近日 Reddit 有網友發現,自己的 Bing Chat 賬號悄悄新增了一個上傳圖片的入口,把圖片上傳上去後,Bing Chat 竟然會識圖回答!
我啪的一聲,很快啊!
就打開了自己的edge,發現我根本沒有識圖的圖標,只能把圖片做成短鏈複製粘貼發給bing纔可以識別。。
衆所周知,微軟曾透露 Bing Chat 使用的GPT-4 模型
而在上個月的大更新日誌中有提到會爲 Bing 加入多模態支持,綜合來看,Bing Chat 很可能正在向用戶逐步開放識圖功能測試
那麼問題來了?
ChatGPT能不能支持識圖功能?
什麼是多模態支持?
我詳細查詢後發現
今年的3月14日,ChatGPT的開發機構OpenAI正式發佈其里程碑之作GPT-4。
GPT-4是一個多模態大模型(接受圖像和文本輸入,生成文本)
GPT-4可以接受圖像和文本輸入,而GPT-3.5只接受文本;GPT-4在各種專業和學術基準上的表現達到“人類水平”,在事實性、可引導性和可控制方面取得了“史上最佳結果”;當任務的複雜性達到足夠的閾值時,GPT-4比GPT-3.5更可靠,更有創造力,能夠處理更細微的指令。
只可惜,OpenAI 表示圖像輸入功能仍然是研究預覽階段,還不能向公衆公開。
雖然bingchat支持識圖功能,但也有着不小的缺陷
例入:
上傳一張《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列着非常多的角色,要求 Bing Chat 一一認出所有的角色。
結果是,Bing Chat 在 12 個角色中認出了 7 個,看來二次元問題對它來說還是有點難度
圖來自貼吧,侵權聯繫刪除
在此前ChatGPT 由於出色的文字理解和表達能力,已經被人們開發出了學外語、練口語的功能。
而從bingchat的表現來看
視覺識別推出後,大家不僅可以看懂醫院醫生開的藥單,而且可以用bingchat或者chatgpt來完成複雜的數理化問題(作業幫第一個下架?)
甚至於可以幫助大家做基礎的醫療判斷
bing分析腎元過濾的原理
大小姐當網絡醫生來簡單診斷皮膚病
當然bingchat回答終究只能起到參考作用,並不能做專業意見。
(此前曾有一位老律師因誤信chatGPT而導致失業)
所以微軟要完全開放識圖功能還必然要做大量的限制和調試,這樣才能保證公衆不會因爲盲目信ai的回答而引起安全問題。
bingchat的識圖功能目前只開放了個別用戶,如果你感興趣 ,那就快點登錄你的微軟賬號,在和bing的聊天框裏多沒多圖標
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com