微軟發佈可視 ChatGPT，一種用於圖像的技術，已在 GitHub 開源

據外媒報道及GitHub頁面顯示，微軟昨日（3月10日）發佈了一個名爲“Visual ChatGPT”的新模型，這意味着將允許通過聊天發送消息並在聊天期間接收圖像，使用戶能夠使用圖像與ChatGPT進行交互，而不僅僅是文本。截至發文，短短18小時，已有7.7k的收藏(星標)

根據官方展示的demo，此項目能夠識別圖片中的物品，詢問是什麼顏色，當你給予要求後，能根據你的要求一鍵處理圖片，進行圖片內的物體替換，將圖片進行添加濾鏡等

Q: 你能給我生成一隻貓嗎？
A: 當然，這是給你的一直貓
Q: 你可以把這隻貓替換成狗然後刪除書嗎？
A: 這是一張將貓替換成狗然後移除掉書的圖片
Q: 那太棒了，你能生成出這張圖片的精確的邊緣輪廓嗎？
A: 這是這張圖的精確輪廓邊緣
Q: 現在生成一隻黃色的狗在這張圖片的基礎上
A: 這是給你的一隻黃色的狗
Q: [發送了一張圖片]
A: 收到
Q: 摩托車是什麼顏色的?
A: 摩托車是黑色的
Q: 你可以移除這個摩托車嗎？
A: 摩托車已從這張摩托車上移除，這是新的圖片

微軟在GitHub展示的系統框架

目前該項目已開源至GitHub，可直接在本地部署體驗，使用MIT協議，這代表將可以使用，複製和修改，可以免費使用或出售，甚至是用於閉源商用，唯一的條件是保留MIT協議

開源鏈接: https://github.com/microsoft/visual-chatgpt

參考資料

[1]Mohit Pandey.[EB/OL]. https://analyticsindiamag.com/microsoft-unveils-visual-chatgpt-a-chatgpt-for-images/.March 10, 2023-March 11, 2023.
[2]Microsoft.[EB/OL]. https://github.com/microsoft/visual-chatgpt.March 10, 2023-March 11, 2023.

封面來源