微软发布可视 ChatGPT,一种用于图像的技术,已在 GitHub 开源

据外媒报道及GitHub页面显示,微软昨日(3月10日)发布了一个名为“Visual ChatGPT”的新模型,这意味着将允许通过聊天发送消息并在聊天期间接收图像,使用户能够使用图像与ChatGPT进行交互,而不仅仅是文本。截至发文,短短18小时,已有7.7k的收藏(星标)

根据官方展示的demo,此项目能够识别图片中的物品,询问是什么颜色,当你给予要求后,能根据你的要求一键处理图片,进行图片内的物体替换,将图片进行添加滤镜等

Q: 你能给我生成一只猫吗?

A: 当然,这是给你的一直猫

Q: 你可以把这只猫替换成狗然后删除书吗?

A: 这是一张将猫替换成狗然后移除掉书的图片

Q: 那太棒了,你能生成出这张图片的精确的边缘轮廓吗?

A: 这是这张图的精确轮廓边缘

Q: 现在生成一只黄色的狗在这张图片的基础上

A: 这是给你的一只黄色的狗

Q: [发送了一张图片]

A: 收到

Q: 摩托车是什么颜色的?

A: 摩托车是黑色的

Q: 你可以移除这个摩托车吗?

A: 摩托车已从这张摩托车上移除,这是新的图片

微软在GitHub展示的系统框架

目前该项目已开源至GitHub,可直接在本地部署体验,使用MIT协议,这代表将可以使用,复制和修改,可以免费使用或出售,甚至是用于闭源商用,唯一的条件是保留MIT协议

开源链接: https://github.com/microsoft/visual-chatgpt

参考资料

[1]Mohit Pandey.[EB/OL]. https://analyticsindiamag.com/microsoft-unveils-visual-chatgpt-a-chatgpt-for-images/.March 10, 2023-March 11, 2023.

[2]Microsoft.[EB/OL]. https://github.com/microsoft/visual-chatgpt.March 10, 2023-March 11, 2023.

封面来源

https://149695847.v2.pressablecdn.com/wp-content/uploads/2023/03/visual-chatgpt-2048x1152.jpg

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com