先展示效果,我是基於GPT3.5搭建測試的。
相信有很多企業,甚至個人,想要 chatgpt 能夠回覆一些可控的內容。比如企業員工手冊,產品的產品文檔,用來當智能客服。甚至一些原有的搜索檢索內容,都可以改造成智能問答的形式重新設計。甚至對個人來說,你的一些研究資料,也可以做成知識庫成爲你的第二大腦。
整套模式,技術上其實已經成熟了,但是在數據處理等各種細節方面,包括向量庫的維護方面,還是有很多技術複雜度,不利於大家快速的搭起一個可用的東西,有很多學習成本。
在這個背景下,開源的技術方案就不討論了,有動手能力的人,自己寫、自己運維肯定沒問題。無代碼無服務器的成熟產品國外也有一些,比如典型的https://www.chatbase.co/這個產品可以讓你快速構建一個自己數據的對話 chat ,然後可以快速集成到自己前端頁面當成一個產品的智能客服。但是這個東西集成到網頁對國內用戶來說是沒有價值的,而且他定價也比較貴,起步都是 19 美元月。
如果你自己用開源方案構建,你至少需要一個成熟的向量數據,pinecone 70 美金的起步價格就更貴了。還有其他服務器和運維成本。
今天向大家介紹的這個方案,是基於GPT模型構建的垂直數據知識庫,可以使用GPT3.5,也可以使用GPT4,目前還可以直接集成到飛書,成爲飛書羣內的一個智能人。
1. 訪問 https://aiproxy.io/?i=chichann 登錄賬號,完成少量積分充值,如果測試用,21元檔位就可以使用很久。白嫖是沒戲了,畢竟OpenAI接口要收費,但比海外動輒幾十美金起步,玩一玩的成本還是挺低的。
2. 有了賬號,有了積分後,可以開始進入知識庫頁面,創建一個知識庫。
3. 完成知識庫創建後,列表頁面點擊知識庫的名字,可以進入知識庫管理頁面,去上傳你的知識文檔,這一步如果的提交網頁鏈接功能暫時還沒開放,但可以把本地的doc、pdf、txt文檔直接傳上來。如果是開發者,可以看接口文檔,通過接口來提交鏈接(開發者文檔https://docs.aiproxy.io/dev/library)
這個上傳文檔的內容,目前根據測試情況來看,段落分明,結構清晰的純文本,效果較好。複雜的pdf格式,或者帶圖片信息的,效果都不太好。這裏建議將內容整理到doc或者txt上傳,文件名可以起的有意義一些。
4. 完成知識庫的創建後,就可以在知識庫頁面點擊聊天窗口進行效果測試了。也可以直接到應用程序管理頁面,直接集成到飛書。
集成到飛書的流程
通過飛書開放平臺(https://open.feishu.cn/app)創建企業自建應用
進入應用-憑證與基礎信息頁面獲取App ID和App Secret
進入事件訂閱頁面,獲取Encrypt Key。這個頁面還可以做請求地址配置,在aiproxy得到請求地址後,回到這個頁面配置。
進入權限管理頁面,開通應用發送消息權限,權限名稱im:message:send_as_bot,這個權限的作用爲,將AI生成的內容以消息形式回覆到飛書。
在同一個權限頁面,開通應用接收消息的權限點,im:message.group_at_msg、im:message.group_at_msg:readonly、im:message.p2p_msg、im:message.p2p_msg:readonly,這些權限點的作用主要爲羣聊中@機器人、個人以私聊形式發送消息給應用的一些場景,可以根據飛書的權限點描述,以及您的功能需要決定是否開通。如果沒有開通任何收消息的權限,將無法接收用戶請求。
在事件訂閱頁面,添加接收消息事件。這一步的作用爲用戶在和應用有消息交互時,應用能夠收到消息。
在獲取到上面的App ID、App Secret、Encrypt Key應用信息後,即可到aiproxy的應用創建頁面,填寫上述信息,完成應用創建。
完成應用創建後,可以得到一個唯一的事件接收地址,類似:https://api.aiproxy.io/api/feishu/event/xxxxxxxx 回到剛纔飛書的請求配置地址,保存後即完成配置。
飛書所有信息填寫完成之後,記得創建版本進行發佈,纔可以正式應用所有配置項。
配置完成後,就可以去飛書問答測試了。我實際測試經驗來看,GPT3.5在這個場景的表現,就已經非常厲害了。但是如果輸入的文檔中沒有明顯提及的提問內容,但基於閱讀理解,可以推斷出一些答案的,此時GPT4的表現非常強勁,就像真的閱讀理解了內容一樣。
最後提醒各位注意數據安全,這個產品是新加坡運營的服務,並且知識學習和最後閱讀理解問答環節也是依賴OpenAI模型實現,一些機密數據,避免上傳。
關於如何更方便地使用ChatGPT,可以看我之前的文章:ChatGPT無障礙訪問:搭建自己專屬Chat
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com