全文約3500字,閱讀需要約10分鐘
一個讓人困惑的問題
你有沒有想過:爲什麼ChatGPT能和你聊得天南海北,卻不能幫你訂一張機票?
你問它"幫我訂一張去上海的機票",它只能回答:“你可以去攜程或飛豬預訂,記得比較價格……”
它知道怎麼訂機票,但做不到。
問題出在哪?
傳統的大語言模型(LLM)本質上是一個文本生成系統。你輸入問題,它輸出文本。它能寫代碼、能翻譯、能解釋複雜概念,但有一個根本限制:只能輸出文本,不能執行操作。
你讓它幫你整理文件夾,它只能給出一個"整理方案";你讓它幫你發郵件,它只能幫你"起草郵件內容"。
從2023年開始,這個限制正在被突破。AI領域出現了一個新物種:AI Agent(人工智能代理)。
AI Agent和傳統LLM的核心區別在於:它能執行操作,而不只是生成文本。
你讓它訂機票,它會打開訂票網站,填寫你的信息,完成支付;你讓它整理文件夾,它會直接操作你的文件系統,把文件分類歸檔。
![]()
能力對比
從"只能說話"到"能幹活",這是AI能力的質變。
但一個只會生成文本的AI,怎麼突然就能"幹活"了?
Agent的三大核心能力
一個只會生成文本的AI,怎麼就能"幹活"了?
答案:它需要具備三大核心能力——規劃、記憶、工具調用。
規劃能力(Planning)
面對一個複雜任務,Agent需要把它拆解成可執行的步驟。
比如你讓Agent"幫我策劃一次日本旅行",它會自動拆解成:查詢航班信息 → 比較價格 → 預訂機票 → 查找酒店 → 規劃行程 → 預訂景點門票 → 整理行程單。
主流的規劃框架叫ReAct(Reasoning + Acting),即"邊思考邊行動"。Agent不是一次性規劃完所有步驟,而是在每一步執行後,根據結果調整下一步計劃。這更符合實際場景——執行過程中總會遇到意外情況,需要動態調整。
記憶能力(Memory)
Agent需要記住信息。它需要兩種記憶:
短期記憶:記錄當前任務的狀態。比如你在訂機票過程中,Agent需要記住你選擇的航班、填寫的乘客信息、當前的支付狀態。
長期記憶:存儲歷史信息。比如你之前告訴過Agent你的護照號、常用地址、支付偏好,它應該記住這些信息,下次不用再問。
記憶機制讓Agent能夠處理需要多步驟、跨會話的複雜任務。
工具調用能力(Tool Use)
這是Agent最關鍵的能力。
Agent本身只是一個"大腦",它通過調用外部工具來完成任務。這些工具可以是:搜索引擎、日曆API、代碼解釋器、數據庫、操作系統API、各種SaaS服務的API。
工具調用的核心技術是Function Calling(函數調用),最早由OpenAI在2023年6月提出。簡單說,就是讓大模型理解工具的描述,然後生成符合規範的調用指令。
一個問題浮現了
Agent要調用工具,就需要和各種外部系統對接。但問題是——每個工具的接口都不一樣。
想連接GitHub,要寫一套接口;想連接飛書,又要寫一套;想連接公司內部系統,還得再寫一套……開發者的時間都花在了"適配接口"上。
一個完整Agent系統的樣子
OpenClaw是2025年底爆火的開源AI智能體框架,GitHub星標突破18.8萬。它的架構清晰地展示了Agent系統的組成:
![]()
openclaw的組成
三層協作:調度層發指令 → 推理層做決策 → 工具層執行操作 → 結果反饋 → 循環繼續。
實際的數據流更爲複雜,這裏只是一個簡單邏輯
工具困境的解決方案
OpenClaw的工具層用了一個關鍵技術:MCP。
MCP(Model Context Protocol)是一個開放標準,目的是標準化大語言模型與外部工具之間的交互方式。核心理念是:一次開發,到處使用。
過去,開發者要爲每個AI應用寫一套接口。有了MCP,只需要寫一個MCP Server,所有支持MCP的AI應用都能用。
這就像早期電腦的外設問題:鼠標是圓口,鍵盤是方口,打印機是扁口……每買一個新設備,都要專門配一個接口。直到USB(通用串行總線)出現,所有外設統一用一種接口,問題徹底解決。
MCP,很可能就是AI工具調用的"USB"。
MCP是什麼?
MCP(Model Context Protocol,模型上下文協議)是Anthropic在2024年11月發佈的開放標準,目的是標準化大語言模型與外部工具、數據源之間的交互方式。
過去,如果你想讓自己的數據庫能被Claude訪問,需要專門爲Claude寫一套接口;如果想被其他AI應用訪問,又要寫一套。每個AI應用都有自己的接口規範,開發者疲於奔命。
有了MCP,開發者只需要寫一個MCP Server,就可以讓所有支持MCP的AI應用——Claude Desktop、Cursor、Windsurf、Trae等——都能訪問你的數據或工具。
MCP的三層架構
MCP採用Host-Client-Server三層架構:
Host(宿主程序):用戶直接交互的界面,比如Claude Desktop、Cursor、Trae。它負責管理MCP客戶端的生命週期,協調與服務器的通信。
Client(客戶端):Host內部的組件,負責與MCP Server建立一對一連接。一個Host可以同時連接多個MCP Server。
Server(服務器):真正提供能力的地方。它對外暴露三種核心能力:
Resources(資源):數據,比如文件內容、數據庫記錄
Tools(工具):可調用的函數,比如執行SQL查詢、發送郵件
Prompts(提示模板):預定義的提示詞模板
雖然名字裏帶個server,但大家不要被誤導了,MCP server和傳統上的server沒有一毛錢關係,與其說是“server”,不如說是"service"。
怎麼用MCP?
主包主包,你說了這麼多有的沒的,我就想問有沒有有手就能用的辦法?
有的兄弟,有的。
一:使用已支持MCP HOST/CLIENT的AI應用
這是最簡單的方式。下載支持MCP的應用,配置好服務器,就能直接使用。目前支持MCP的主流應用:
Claude Desktop:Anthropic官方,原生支持
Claude Code:命令行版本
Cursor:AI編程IDE
Trae:字節跳動出品,國內用戶友好
OpenCode:開源項目
這些應用都已經內置好了MCP host和MCP client組件,只需要自己配置好對應的mcp server就可以開箱即用。
二:尋找現成的MCP server
如果需要比較特別的mcp server,很多開發者已經開源了各種,MCP server,可以直接使用:
文件系統服務:讓AI讀寫本地文件
Excel服務:讓AI操作Excel表格
GitHub服務:讓AI操作GitHub倉庫
飛書服務器:讓AI連接飛書文檔、任務、日曆
你可以在GitHub搜索"mcp server"找到各種開源MCP,也可以參考官方倉庫:github.com/modelcontextprotocol
三:自己開發MCP server
如果有特殊需求(比如連接公司內部系統),可以自己開發。官方提供Python和TypeScript的SDK。
辦公場景怎麼用?
MCP不只是程序員的工具,普通辦公場景同樣適用:
做表格:excel-mcp-server可以讓AI直接讀寫Excel文件,幫你整理數據、生成報表。
寫郵件:郵件相關的MCP服務器可以連接Gmail、Outlook,幫你起草郵件、整理收件箱。
寫日報週報:飛書已經官方支持MCP,AI可以幫你生成周報、日報,自動同步到飛書文檔。
配置思路
不同Agent配置MCP的方式不同,但思路是一致的:
找到配置入口——在應用的設置中找到MCP相關選項
添加MCP服務器——填寫服務器名稱和連接信息
重啓並測試——重啓應用後嘗試讓AI使用新工具
具體操作請參考各應用的官方文檔。
安全問題:AI訪問我的數據,安全嗎?
這是很多人關心的問題。尤其是企業用戶——業務數據的敏感性不容忽視。
核心風險:數據會離開你的控制
當你讓AI處理數據時,這些數據會被髮送到AI服務商的服務器。這意味着:
你的業務數據會離開本地環境
AI服務商(如Anthropic、OpenAI、字節跳動)會"看到"這些數據
數據可能被用於模型訓練(取決於服務商政策)
對於企業來說,這是不可接受的風險。 客戶信息、財務數據、商業機密——這些數據一旦泄露,後果嚴重。
其他風險
權限過度授權:配置MCP服務器時,可能授權了比需要更多的權限。
操作不可逆:AI不只是"讀",還能"寫"。它可能誤刪文件、發送錯誤郵件。
一個關鍵原則
不要將敏感業務數據發送給外部LLM供應商。
很多企業已經明令禁止員工將業務數據輸入ChatGPT等AI工具。MCP讓AI能訪問更多數據,風險也隨之放大。
內網環境能用MCP嗎?
答案:完全可以。 MCP支持私有化部署。
方案一:混合部署
MCP服務器運行在內網,AI請求訪問外網。敏感數據可以選擇不發送。
方案二:完全私有化部署(推薦)
AI模型也部署在內網,數據完全不離開內網。
技術棧:
Ollama:本地運行開源大模型(Llama、Qwen、DeepSeek)
Dify:開源AI應用平臺,支持MCP
MCP Server:在內網部署
效果:無需付費API、無需翻牆、數據完全在內網。
部署方式決定安全級別
![]()
安全級別比較
內網環境不是MCP的障礙,反而是MCP發揮價值的地方。企業內部系統複雜、數據敏感,恰恰需要一個標準化的方式讓AI安全地接入。
我們正站在一個轉折點
從ChatGPT到AI Agent,從各自爲政的工具調用到統一的MCP協議,AI正在從一個"聊天工具"進化爲能真正幹活的"數字助手"。
MCP剛剛起步,支持的應用還在增加;AI Agent的能力還在提升,規劃更智能、記憶更持久、工具更豐富。但方向已經清晰:AI不再只是回答問題的工具,而是能執行任務的助手。
Agent + MCP:一個完整的圖景
MCP不是Agent的全部,而是Agent的基礎設施之一。
一個完整的Agent系統需要:
規劃能力(怎麼拆解任務)
推理能力(怎麼做決策)
記憶能力(怎麼記住上下文)
工具調用能力(怎麼執行操作)← MCP解決的是這一層
MCP讓工具調用變得標準化、低成本,但它不解決規劃、推理、記憶的問題——這些需要Agent框架本身來實現。
這意味着什麼?
對於個人用戶:AI能幫你處理繁瑣的工作——表格、郵件、週報。你只需要審覈、確認、微調。
對於開發者:開發一個MCP Server,就能讓所有支持MCP的AI應用使用。不用再爲每個AI應用單獨適配接口。
對於企業:可以私有化部署,數據不出內網。AI能安全地接入企業內部系統。
一個開放的問題
AI從"只能說話"變成"能幹活",我們準備好了嗎?
我們正在學習如何給這位助手分配任務、提供工具、監督工作。這不僅是技術問題,也是管理問題、倫理問題。
但有一點是確定的:讓AI爲我們幹活的時代,已經開始了。
本文大概介紹了AI AGENT和MCP,希望看完的你能對此有所瞭解,各位盒友還有什麼想看的,歡迎留言!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
