智能體(Agent)時代,工具已不再只是傳統 API 或函數接口的簡單封裝,而是決定智能體能否高效完成任務的關鍵。
為了讓智能體真正釋放潛力,我們需要重新思考工具開發的方式。傳統軟件開發依賴確定性邏輯,而智能體是非確定性的,它們在相同輸入下可能產生不同輸出,這意味著為智能體設計工具需要新的范式。
而新的范式不僅僅是如何開發工具,更在于如何讓工具真正發揮最大效能。畢竟,AI 智能體的強大程度取決于我們為其提供的工具,但問題是:如何讓這些工具發揮最大效能?
來自 Anthropic 的一篇文章為大家指出了一條可行路徑。

在這篇文章中,Anthropic 介紹了一些在多種 agentic AI 系統中被證明最有效的性能提升技巧。
閱讀本文后,你可以做到:
- 構建并測試工具原型;
- 如何創建并運行全面的評估;
- 與智能體協作(如 Claude Code),自動提升模型性能。

工具的定義
在計算機中,確定性系統在給定相同輸入時,每次都會產生相同的輸出;而非確定性系統,比如智能體,即便在相同的初始條件下,也可能生成不同的響應。
在傳統的軟件開發中,我們是在確定性系統之間建立契約。例如,一個關于天氣的函數調用 getWeather ("NYC"),無論調用多少次,都將以完全相同的方式返回紐約的天氣。
而基于大模型的工具是一種全新的軟件形式,它體現的是確定性系統與非確定性智能體之間的契約。
舉個例子:當用戶問「我今天要帶傘嗎?」時,智能體可能會調用天氣工具、也可能直接基于常識回答,甚至先提出一個澄清性問題(比如確認具體地點)。有時,智能體還可能出現幻覺,或者根本沒弄明白該如何使用工具。
這意味著,我們在為智能體編寫軟件時,必須從根本上重新思考方法:不能再把工具和 MCP 服務器當作普通函數或 API 來寫,而是需要專門為智能體設計。