AI Agent Debugger 是一款為 AI Agent 開發者打造的視覺化除錯工具。不同於僅聚焦於模型輸入與輸出的除錯方式,AI Agent Debugger 將除錯範圍擴展到完整的 Agent 執行流程。它能清楚展示每一輪對話、每一次模型呼叫、MCP 工具呼叫、自訂 Skill 執行以及最終輸出,幫助開發者觀察 Agent 的運作鏈路,並快速定位提示詞、模型設定、工具呼叫或業務邏輯中的問題。AI Agent Debugger 適用於以下情境:除錯 AI 大模型工具呼叫鏈,排查工具參數、執行結果或異常原因
比較不同模型執行相同任務的表現,評估回應時間、Token 消耗與成本等關鍵指標
驗證 MCP Server 與 AI 大模型的整合是否符合預期
反覆最佳化系統提示詞,並觀察不同設定對執行結果的影響
建議使用最新版 Apidog 用戶端,以體驗 AI Agent Debugger 的完整功能。
建立新的 Agent 除錯工作階段#
從 Apidog 頂部標籤列進入 AI Agent Debugger。在左側選擇模型提供者,例如 OpenAI 或 Anthropic。
選擇提供者與模型後,系統會自動匹配對應的 Base URL,例如 https://api.openai.com/v1,無需手動輸入
設定提示詞#
在 Prompts 標籤中設定 Agent 的輸入內容。System Prompt:用於定義 Agent 的角色、目標、限制與工具使用規則,屬於 Agent 設定
User Prompt:用於填寫本次工作階段的測試輸入,例如「What's Apidog?」
如果希望在傳送後自動清空輸入框,可以勾選 Clear after Send。設定工具#
在 Tools 標籤中,你可以選擇 Agent 在執行期間可呼叫的工具。標籤上的數字表示目前可用或已設定的工具數量。內建工具#
AI Agent Debugger 提供 AI 大模型常用的內建工具,用於讀取檔案、搜尋內容、執行命令或擷取網頁內容。| 工具 | 說明 |
|---|
bash | 在持久化 Shell 工作階段中執行命令 |
web_fetch | 擷取網頁內容並轉換為 Markdown、文字或 HTML |
read | 讀取文字、圖片或 PDF 檔案 |
edit | 對檔案執行精準字串替換 |
write | 建立或覆寫檔案 |
grep | 使用正規表示式搜尋檔案內容 |
glob | 使用 glob 模式尋找檔案 |
kill_shell | 重設目前的 Shell 工作階段 |
你可以依需求啟用或停用個別工具。停用後,Agent 在執行期間將無法呼叫該工具。MCP 工具#
如果需要 Agent 呼叫外部系統或自訂能力,可以在 Tools 標籤中新增 MCP Servers。AI Agent Debugger 支援以下 MCP 連線方式:HTTP:連線到支援 Streamable HTTP 的 MCP Server
SSE:連線到基於 Server-Sent Events 的 MCP Server
對於需要驗證的 MCP Servers,你可以設定請求 Headers,或使用 OAuth 2.0 完成授權。成功連線後,你可以從工具清單中選擇要公開給 Agent 使用的工具。設定 Skills#
在 Skills 標籤中,你可以為 Agent 設定可重複使用的 Skills。標籤上的數字表示目前已載入的技能數量。在 Agent 執行期間,相關 Skills 會依任務需求被讀取,從而取得更完整的操作指引。設定驗證與模型參數#
在 Authentication 標籤中設定模型服務或 MCP 服務所需的驗證資訊。在 Settings 標籤中,你可以設定模型執行時參數,例如 Temperature、Max Tokens、Top P 等。不同模型提供者可能支援不同參數;請以你的模型提供者實際支援的參數為準。查看工作階段清單#
每次點擊 Run,左側都會產生一筆新的工作階段記錄。Session 3
1 turn · 1 step · 10s · 3.1k tokens · $0.02
gpt-5.5
你可以點擊左側不同的工作階段,查看對應的對話輪次與呼叫追蹤。查看對話輪次#
中間的 Turns 面板用於顯示目前工作階段中的多輪對話。當一個工作階段包含多個使用者輸入時,每一輪都會作為獨立對話輪次顯示。點擊某個對話輪次後,你可以在右側查看對應的呼叫流程。查看追蹤#
右側的 Traces 面板用於顯示 Agent 的完整執行流程。當工具呼叫失敗或模型回傳異常時,你可以在呼叫追蹤中定位到具體步驟,並查看輸入參數與回傳內容,以便排查問題。比較模型表現#
你可以使用相同的提示詞與工具設定,選擇不同模型執行任務,並透過工作階段清單比較模型表現。工作階段摘要會顯示回應時間、Token 消耗與預估成本等關鍵指標,幫助你評估不同模型在效果、效能與成本之間的取捨。FAQ#
Agent 沒有呼叫預期的工具,該如何排查?#
3.
MCP Server 是否已成功連線,且目標工具未被停用。
MCP 工具呼叫失敗時該怎麼辦?#
你可以在呼叫追蹤中查看失敗的工具呼叫,重點檢查輸入參數、輸出結果與錯誤訊息。常見原因包括:OAuth、API Key 或 Header 驗證設定不正確
多次執行相同任務可以評估什麼?#
Agents 是非確定性系統。相同提示詞在不同模型、不同參數或不同工具設定下,可能產生不同的執行路徑。建議透過多次執行與工作階段比較,觀察執行步驟、呼叫結果、耗時、Token 消耗與最終輸出,從而評估更合適的設定。