[Day 3] 生成式 AI 代理人

在第三天的課程中，你將深入探索生成式 AI 代理人的世界。你不僅會學習如何構建複雜的 AI 代理人，了解其核心組件與反覆開發流程，還會接觸到進階的代理架構與方法，例如多代理系統、代理評估等技術。透過本單元的學習與實作，你將掌握如何將大型語言模型連接到現有系統，並與現實世界互動。

本單元內容

🎙️ Podcast 聆聽
收聽本單元的Podcast 摘要，先行瞭解生成式 AI 代理人的基本概念與運作原理。
📄 白皮書閱讀
閱讀《Generative AI Agents》白皮書，以深入了解代理人相關的理論基礎與設計方法。
💻 Kaggle 實作練習
透過 Kaggle 上的 codelab 練習，你將完成以下項目：
1. 與資料庫互動 (使用函數調用)：
  利用函數調用技術，讓 AI 代理人能與資料庫進行互動，從中檢索所需資訊。
2. 建立代理訂單系統 (LangGraph)：
  使用 LangGraph 平台，構建一個模擬咖啡廳訂單的 AI 代理系統，實現代理人與現實業務的結合。
[選修] 進階單元 3b - “Agents Companion”
此單元為選修內容，包括：
- 收聽進階單元的 Podcast 摘要。
- 閱讀進階《Agents Companion》白皮書，了解更多進階代理人設計與應用。

本日學習重點

今天的課程重點在於：

代理人基礎：
學習生成式 AI 代理人的核心組件與反覆開發流程，瞭解如何從概念到實作建構出功能完整的代理人。
進階代理架構：
探索多代理系統、代理評估等進階技術，了解如何設計更智能且互動性更高的代理人架構。
實作與整合：
透過 Kaggle 上的實作練習，學習如何將大型語言模型與現有系統連接，實現與現實世界的互動應用。
例如，透過函數調用技術為聊天機器人提供 SQL 工具（包含 Gemini 2.0 Live API 範例），以及構建一個在咖啡廳中接單的 LangGraph 代理系統。

透過今天的學習，你將能夠設計並構建出既智能又實用的 AI 代理系統，並深入了解代理人如何與外部系統連結，共同創造更具應用價值的解決方案。

Day 3 直播精華整理

第三天的直播聚焦在生成式 AI 代理。今天我們深入探討了如何利用前兩天學到的基礎模型、提示工程、embeddings 與向量資料庫等技術，來打造能夠觀察、推理並自主或半自主執行任務的 AI 代理。講者們除了介紹生成式 AI 代理的基本概念與核心組成（如模型、工具與調度層）之外，還分享了如何利用工具調用、外部資料連結，以及多代理系統的應用與挑戰。

Q&A 專家問答

Q1：請問 Notebook LM 的功能與優勢？

問題內容：
作為 Notebook 和 Project Mariner 的忠實用戶，請問 Stephen 能否簡單介紹 Notebook LM 的核心功能與優勢？

專家觀點：

Stephen 說明 Notebook LM 能夠將上傳的文件轉換成資料庫，並以 AI 專家方式回答相關問題，同時附帶來源引用以驗證事實。
系統還提供視覺化的 mind maps，協助使用者快速導航與理解複雜資訊。

Q2：如何設計能夠輔助人類的生成式 AI 代理？

問題內容：
請問在設計能夠輔助人類思考與創造的 AI 代理時，應注意哪些設計原則？又如何平衡代理人的自主性與使用者控制？

專家觀點：

Stephen 強調模型必須嚴格根據上傳的文件資料來回答，確保事實正確。
同時，必須給予模型一定的創意空間，以便提供額外的思考點，但不能偏離核心資料。
提到不同版本模型對指令解讀可能不同，需持續調整 prompt 以達到最佳平衡。

Q3：如何評估與除錯 AI 代理的行為？

問題內容：
在定義、評估及除錯自主或半自主 AI 代理人的行為時，有哪些新方法、測試框架或工具能確保代理人如預期運作並保持與使用者目標一致？

專家觀點：

Patrick 提出傳統「金標準測試資料集」容易因模型更新而失效，建議採用情境（scenario）測試。
情境測試著重任務完成與結果，而非僅僅流程細節，能提供更彈性的評估。
持續的觀察與調整機制是確保代理人穩定運作的關鍵。

Q4：如何協同函式呼叫與 grounded search 提升代理人效能？

問題內容：
請問在建構 AI 代理時，如何透過函式呼叫與 grounded search 協同運作，確保代理人能準確、安全且可靠地執行多步驟任務？

專家觀點：

Julia 與 Patrick 指出，透過函式呼叫能使代理人利用外部工具，減少僅靠模型知識產生幻覺的風險。
使用 few-shot 例子可提升代理人控制函式調用順序的能力。
結合 prompt 工程與工具調用，可大幅提高任務執行的準確性與效率。

Q5：企業在採用生成式 AI 代理時面臨哪些挑戰？

問題內容：
生成式 AI 代理從實驗階段走向生產部署時，企業在採用上最大的障礙是技術、倫理問題，還是管理代理人行為與整合的複雜性？

專家觀點：

Antonio 強調，關鍵在於滿足使用者需求與確保各代理間的協同運作。
需同時關注局部代理（單一任務）與全局流程（整體運作）的「良好定義」。
建立多維度的監控指標，以確保整體系統的穩定與安全。

Q6：如何防止長時間運行的代理人偏離原始目標？

問題內容：
面對 LLM 驅動的複雜推理與工具使用，如何確保長時間運行的代理人能持續保持原始目標並避免偏離（drift）？

專家觀點：

Antonio 建議建立監控指標與定期評估機制，持續追蹤代理人行為。
利用外部評估模型（例如 LLM 擔任評審）及 reinforcement learning 技術，幫助調整與校正代理行為。
結合回測資料與人類回饋，以進行動態校正。

Q7：Gemini 是否支援 MCP 以及如何整合？

問題內容：
請問 Gemini 是否支援 MCP？若支援，如何在代理人流程中整合 MCP？這種組合的優缺點有哪些？

專家觀點：

Alan 表示 Gemini 支援 MCP，並在公開範例中已有展示。
MCP 作為輕量化的 API 封裝，有助於簡化跨系統整合。
優點在於降低整合成本，但在處理高度敏感資料的生產環境中，仍需謹慎評估安全性。

Q8：如何處理即時資料的矛盾與錯誤？

問題內容：
AI 系統如何評估來自多個來源的即時資料可靠性，進而解決矛盾並自我修正錯誤決策？

專家觀點：

Julia 與 Jacqueline 提出，可以利用專門的評估代理人收集與整合多方資料，再產生候選回答供系統選擇。
系統可透過多回合的批評與反饋機制，持續自我校正與改善。
設計時需平衡資料處理速度與正確性，避免因即時性而產生誤判。

Q9：高度自主代理人可能存在哪些風險？

問題內容：
針對能夠自行創造工具的高度自主 AI 代理人，您認為其可能存在哪些根本限制與風險？又該如何安全管理？

專家觀點：

Julian 與 Allan 表示，目前高度自主代理人仍需人類介入進行最終審核，以防工具失控。
建議在工具生成過程中設立嚴格的審查與版本控制機制，提高透明度。
強調在生產環境中必須採取額外的安全措施，確保工具創建過程符合預期規範。

Q10：生產環境中部署即時 AI 代理的挑戰有哪些？

問題內容：
在生產環境中部署即時 AI 代理時，響應時間、API 成本與準確度等方面面臨哪些挑戰？遇到使用者指令衝突或模糊查詢時，有哪些技術可以改善推理？

專家觀點：

Assad 等專家提到，部署時需在響應速度、成本控制與準確性間找到平衡。
從傳統輪詢模式轉為全雙向事件流架構，有助於提升即時互動性能。
當面對模糊或衝突指令時，代理人可透過追問、提供選項或利用歷史記憶來協助判斷。

Q11：整合 Gemini API 時的安全性與隱私考量有哪些？

問題內容：
在將 Gemini 類 API 整合到可能處理敏感使用者資料的應用程式中，應注意哪些安全性與隱私保護的關鍵考量？

專家觀點：

Alan 強調必須注意使用者資料在各系統間的傳遞與儲存方式，避免資料外洩。
使用前需詳閱服務條款與隱私政策，確保資料不被用於未經授權的訓練。
建議將原始使用者輸入轉換為結構化資料，並搭配傳統 DevOps 與安全管理措施來保護敏感資訊。

Pop Quiz 課後練習

來驗收一下今天「生成式 AI 代理」的學習成果吧！

Pop Quiz Q1

哪一項最能正確描述生成式 AI 代理？

(A) 只能生成文字的語言模型
(B) 能夠觀察、推理並利用工具執行任務的應用程式
(C) 一種用於資料儲存的數據庫
(D) 用於訓練 AI 模型的硬體設備

答案

正確答案： B. 能夠觀察、推理並利用工具執行任務的應用程式

解釋： 生成式 AI 代理不僅僅是單純的語言模型，而是結合模型、工具呼叫及調度層等核心組件，協同完成特定任務。

Pop Quiz Q2

在生成式 AI 代理的核心組成中，哪個部分主要負責管理代理內部的推理與行動流程？

(A) 模型
(B) 調度層
(C) 工具呼叫
(D) 數據存儲

答案

正確答案： B. 調度層

解釋： 調度層負責協調代理的內部思考與行動循環，確保代理能夠根據預定邏輯進行決策與執行，而非單純依賴模型生成文字或數據存取。

Pop Quiz Q3

關於生成式 AI 代理中使用的「函數調用」，下列何者描述正確？

(A) 允許代理直接調用外部 API 以取得最新資訊
(B) 僅用於生成文字，不會調用任何外部資源
(C) 僅能調用一次，無法進行多次操作
(D) 用來儲存代理的設定參數

答案

正確答案： A. 允許代理直接調用外部 API 以取得最新資訊

解釋： 函數調用使代理能夠動態地調用外部工具或 API，從而獲取即時且真實的數據，並進一步支持任務執行。

Pop Quiz Q4

在生成式 AI 代理中，數據存儲的主要作用是什麼？

(A) 儲存代理的設定與參數
(B) 為代理提供即時且動態的資料存取能力
(C) 控制代理的推理流程
(D) 驗證代理生成內容的準確性

答案

正確答案： B. 為代理提供即時且動態的資料存取能力

解釋： 數據存儲（Data Stores）主要用於存取與管理外部資料，讓代理能夠基於最新資訊產生更具針對性的回應。

Pop Quiz Q5

關於多代理系統（Multi-agent systems），下列哪項敘述正確？

(A) 多代理系統指的是單一模型處理所有任務
(B) 多代理系統中，各專家代理協同合作，共同完成複雜任務
(C) 多代理系統只適用於處理簡單任務
(D) 多代理系統完全不需要人類介入

答案

正確答案： B. 多代理系統中，各專家代理協同合作，共同完成複雜任務

解釋： 多代理系統利用不同專長的代理協同合作，以解決單一代理難以應付的複雜任務，進而提升整體系統效能。

Pop Quiz Q6

在生成式 AI 代理中，為什麼需要使用工具呼叫（如 API 調用）？

(A) 以提升生成文字的速度
(B) 讓代理能夠獲取即時且真實世界的資料並執行相關操作
(C) 僅用於改善模型的語言生成效果
(D) 工具呼叫僅能用來加速推理速度

答案

正確答案： B. 讓代理能夠獲取即時且真實世界的資料並執行相關操作

解釋： 工具呼叫使代理能夠超越模型內部知識的限制，透過調用外部資源取得最新數據，從而生成更具時效性與精確性的回應。