Buy Me a Coffee

AI Agent 的下一步

人工智慧正在以驚人的速度發展,其中一個最令人興奮的領域就是 AI Agent。這些系統旨在與外部世界互動、執行任務,並根據環境的變化做出明智的決策。隨著越來越多公司和開發人員開始使用這種新興技術,探索 AI Agent 未來的發展方向就變得至關重要。

Youtube影片來源

在最近的 Anthropic 線上活動中,Langchain 創始人 Harrison Chase 分享了他對 AI Agent 未來三個關鍵領域的看法:規劃 (planning)、使用者體驗 (UX) 和記憶體 (memory)。本文將根據 Chase 的演講,為開發人員提供實用的見解和建議。

規劃 AI Agent 的行為

目前的語言模型還無法可靠地規劃多步驟任務。開發人員常需要使用外部提示策略來強化 AI 的規劃能力。Chase 質疑這些提示策略是暫時的權宜之計,還是未來必要的組件。他認為,未來模型 API 可能會內建這些策略。

此外,Chase 強調了流程工程 (flow engineering) 的重要性。AlphaCode 等頂尖系統並非憑藉更好的模型或提示,而是透過優化的流程設計來達到卓越表現。這意味著開發人員需要謹慎設計 AI 系統的狀態機和工作流程。

規劃建議說明
使用提示策略暫時使用提示策略來增強 AI 的規劃能力。
嘗試流程工程仔細設計 AI 系統的狀態機和工作流程。
關注模型 API 更新留意未來模型 API 是否會內建規劃功能。

改善 AI Agent 的使用者體驗

Chase 認為目前的 AI Agent 應用程式仍未找到與使用者互動的最佳方式。如果人類參與過多,AI 就無法發揮應有的功效;但如果人類參與過少,系統又可能出現失誤。他讚賞新工具 Devoin 引入了「倒帶和編輯」功能,讓使用者可以回到先前的狀態,並編輯 AI 的行為,使其做出更明智的決策。

這種 UX 設計提高了可靠性和可控性。Chase 認為,將這種功能融入 AI Agent 將是未來的關鍵趨勢。

UX 建議說明
嘗試倒帶和編輯讓使用者能回到先前狀態並修正 AI。
人機平衡互動尋找人機互動的最佳平衡點。
簡化操作流程簡化 AI 應用程式的操作流程。

賦予 AI Agent 記憶能力

記憶能力是未來 AI Agent 不可或缺的一環。Chase 區分了「程序記憶」和「個人化記憶」兩種形式。前者指 AI 能記住如何正確執行某項任務;後者指 AI 能記住與特定使用者相關的個人資訊和喜好。

他展示了一個 AI 記事應用的原型,能記住使用者去過的地方和喜歡的食物。將這些元素融入 AI 應用有助於提供個性化和人性化的體驗。

記憶建議說明
實踐程序記憶讓 AI 能記住執行任務的正確步驟。
納入個人化記憶讓 AI 能記住使用者的個人資訊和喜好。
多模態支援支援文字、影像等多種模態的記憶功能。

Chase 為 AI Agent 的發展勾勒出了前景廣闊的願景。透過優化規劃、UX 和記憶體功能,AI Agent 將變得更加可靠、人性化和有效率。作為開發人員,我們有責任積極探索和實驗這些新興技術,以創造出真正強大且友善的 AI 助手。讓我們共同邁向 AI 的美好未來!