搭建一个多 Agent 系统,听起来就挺复杂的。你需要考虑各个 Agent 的职责划分、它们之间的协作流程、状态管理,还有工具调用等等。很多时候,我们大部分精力都耗费在了这些“管道工程”上,而不是真正核心的业务逻辑设计。
Google 的 ADK (Agent Development Kit) Visual Agent Builder 就是为了解决这个问题而生的。它提供了一个可视化的画布,让你能像画流程图一样设计和编排多个 Agent,甚至可以直接用自然语言描述你的意图,让 AI 帮你生成整个工作流。
这篇文章,我会带你上手这个工具,通过一个具体的例子——构建一个旅行规划 Agent——来展示它的实际威力。你将学到:
- 如何启动可视化构建器并连接不同的 Agent。
- 怎样用一句自然语言指令,自动生成子 Agent 和所需工具。
- 如何利用内置的搜索、评分和追踪功能。
- 如何测试和调试你的 Agent 工作流。
最终,我们会得到一个能根据你的目的地、日期和预算,并行研究航班、住宿和活动,并最终提供一到两个清晰行程方案的智能助手。
什么是 ADK Visual Agent Builder?
简单来说,Google ADK Visual Agent Builder 是一个由 Gemini 驱动、用于设计多 Agent 工作流的可视化画布。你跟 AI 助手描述你的想法,它就能帮你生成一个完整的 Agent 架构,并把它渲染在画布上,然后你马上就能在聊天界面里测试它。
它有几个核心组件:
- LLM Agents: 画布上的每个节点都是一个 Agent,你可以为它指定一个模型(比如推理能力强的 Gemini 1.5 Pro 或速度快的 Gemini 1.5 Flash)和一段 Prompt,还可以挂载一些工具。
- 编排 Agents (Orchestration agents): 这类特殊的节点,比如循环(Loop)、并行(Parallel)或顺序(Sequential),负责协调子 Agent 的执行顺序。
- 工具 (Tools): 内置了像
google_search这样的实用工具,也支持自定义函数工具。Agent 可以通过这些工俱与外部世界交互,获取信息。 - 回调与追踪 (Callbacks and Trace): 这是一个非常实用的功能。你可以实时看到哪个 Agent 正在运行,它的输入和输出是什么,方便你一步步调试 Agent 的推理过程和工具调用。
ADK 把模型调用、工具集成和状态传递这些麻烦事都处理好了,让你可以专注于 Agent 的行为设计。
实战:构建一个旅行规划 Agent
接下来,我们动手搭一个旅行规划 Agent。它的工作流程是这样的:一个主 Agent 接收用户需求,然后一个并行 Agent 同时启动三个子 Agent 分别负责研究航班、住宿和活动,最后再由主 Agent 汇总所有信息,整理出最终的旅行方案。
第一步:环境准备
首先,我们需要安装 ADK 的命令行工具,它用来启动本地的 Web UI。
pip install --upgrade google-adk
adk --version
执行后,如果能看到类似 adk, version 1.18.0 的输出,就说明安装成功了。--upgrade 参数能确保你用的是最新版本。
接着是配置 API Key。你需要去 Google AI Studio 创建一个 API Key,并确保你的 Google Cloud 项目已经启用了结算。拿到 Key 之后,在终端里把它设置为环境变量。
# macOS/Linux
export GOOGLE_API_KEY=YOUR_API_KEY
# Windows (PowerShell)
setx GOOGLE_API_KEY "YOUR_KEY"
设置完后最好重启一下终端,让环境变量生效。

第二步:启动可视化构建器
万事具备,现在可以启动我们的可视化界面了。在终端里运行:
adk web
这个命令会启动一个本地开发服务器,默认地址是 http://127.0.0.1:8000。在浏览器里打开它。

点击 + 号创建一个新的 Agent,给它取个名字,比如 Travel_Agent。然后你就会看到一个三栏布局的界面:左边是配置区,中间是画布区,右边是助手/聊天区。

第三步:用自然语言“画”出 Agent 蓝图
最神奇的部分来了。我们不需要手动去拖拽节点,而是直接在右侧的聊天框里,用一段自然语言向 Gemini 描述我们想要的 Agent。
我输入了下面这段 Prompt:
Create a Travel Ops planner agent. Given user input (ordered cities, dates, budget, must/avoid prefs), run three workers in parallel—Flights, Stays, Activities—(use google_search where helpful).
Recommend up to 2 options. Prioritize stated preferences; if options are close, prefer lower cost and less total travel time.
Clearly explain the trade-offs. If options are nearly identical, return one best option and say why.
For each option, return text-only bullets: Cost (USD), Total travel time (h), Preference-fit (0–1), Pros/Cons (cost, time, experience), and a brief day-by-day (give the full day-by-day only for the recommended option).
Defaults: prices in USD, time in hours, max 2 options. Ask at most 2 clarifying questions; if data is thin, return a degraded single option with a warning.
Avoid fake booking links; provide sensible estimates and caveats.
说实话,ADK 对任务的理解和拆解能力让我有点惊讶。Gemini 处理完这段指令后,它会自动帮你生成对应的子 Agent 和工具,并将它们在画布上连接起来。

这是它根据我的 Prompt 生成的完整工作流:

所有 Agent 的指令、描述和工具都自动配置好了。

点击保存,我们的 Agent 就准备就绪了。
第四步:测试与深入“Trace”
现在,我们可以在聊天界面里跟这个 Agent 互动了。我试着问了它一个问题:
I want to travel from New York to Dubai for New Year’s for a week long vacation. Help me plan my trip within a budget of $1000
Agent 的回复相当不错:
- 它给出了清晰的纯文本方案,包含了航班选项、大致的旅行时间和旺季的价格范围。
- 它很聪明地指出了预算的挑战(新年是旅游高峰期),并给出了务实的建议,比如通过在多哈或伊斯坦布尔转机来节省开销。
- 住宿和活动的建议也符合我的目标(放松休息),而不是随便推荐一些大众景点。
- 当预算不现实时,它会明确指出限制,并建议调整日期、提高预算或者接受中转。

更有价值的是右侧的 Trace 视图。在这里,你可以清晰地看到整个工作流的执行过程:
- 根节点
travel_ops_planner接收到我的消息,然后把控制权交给协调器。 travel_coordinator(一个并行 Agent) 同时调用flights_agent,stays_agent,activities_agent这三个子 Agent。- 每个子 Agent 调用 LLM (
call_llm),并在需要时执行google_search工具 (execute_tool),然后返回结构化的信息片段。 - 最后,协调器整合所有子 Agent 的输出,格式化成最终的答案。
每个节点的蓝色条都显示了该步骤的延迟,你还可以点开 Event 查看具体的 Prompt、工具参数和模型版本。这让整个 Agent 的的思考过程变得透明且可控。

一个重要的提醒:当魔法失灵时
虽然第一次的体验很惊艳,但它并非完美。在我尝试第二个 Prompt 时,系统开始反复报错。通过查看终端日志,我发现问题出在 Gemini 生成的工具代码里(一个格式化字符串的键不匹配)。

我尝试把错误堆栈粘贴回给 Gemini,让它修复代码,但它似乎没法可靠地覆盖已生成的 Python 文件。
这让我得出了一个关键结论:ADK 的可视化构建器在编排和 Prompt 设计上非常出色,但当它自动生成代码时,你得做好心理准备——可能需要自己打开文件手动修复一些小 bug,而不是指望在聊天界面里就能完美解决所有问题。
总结与思考
Google ADK Visual Agent Builder 确实是一个能让你快速将想法变成可运行的多 Agent 系统的工具。通过这个旅行规划的例子,我们看到它如何将复杂的任务拆解、并行处理,并且整个过程都在一个可视化的界面里清晰呈现。
它的主要优点是迭代速度快、工作流透明、内置工具方便。主要的缺点是自动生成的代码可能不够健壮,需要开发者介入调试。
这再我看来,是一个非常积极的信号。它把开发者的重心从编写繁琐的“胶水代码”转移到了设计 Agent 的行为和交互逻辑上。它更像一个可以实际运行的“白板”,让你能快速验证和迭代你的 Agent 架构。
如果你对 AI Agent 开发感兴趣,这绝对是一个值得尝试的工具。
关于
关注我获取更多资讯