Skip to content

配置智能体

智能体创建完成后,可在详情页的 编辑 标签页中进行全面配置。配置界面采用左右分栏布局:左侧为配置编辑区,右侧为对话预览区,支持实时调试。

本文详细介绍每一项配置选项的含义和使用方法。

配置界面概览

进入智能体详情页后,顶部标签栏提供三个视图:

标签功能
编辑配置智能体的全部参数,左右分栏实时预览
分析查看活跃用户、对话量、消息趋势等统计数据
可观测性查看 Trace 追踪记录,进行全链路分析和评分

配置修改后,点击右上角 发布 按钮保存。保存成功后会显示绿色勾号标识。


基本信息

基本信息卡片包含智能体的身份标识配置。

配置项说明
头像点击头像区域可打开资源选择器,从资源库选择或上传图片。未设置头像时,显示名称首字母的渐变色圆形头像。
名称智能体的显示名称。将展示在列表卡片、对话界面标题等位置。
描述对智能体功能的概括性描述。展示在列表卡片和对话欢迎区域。

执行应用

执行应用用于指定智能体的实际推理引擎运行在哪个 Agent Client 实例上。

在 Snail AI 的 Server-Agent 分布式架构 中,Server 端负责请求编排和路由,Agent Client 负责实际的模型调用和工具执行。通过选择不同的执行应用,可以实现:

  • 资源隔离:将不同业务线的智能体路由到不同的 Client 实例
  • 灵活部署:本地工具(如数据库查询、文件处理)在 Client 所在网络内执行,数据不出域
  • 负载分配:将高流量智能体路由到专用的高性能 Client

配置方式:

从下拉列表中选择已注册的应用(格式:应用名称 (AppID))。如不选择,系统将使用默认路由策略。


对话模型

在配置信息的 CHAT 模型 折叠项中,选择该智能体使用的大语言模型。

下拉列表展示所有已配置的 CHAT 类型模型,格式为 提供商 / 模型名称

TIP

对话模型的配置和管理请参考 模型管理 文档。Snail AI 统一支持 OpenAI、Claude、Ollama、Gemini、火山引擎等主流大模型。


绑定 RAG 知识库

开启知识库开关后,智能体将具备基于文档的检索增强生成(RAG)能力。

配置步骤

  1. 在"知识库"行,将开关切换为开启状态
  2. 在出现的下拉列表中选择目标知识库(格式:知识库名称 (#ID)
  3. 每个智能体当前支持绑定 一个 知识库

工作原理

当用户提问时,系统会:

  1. 将用户问题进行向量化
  2. 在绑定的知识库中执行混合检索(向量 + BM25 + 融合 + 重排)
  3. 将检索到的相关文档片段注入上下文
  4. 由大模型基于上下文生成回答

前置条件

使用 RAG 功能前,需要先在 RAG 知识库 模块中创建知识库并完成文档上传和索引构建。


绑定 MCP 服务

MCP(Model Context Protocol)服务为智能体提供外部工具调用能力。一个智能体可以绑定 多个 MCP 服务器。

配置步骤

  1. 在"MCP 工具"折叠项中,点击右上角 添加 按钮
  2. 在弹出的选择弹窗中,勾选需要绑定的 MCP 服务器
  3. 每个服务器条目展示:名称、连接状态(已连接/未连接)、连接地址和描述
  4. 点击 确认 完成选择

已绑定服务管理

绑定完成后,所选服务以列表形式展示在折叠项中,每个条目包含:

  • 服务名称和连接状态标签
  • 连接地址(自动拼接 baseUri 和 endpoint)
  • 移除按钮(点击可取消绑定)

工作原理

当大模型判断需要调用外部工具时,会通过 MCP 协议向绑定的服务器发送工具调用请求。Snail AI 支持三种 MCP 传输协议:

  • SSE(Server-Sent Events)
  • Streamable HTTP
  • Stdio(标准输入输出)

TIP

MCP 服务器的配置和管理请参考 MCP 工具 文档。


绑定 Skill 技能

Skill 技能是预定义的结构化处理能力,与 MCP 工具类似但更轻量。一个智能体可以绑定 多个 技能。

配置步骤

  1. 在"SKILL"折叠项中,点击右上角 添加 按钮
  2. 在弹出的选择弹窗中,勾选需要绑定的技能
  3. 每个技能条目展示:名称、描述和关联的文件名
  4. 点击 确认 完成选择

已绑定技能管理

与 MCP 服务类似,已绑定的技能以列表形式展示,支持单独移除。

TIP

当选中的技能列表为空时,Skill 功能将自动禁用;绑定至少一个技能后自动启用。


配置记忆

记忆功能使智能体具备对话上下文的延续能力。Snail AI 提供两种记忆机制:

短期记忆(滑动窗口)

短期记忆通过保留最近 N 条对话消息来维持上下文连贯性。

配置项默认值范围说明
滑动窗口大小20 条1 ~ 100保留最近多少条消息作为上下文发送给模型

TIP

窗口大小影响 Token 消耗。对于大多数场景,20 条已足够。如果智能体需要频繁引用较早的对话内容,可适当增大;如果追求响应速度和成本控制,可适当减小。

长期记忆(向量召回)

开启记忆开关后,可从下拉列表选择一个记忆配置。长期记忆会将对话中的关键信息向量化存储,在后续对话中通过语义检索召回相关记忆。

配置步骤:

  1. 将"记忆"行的开关切换为开启
  2. 在出现的下拉列表中选择记忆配置(格式:配置名称 (#ID)
  3. 设置短期记忆滑动窗口大小

前置条件

使用长期记忆功能前,需要先在 记忆管理 模块中创建记忆配置。


联网搜索

在"知识库"折叠区域中,联网搜索 开关控制智能体是否可以实时检索互联网信息。

  • 开启(默认):智能体可在必要时搜索网络获取最新信息
  • 关闭:智能体仅基于已有知识和绑定的知识库回答

TIP

对于内部知识问答、保密场景,建议关闭联网搜索,确保回答完全基于私域知识库。


系统提示词

系统提示词(System Prompt / Instruction)是智能体行为定义的核心。它告诉大模型"你是谁、能做什么、应该怎么回答"。

编辑方式:

在"系统提示词"卡片中,使用多行文本框编辑。支持 Markdown 格式,建议使用结构化的提示词模板:

markdown
## 角色
[定义角色身份]

## 能力
[列出核心能力]

## 限制
[说明行为边界]

## 输出格式
[指定回答格式要求]

文本框支持自动高度调整(12 ~ 24 行),适应不同长度的提示词。


问候语

问候语(Greeting)是用户进入对话界面时看到的第一条消息。一段好的问候语应该:

  • 简要说明智能体的功能
  • 引导用户如何开始对话
  • 语气友好、专业

示例:

你好!我是企业财报解读专家。你可以向我提供任意上市公司的财报数据,我将帮你分析关键财务指标、识别风险和增长点。请问你想分析哪家公司的财报?


预设问题

预设问题(Preset Questions)展示在对话界面的欢迎区域,帮助用户快速理解智能体能做什么,并一键开始对话。

管理方式:

  • 添加:在输入框中输入问题文本,点击 添加 按钮
  • 编辑:直接修改已有问题的文本内容
  • 删除:点击问题右侧的删除按钮
  • 建议设置 3 ~ 5 个有代表性的问题

示例:

  • "分析腾讯 2024 年 Q3 财报的营收变化趋势"
  • "对比阿里巴巴和京东的毛利率走势"
  • "帮我解读最新发布的年报中的风险提示"

精选推荐

在配置信息底部的"精选推荐"折叠项中,可以将智能体标记为企业精选

标记为精选的智能体将在列表页的"企业精选"区域优先展示,适合推荐给全组织使用的优质智能体。


配置保存

所有配置修改后,点击页面右上角的 发布 按钮保存。保存 API 会将以下全部字段一次性提交到后端:

  • 基本信息(名称、描述、头像)
  • 系统提示词、问候语、预设问题
  • 对话模型
  • MCP 服务绑定列表
  • Skill 技能绑定列表
  • RAG 知识库绑定
  • 记忆配置
  • 联网搜索开关
  • 执行应用
  • 精选推荐标记

保存成功后,右上角显示绿色勾号和"已保存"状态提示。


下一步

Apache 2.0 Licensed