工具与能力
区分内置工具、知识库检索、语音能力和自定义模型。
能力类型
AgentBox 中的能力分为几类:
- 内置工具:LLM 可以在回答过程中调用的工具,例如网页搜索、图片生成和发音评测。
- 知识库:关联到智能体后,系统自动注入检索能力。
- 对话功能:聊天界面的语音输入和语音播报。
- 模型能力:内置模型和自定义模型(BYOK)。
这些能力的开启位置、调用方式和计费方式不同。
内置工具
网页搜索
网页搜索让 LLM 在需要实时信息时发起搜索。管理员在智能体的「工具」页签开启后,本次对话会把网页搜索工具注入给模型。
网页搜索依赖平台侧搜索服务配置。调用成功后会按工具固定积分记录用量。
图片生成
图片生成让 LLM 根据用户的文字描述请求生成图片。管理员在「工具」页签开启后,本次对话会把图片生成工具注入给模型。
图片生成依赖平台侧图片模型配置。调用成功后会按工具固定积分记录用量。
发音评测
发音评测用于把用户语音文件和参考文本发送到 Tencent SOE,返回发音分数、准确度、流利度、完整度和需要改进的词。
发音评测是 LLM 工具。它需要用户消息中包含音频文件 key,并需要模型在合适时机调用该工具。管理员可以在工具配置中选择中文或 English 评测。
知识库
知识库不是手动勾选的内置工具。管理员在智能体的「知识库」页签关联知识库后,AgentBox 会自动为该智能体注入知识库检索、读取文档和列出文档的能力。
当前知识库入口支持创建知识库、上传文档、处理文档并在智能体上关联使用。知识库适合让智能体回答内部资料、课程材料、SOP、FAQ 等内容。
语音输入
语音输入是聊天能力,不是 LLM 工具。开启后,用户可以在聊天界面录音并转写成文本。当前配置包括识别语言。
语音输入会调用语音识别服务,并按固定积分记录用量。
语音播报
语音播报是聊天能力,不是 LLM 工具。开启后,助手回复可以合成为音频。当前配置包括语速和是否自动播放新消息。
语音播报会调用语音合成服务,并按固定积分记录用量。
自定义模型(BYOK)
自定义模型让管理员添加自己的模型服务商配置,包括模型名、API Key 和可选 Base URL。配置后,智能体可以选择该自定义模型。
使用自定义模型时,模型调用不消耗 AgentBox 积分;但如果同一个智能体启用了内置工具、语音输入或语音播报,这些平台服务仍会按对应规则记录用量和消耗积分。