知识库使用指南
本文档旨在帮助用户创建、更新、绑定和管理知识库,便于用户高效上传和管理文档,并与机器人进行集成。
1. 创建知识库
创建知识库的步骤如下:
-
设置知识库名称与描述:输入清晰的名称和简短描述,以便快速识别该知识库的内容。
-
选择嵌入模型(Embedding Model):选择一个合适的嵌入模型,用于文档检索。
-
配置相似度阈值:设置检索时的相似度阈值,以影响查询结果的相关度。
-
调整文本分割参数:
- Chunk Size:定义每个文本块的大小。较大的
chunk_size
会包含更多的上下文,但可能导致提示(prompt)超出模型的上下文限制。如果需要进行文档级别的检索(例如 RAG),建议将chunk_size
设置得较大(如 5000 字符或更多)。请注意,设置过大会导致模型无法处理超出其最大上下文的内容。 - Overlap:设置文本块之间的重叠部分。适当的重叠(如块大小的 10%-20%)有助于确保上下文信息的完整性。
- Top K:定义每次检索时返回的最相关
K
个结果。较高的Top K
数值会返回更多的匹配结果,但也会增加计算量。
示例:
- 若需要按整篇文档进行 RAG 检索,
chunk_size
可以设置为 5000 字符,overlap
设置为 500(即每个块有 500 字符的重叠)。Top K
可以设置为 10,意味着每次检索时返回最相关的 10 个块。
- Chunk Size:定义每个文本块的大小。较大的
-
点击提交:设置完成后,点击“Submit”按钮保存并创建知识库。
可选配置 - Folder Path
此项为可选设置。如果填写该路径,知识库将与指定的文件夹同步,类似于个人云盘功能。如果目录不存在,将会显示错误提示。
创建成功后,您将看到已创建的知识库列表。
2. 更新知识库
若需要更新已创建的知识库,可在知识库列表中进行更新操作。以下为更新界面截图:
注:更改 chunk_size
、overlap
或 embedding_model
时,知识库将重新建立索引。
3. 绑定机器人
为了让机器人能够访问并利用知识库,您需要将知识库与机器人绑定。操作步骤如下:
- 进入“Bot”页面。
- 点击“绑定知识库”按钮。
- 选择要绑定的知识库。
4. 上传文档
您可以通过两种方式上传文档:
4.1 直接上传至知识库
进入相应的知识库页面,点击上传按钮,支持以下两种上传方式:
- 上传文件:直接上传本地文件。
- 上传 URL 链接:提供文档对应的网络链接进行解析。
4.2 在聊天页面上传文档
绑定机器人后,您还可以通过聊天页面上传文档。在聊天页面,点击右下角的上传按钮即可。
上传后,系统会自动生成文档摘要。
5. 查看文档解析进度
上传文档后,您可以查看文档的解析进度。以下是文档解析状态的显示界面: