ARGO 快速开始
创建第一个bot
-
在首页"workspace"下,选择顶部导航栏的"Bots"
-
点击"Ceate a bot"
-
填写bot名称和描述,并提交
-
点击新创建的bot,进入bot编辑页面
-
在右上角选择要用的模型(如llama3.2:8b、qwen2.5:7b)
-
编辑 "Prompt"
-
保存并开始对话
-
在编辑页,鼠标悬浮助手回复的消息,会显示"Prompt Logs",点击查看实际输入给大模型的提示词内容,用于调试
-
返回首页,点击bot,可以进入助手的会话页,发起多轮会话,会话会被保存于左侧会话列表中
下载模型
-
在首页"workspace"下,选择顶部导航栏的"Models"
-
"Installed Model" 是已安装模型列表,"Models Store" 是热门ollama模型下载市场
-
可以在"URL Download"中选择huggingface下载方式,输入huggingface社区中的模型repo id即可完成开源社区的模型下载
-
可以在"URL Download"中选择ollama下载方式,输入ollama官网模型列表的 "模型名:模型tag",即可完成ollama模型下载
-
可以在"Models Store"中选择热门模型,直接点击下载,如果该模型有不同的参数大小,则可以选择指定参数量的模型进行下载
-
模型下载会显示下载进度,下载完成后可以在Bot编辑页选择该模型
创建知识库
-
支持的文档类型:pdf、docx、csv、markdown、txt、yaml、json等
-
在"Workspace"下的Knowledge中,创建知识库
-
选择知识库解析的模型很重要,关系到知识库检索的准确度,这里从模型大小、中英文的准确率角度推荐了2个模型: a) 英文文档:nomic-embed-text b) 中文文档:shaw/dmeta-embedding-zh c) 其他选项可参考模型排名 https://huggingface.co/spaces/mteb/leaderboard
-
在Bot编辑页,添加知识库,可以让Bot在回答问题时,先进行知识库的RAG检索,再基于检索结果作为知识来跟用户对话
-
在Bot编辑页中,添加了知识库并对话后,可在"Prompt Logs"中,看到知识库返回的内容会拼接到Prompt提示词中输入给大模型,完成对话。
推荐使用的模型
聊天对话 ( 从 "Models → Models Store" 下载 )
- 英文: llama3.1:8b
- 中文: qwen2.5:7b
- 其他模型建议, 看排行榜 对话模型 排行榜
知识库解析 ( 从 "Models → Models Store" 下载 )
- English: nomic-embed-text
- Chinese: shaw/dmeta-embedding-zh
- 其他模型建议, 看排行榜 向量模型 排行榜