跳到主要内容

ARGO 快速开始

创建第一个bot

  1. 在首页"workspace"下,选择顶部导航栏的"Bots"

  2. 点击"Ceate a bot"

  3. 填写bot名称和描述,并提交

  4. 点击新创建的bot,进入bot编辑页面

  5. 在右上角选择要用的模型(如llama3.2:8b、qwen2.5:7b)

  6. 编辑 "Prompt"

  7. 保存并开始对话

  8. 在编辑页,鼠标悬浮助手回复的消息,会显示"Prompt Logs",点击查看实际输入给大模型的提示词内容,用于调试

  9. 返回首页,点击bot,可以进入助手的会话页,发起多轮会话,会话会被保存于左侧会话列表中

alt text alt text alt text alt text

下载模型

  1. 在首页"workspace"下,选择顶部导航栏的"Models"

  2. "Installed Model" 是已安装模型列表,"Models Store" 是热门ollama模型下载市场

  3. 可以在"URL Download"中选择huggingface下载方式,输入huggingface社区中的模型repo id即可完成开源社区的模型下载

  4. 可以在"URL Download"中选择ollama下载方式,输入ollama官网模型列表的 "模型名:模型tag",即可完成ollama模型下载

  5. 可以在"Models Store"中选择热门模型,直接点击下载,如果该模型有不同的参数大小,则可以选择指定参数量的模型进行下载

  6. 模型下载会显示下载进度,下载完成后可以在Bot编辑页选择该模型

alt text

创建知识库

  1. 支持的文档类型:pdf、docx、csv、markdown、txt、yaml、json等

  2. 在"Workspace"下的Knowledge中,创建知识库

  3. 选择知识库解析的模型很重要,关系到知识库检索的准确度,这里从模型大小、中英文的准确率角度推荐了2个模型: a) 英文文档:nomic-embed-text b) 中文文档:shaw/dmeta-embedding-zh c) 其他选项可参考模型排名 https://huggingface.co/spaces/mteb/leaderboard

  4. 在Bot编辑页,添加知识库,可以让Bot在回答问题时,先进行知识库的RAG检索,再基于检索结果作为知识来跟用户对话

  5. 在Bot编辑页中,添加了知识库并对话后,可在"Prompt Logs"中,看到知识库返回的内容会拼接到Prompt提示词中输入给大模型,完成对话。

alt text alt text alt text alt text

推荐使用的模型

聊天对话 ( 从 "Models → Models Store" 下载 )

知识库解析 ( 从 "Models → Models Store" 下载 )

  • English: nomic-embed-text
  • Chinese: shaw/dmeta-embedding-zh
  • 其他模型建议, 看排行榜 向量模型 排行榜