Skip to content

RAG Embedding

LYOfficial edited this page May 19, 2026 · 1 revision

🧠 RAG 嵌入模型

OneDocs 使用 RAG(检索增强生成)技术提升文档分析质量。本文介绍如何配置嵌入模型。


什么是 RAG?

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将文档内容向量化后,让 AI 更精准理解文档结构和语义的技术。

简单来说:

  • 不使用 RAG:AI 直接阅读全文,可能遗漏重要内容
  • 使用 RAG:AI 先通过向量检索定位关键段落,再进行针对性分析,覆盖更全面

为什么需要配置?

嵌入模型会将文档内容转化为向量表示,帮助 AI:

  1. 更精准地理解文档结构:识别章节、段落之间的关系
  2. 更全面地覆盖内容:避免遗漏重要信息
  3. 更高效地处理长文档:通过检索定位关键内容

💡 不配置嵌入 Token 也可以使用基本分析功能,但分析质量可能有所下降,尤其是长文档。


配置步骤

1. 获取 SiliconFlow Token

OneDocs 使用 SiliconFlow 的 BAAI/bge-m3 模型进行文本嵌入:

  1. 前往 SiliconFlow 免费注册
  2. 注册即送免费额度
  3. 在控制台获取 API Token

💡 BAAI/bge-m3 为免费模型,注册赠送的额度足够日常使用。

2. 在 OneDocs 中配置

  1. 进入「设置」→「通用
  2. 找到「🧠 RAG 嵌入模型配置」区域
  3. 在输入框中填入你的 SiliconFlow API Token
  4. 观察状态指示灯:
    • ✅ 绿色:配置成功,嵌入服务可用
    • ⚠️ 黄色:嵌入服务不可用,请检查 Token

3. 验证配置

配置成功后,状态指示灯会显示:

  • 使用个人 Token✅ 已配置个人 Token,嵌入服务可用
  • 使用免费额度✅ 使用开发者提供的免费额度,剩余次数:XX

工作原理

上传文档 → 文本分块 → 嵌入向量化 → 向量存储
                                          ↓
分析请求 → 检索相关段落 → 组合提示词 → AI 生成结果
  1. 文本分块:将文档按段落和语义切分为小块
  2. 嵌入向量化:使用 BAAI/bge-m3 模型将文本块转化为向量
  3. 检索增强:分析时,先检索与任务最相关的文本块
  4. 组合提示词:将检索到的内容与任务提示词组合,发送给 AI 模型

常见问题

Q: 不配置嵌入模型能用吗?

可以。不配置嵌入模型时,OneDocs 会使用全量分块策略(按页面顺序逐块分析),仍可正常完成分析。但分析质量可能不如启用 RAG 时好,尤其是对长文档。

Q: 嵌入模型会消耗我的 API Key 额度吗?

不会。嵌入模型使用的是 SiliconFlow 的独立 Token,与你配置的分析模型 API Key 是分开的。

Q: 免费额度用完了怎么办?

  • 注册新的 SiliconFlow 账号获取新额度
  • 或充值 SiliconFlow 账户继续使用
  • 也可以不使用嵌入功能,基本分析仍可正常进行

Q: 嵌入数据会上传到服务器吗?

嵌入向量化的过程会通过 SiliconFlow API 进行,文档的文本内容会发送到 SiliconFlow 的服务器进行向量化。但 OneDocs 不会存储或转发你的文档内容到其他服务器。

Clone this wiki locally