-
Notifications
You must be signed in to change notification settings - Fork 18
RAG Embedding
LYOfficial edited this page May 19, 2026
·
1 revision
OneDocs 使用 RAG(检索增强生成)技术提升文档分析质量。本文介绍如何配置嵌入模型。
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将文档内容向量化后,让 AI 更精准理解文档结构和语义的技术。
简单来说:
- 不使用 RAG:AI 直接阅读全文,可能遗漏重要内容
- 使用 RAG:AI 先通过向量检索定位关键段落,再进行针对性分析,覆盖更全面
嵌入模型会将文档内容转化为向量表示,帮助 AI:
- 更精准地理解文档结构:识别章节、段落之间的关系
- 更全面地覆盖内容:避免遗漏重要信息
- 更高效地处理长文档:通过检索定位关键内容
💡 不配置嵌入 Token 也可以使用基本分析功能,但分析质量可能有所下降,尤其是长文档。
OneDocs 使用 SiliconFlow 的 BAAI/bge-m3 模型进行文本嵌入:
- 前往 SiliconFlow 免费注册
- 注册即送免费额度
- 在控制台获取 API Token
💡 BAAI/bge-m3 为免费模型,注册赠送的额度足够日常使用。
- 进入「设置」→「通用」
- 找到「🧠 RAG 嵌入模型配置」区域
- 在输入框中填入你的 SiliconFlow API Token
- 观察状态指示灯:
- ✅ 绿色:配置成功,嵌入服务可用
⚠️ 黄色:嵌入服务不可用,请检查 Token
配置成功后,状态指示灯会显示:
-
使用个人 Token:
✅ 已配置个人 Token,嵌入服务可用 -
使用免费额度:
✅ 使用开发者提供的免费额度,剩余次数:XX
上传文档 → 文本分块 → 嵌入向量化 → 向量存储
↓
分析请求 → 检索相关段落 → 组合提示词 → AI 生成结果
- 文本分块:将文档按段落和语义切分为小块
- 嵌入向量化:使用 BAAI/bge-m3 模型将文本块转化为向量
- 检索增强:分析时,先检索与任务最相关的文本块
- 组合提示词:将检索到的内容与任务提示词组合,发送给 AI 模型
可以。不配置嵌入模型时,OneDocs 会使用全量分块策略(按页面顺序逐块分析),仍可正常完成分析。但分析质量可能不如启用 RAG 时好,尤其是对长文档。
不会。嵌入模型使用的是 SiliconFlow 的独立 Token,与你配置的分析模型 API Key 是分开的。
- 注册新的 SiliconFlow 账号获取新额度
- 或充值 SiliconFlow 账户继续使用
- 也可以不使用嵌入功能,基本分析仍可正常进行
嵌入向量化的过程会通过 SiliconFlow API 进行,文档的文本内容会发送到 SiliconFlow 的服务器进行向量化。但 OneDocs 不会存储或转发你的文档内容到其他服务器。