RAG Embedding

🧠 RAG 嵌入模型

OneDocs 使用 RAG（检索增强生成）技术提升文档分析质量。本文介绍如何配置嵌入模型。

什么是 RAG？

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将文档内容向量化后，让 AI 更精准理解文档结构和语义的技术。

简单来说：

不使用 RAG：AI 直接阅读全文，可能遗漏重要内容
使用 RAG：AI 先通过向量检索定位关键段落，再进行针对性分析，覆盖更全面

为什么需要配置？

嵌入模型会将文档内容转化为向量表示，帮助 AI：

更精准地理解文档结构：识别章节、段落之间的关系
更全面地覆盖内容：避免遗漏重要信息
更高效地处理长文档：通过检索定位关键内容

💡 不配置嵌入 Token 也可以使用基本分析功能，但分析质量可能有所下降，尤其是长文档。

配置步骤

1. 获取 SiliconFlow Token

OneDocs 使用 SiliconFlow 的 BAAI/bge-m3 模型进行文本嵌入：

前往 SiliconFlow 免费注册
注册即送免费额度
在控制台获取 API Token

💡 BAAI/bge-m3 为免费模型，注册赠送的额度足够日常使用。

2. 在 OneDocs 中配置

进入「设置」→「通用」
找到「🧠 RAG 嵌入模型配置」区域
在输入框中填入你的 SiliconFlow API Token
观察状态指示灯：
- ✅ 绿色：配置成功，嵌入服务可用
- ⚠️ 黄色：嵌入服务不可用，请检查 Token

3. 验证配置

配置成功后，状态指示灯会显示：

使用个人 Token：✅ 已配置个人 Token，嵌入服务可用
使用免费额度：✅ 使用开发者提供的免费额度，剩余次数：XX

工作原理

上传文档 → 文本分块 → 嵌入向量化 → 向量存储
                                          ↓
分析请求 → 检索相关段落 → 组合提示词 → AI 生成结果

文本分块：将文档按段落和语义切分为小块
嵌入向量化：使用 BAAI/bge-m3 模型将文本块转化为向量
检索增强：分析时，先检索与任务最相关的文本块
组合提示词：将检索到的内容与任务提示词组合，发送给 AI 模型

常见问题

Q: 不配置嵌入模型能用吗？

可以。不配置嵌入模型时，OneDocs 会使用全量分块策略（按页面顺序逐块分析），仍可正常完成分析。但分析质量可能不如启用 RAG 时好，尤其是对长文档。

Q: 嵌入模型会消耗我的 API Key 额度吗？

不会。嵌入模型使用的是 SiliconFlow 的独立 Token，与你配置的分析模型 API Key 是分开的。

Q: 免费额度用完了怎么办？

注册新的 SiliconFlow 账号获取新额度
或充值 SiliconFlow 账户继续使用
也可以不使用嵌入功能，基本分析仍可正常进行

Q: 嵌入数据会上传到服务器吗？

嵌入向量化的过程会通过 SiliconFlow API 进行，文档的文本内容会发送到 SiliconFlow 的服务器进行向量化。但 OneDocs 不会存储或转发你的文档内容到其他服务器。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

RAG Embedding

🧠 RAG 嵌入模型

什么是 RAG？

为什么需要配置？

配置步骤

1. 获取 SiliconFlow Token

2. 在 OneDocs 中配置

3. 验证配置

工作原理

常见问题

Q: 不配置嵌入模型能用吗？

Q: 嵌入模型会消耗我的 API Key 额度吗？

Q: 免费额度用完了怎么办？

Q: 嵌入数据会上传到服务器吗？

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

📜 OneDocs 指南

快速入门

使用指南

进阶功能

其他

Clone this wiki locally