3GPP-Everything

基于 3GPP 规范文档的生产级 RAG Agent —— 让你像查代码一样查协议。 🌐 在线访问：https://3gpp-everything.org/

是什么

一个对 3GPP 标准文档做深度 RAG 的 Agent 系统，覆盖 GSMA 发布的 Rel-18 + Rel-19 全部 5G 系列 TS（1270 篇 / 394,859 段落块）。核心是：用自然语言问 3GPP，拿到带段落级原文引用、可点击跳转到完整章节的回答，遵循协议的严谨性**，不掺杂模型通用知识**。

你可以：

问问题，拿原文：自然语言提问（如"PDU Session 建立完整流程"），得到带 [spec § 章节] 引用的回答；点引用 chip 直接打开章节阅读器看完整原文。
跨文档 / 多证据推理：复杂问题（多实体、多文档对比）自动走 HyDE + multi-query + 多文档检索 + self-RAG 自评闭环。
工具型查询：缩写表（glossary）、章节目录（toc）、参数/IE 字段（params）、Web 搜索（仅用户显式触发，结果标注"未经 3GPP 验证"）。
收藏 / 笔记 / 反馈：对回答收藏、记笔记；点赞/点踩反馈，管理员可溯源到整段会话与引用。
会话可控：流式输出，支持取消 / 暂停 / 恢复、历史分叉（fork）与回滚（rollback）。

核心能力（按当前实现）

能力	说明
检索增强问答	Hybrid 检索（Qdrant dense 1024 维 + BM25 sparse + RRF 融合）→ Voyage rerank → LLM 生成；small2big 召回（命中小块、回展父 section）
段落级引用 + 阅读器	回答内嵌 `[spec_id § section ¶offset]` 引用，正则抽取为可点 chip → 跳转章节阅读器看完整原文
严格 grounding	仅基于检索内容生成；查无证据明示"未在 3GPP 文档中找到"；self-RAG 用独立模型做 grounding/coverage/confidence 三维自评（最多 retry 2 次强制收敛）
双路 Agent	simple 快路径（术语/字段定义，P95 < 15s）；complex 路径（多证据，HyDE + multi-query + self-RAG，P95 < 60s）
工具调度	glossary / toc / params / web_search（web 仅显式触发并标注未验证）
会话与协作	多轮历史压缩、checkpoint 取消/暂停/恢复、fork/rollback；收藏、笔记、反馈、管理员反馈溯源
鉴权	JWT + refresh + RBAC（普通用户 / 管理员）
流式	LangGraph `astream_events` → SSE 10 类事件（run/node/chunks_hit/chunks_rerank/token/final/…）

与华为 Telco-RAG 的对比评测

在 100 题中立自产题集（从 A∩B 的 R18 交集 spec 采样、闭卷、负题对称）上，三方盲评对比：

A = 3GPP-Everything（本项目；LLM 可配置，本次基准用 mimo-v2.5-pro）
B = 华为开源 Telco-RAG（github.com/netop-team/Telco-RAG，生成 LLM = gpt-4o-mini，R18 离线库）
C = 裸 LLM 基线（deepseek-v4-pro，无检索）—— 用于检验"RAG 是否真有用，还是 LLM 预训练就会"
裁判 = glm-5.1（与三方生成 backbone 都不同源，避免同源偏袒）；成对盲评匿名 + 位置对冲。

Scorecard

指标	A 本项目	B 华为 Telco-RAG	C 裸 LLM
正确性 fact_coverage（正题）	0.80	0.22	0.44
spec 归属命中（可溯源）	96%	7%	39%
检索到 recall（A/B）	0.93	0.12	—
利用率 = 答出÷检索到（A/B）	0.84	0.58	—
✅ 正确拒答（负题）	93%	0%	56%
⚠️ 幻觉率（负题，越低越好）	0%	93%	43%

成对盲评胜率（位置对冲）：A vs B = 98:2；A vs C = 84:10（平 6）。

结论

本项目（A）在每一项指标上都明显第一：最正确（fact_coverage 0.80）、可溯源（spec 命中 96%）、负题零幻觉。
RAG 的价值取决于检索质量：A 相对裸 LLM 基线（C）带来 +0.36 正确性并把幻觉压到 0，体现好检索的增益；B 在本中立题集上检索召回偏低（spec 命中 7%）是其得分的主因。

完整方法、逐题数据与详细报告：[eval/huawei_compare/results/REPORT.md](./eval/huawei_compare/results/REPORT.md)；题集与可复现代码见 [eval/huawei_compare/](./eval/huawei_compare/)。

技术栈

设计原则：现成轮子优先 + 复用本机服务 + 关键质量环节走海外 SOTA + 主 LLM 走本机国产 LiteLLM。

Agent / RAG 框架（三件套协同）

层	选型	角色
编排层	LangGraph 1.x	状态机、节点流式（`astream_events`）、PostgreSQL checkpointer 持久化会话上下文与中断恢复
数据/检索层	LlamaIndex 0.13+	文档摄取、Hybrid Retriever、BM25、reranker 包装
适配层	LangChain 0.3+	LLM 客户端（`ChatOpenAI` → LiteLLM）、Tool 装饰器、Prompt 模板

关键边界：LangGraph 节点不直接调 LlamaIndex 的高层 query engine（黑盒），而是把 LlamaIndex 当成"可控的检索 SDK"暴露 retrieve / rerank 等原子函数给 graph 调用。

模型层

生成侧 LLM 不锁定：所有 LLM 统一走本机 LiteLLM proxy（OpenAI 协议适配），生成/Vision/self-RAG 等用哪个模型可自由配置、随时切换，不写死任何具体模型。Embedding / Reranker 当前以 Voyage 为默认。下方"评测基准"行的模型名仅作复现基准记录。

用途	模型	备注
生成 / Agent 主脑	可配置 LLM（任意 OpenAI 兼容，经本机 LiteLLM）	需 ≥1M context / function calling / 长 horizon 能力；按需切换
轻量任务（路由/改写/multi-query/self-RAG）	可配置 LLM（经本机 LiteLLM）	—
Vision（索引期图片描述）	可配置多模态 LLM（经本机 LiteLLM）	单次调用同时输出 description + 结构化字段（figure_kind / visible_labels / visible_acronyms / spec_role）
Embedding（当前默认）	`voyage-4-large` @ 1024 维	Voyage AI；MRL 截断（2048 vs 1024 retrieval 差距 ≤ 2pp，省存储一半 + 检索更快）
Reranker（当前默认）	`rerank-2.5`	Voyage AI；top-50 → top-5
Eval Judge（评测基准）	`deepseek-v4-pro`	Ragas faithfulness / answer relevancy / correctness；与生成模型异源避免 self-bias
Negative Judge（评测基准）	`mimo-v2.5-pro`	拒答题 VALID/PARTIAL/INVALID 三档判别
对比裁判（评测基准）	`glm-5.1`	华为对比测试成对盲评 + 绝对指标（与对比三方 backbone 都不同源）

数据 / 存储 / 缓存（复用宿主已运行实例）

层	选型	用途
向量库	Qdrant	dense 检索（`tgpp_chunks_voyage_d1024`，394,859 points）
关系库	PostgreSQL	业务数据 + LangGraph `AsyncPostgresSaver` checkpoint + ApiUsage
稀疏检索	LlamaIndex BM25	持久化到 `INGEST_DATA_DIR/bm25/voyage/by_spec/{spec_id}.jsonl`，backend 加载现场构建
缓存	Redis	retrieve/rerank/Vision 描述/history summary，跨进程共享
ORM / 迁移	SQLAlchemy 2.0 (async) + asyncpg + Alembic	与 LangGraph PG checkpointer 共用连接

后端 / 前端 / 工具

层	选型
后端	FastAPI + SSE + Pydantic v2 + python-jose（JWT + refresh + RBAC）
前端	Flutter 3.x（Web + Android 同码） + Riverpod 2.x + go_router + dio (SSE) + flutter_markdown_plus + flutter_math_fork；黑白主调 + 冷调蓝 accent
Web 搜索（用户显式触发）	Tavily
监控	Langfuse Cloud（每节点 span + token stream + dataset run）
评测	Ragas + 175 题金标准 YAML + TeleQnA 原生 MCQ + 华为对比 100 题中立集；`eval-{daily,weekly}` GitHub Actions CI
部署	Docker Compose + Nginx + Let's Encrypt（独立 ingress 项目跨项目分流）
Lint / Type / Test	Ruff + Black + MyPy + Pytest + pytest-asyncio + httpx

完整决策依据与备选见 [docs/02-tech-selection.md](./docs/02-tech-selection.md)。

RAG 策略

数据摄取（offline indexing）

flowchart LR
    HF["GSMA/3GPP HF 数据集<br/>(R18+R19, marked/ tree)"] --> DEDUP["按 spec_id 去重<br/>R19 覆盖 R18"]
    DEDUP --> FILTER["过滤 5G TS<br/>保留 1270 篇"]
    FILTER --> SECTION["section 树还原"]
    SECTION --> ATOMIC["原子块切分<br/>(text/table/formula/figure/asn1/action_list)"]
    ATOMIC --> VISION["Vision 多模态 LLM<br/>(图片→结构化描述)"]
    VISION --> CHUNK["small2big 打包<br/>target=250 / max=400 / overlap=50 tokens<br/>(Voyage tokenizer)"]
    CHUNK --> EMBED["voyage-4-large<br/>output_dimension=1024"]
    EMBED --> QD["Qdrant<br/>tgpp_chunks_voyage_d1024"]
    EMBED --> BM["BM25<br/>by_spec/*.jsonl"]
    EMBED --> PG["PostgreSQL<br/>chunks_meta"]

    DOC["外部 .doc 上传"] -.兜底.-> DL["LibreOffice→Docling"]
    DL -.-> SECTION

关键策略：

主源走预解析数据：直接消费 [GSMA/3GPP](https://huggingface.co/datasets/GSMA/3GPP) HF marked/ 文件树（每篇 spec 一个 raw.md + 同目录图片），避免从零造解析。
chunking = small2big：~250 token 小检索 chunk + parent section 大召回（parent_section_id 分组）；表格 / 公式 / 图片 / ASN.1 / RRC action list 走原子切片不切碎；chunk 头部强制注入 [<spec_id> § <clause> <title>] 让 BM25 命中标题词、embedding 获得上下文。
chunk_id 真·幂等：uuid5(spec_id + clause + sha256(content)[:16]) —— 内容不变 → ID 不变 → 重跑无重复。
Vision：多模态 LLM 单次调用同时产出 description + 结构化字段；Redis 永久缓存按 sha256(image_bytes) 去重。
Embedding 维度：单值 1024 维（节省存储一半 + 检索更快，retrieval 指标差距 ≤ 2pp）。
Reranker：Voyage rerank-2.5，与 voyage embedding 同供应商协同最佳。

Agent 状态图（online query）

stateDiagram-v2
    [*] --> classify
    classify --> retrieve: complexity=simple
    classify --> rewrite: complexity=complex
    classify --> tool_dispatch: class=tool
    rewrite --> hyde
    hyde --> multi_query
    multi_query --> retrieve
    retrieve --> rerank
    rerank --> generate
    tool_dispatch --> generate: web_search/glossary/toc/params
    generate --> self_rag
    self_rag --> retrieve: verdict=retry AND retry_count<2
    self_rag --> [*]: verdict=accept/insufficient

分支与性能预算：

路径	触发	节点序列	P95
simple fast path	单一术语 / 字段定义	classify(含 rewrite) → retrieve → rerank → generate → 轻量 grounding check	< 15s
complex	多 entity / 多文档证据	rewrite → hyde → multi_query → retrieve/rerank → generate → self-RAG（最多 retry 2 次强制收敛）	< 60s
tool 路径	`query_class==tool` 且 `explicit_tools` 非空	classify → tool_dispatch → generate（模板化渲染）→ self_rag	视工具

核心检索逻辑：

# Hybrid retrieve（dense + sparse + RRF + small2big）
queries = state.rewritten_queries or [state.user_input]
if state.hyde_doc: queries.append(state.hyde_doc)        # complex 路径才有
for q in queries:
    dense  = await dense_retriever.aretrieve(q, top_k=30)   # Qdrant @ 1024 维
    sparse = await sparse_retriever.aretrieve(q, top_k=30)  # LlamaIndex BM25
    candidates.extend(rrf_merge(dense, sparse, k=60))       # RRF: score=Σ 1/(60+rank_i)
unique = dedup_by_chunk_id(candidates)[:50]
# rerank: voyage rerank-2.5, top-50 → top-5
reranked = await voyage_client.rerank(query, [c.content for c in unique], model="rerank-2.5", top_k=5)

Redis 缓存：tgpp:cache:retrieve:{sha256(query+filter)} / tgpp:cache:rerank:{sha256(query+top_chunk_ids)}，TTL 1h。
小2big 召回：拿到命中 chunk 后按 parent_section_id group by 取整段 section 给 reranker / LLM；超长 section 退化为 N=5 邻居窗口。

严格 grounding 守约：

Prompt 强约束："仅基于 reranked 内容生成；找不到 → 明示'未在 3GPP 文档中找到 …'"。
引用格式 [spec_id § section_path ¶offset] + 正则抽取写入 state.citations。
self-RAG 用独立模型做三维自评避免同源偏差；insufficient 直接走"找不到"分支。
web_search 仅在用户显式触发时调用，结果强制加前缀"以下内容来自 Web 搜索，未经 3GPP 验证："。

详细节点实现 / Prompt 库 / Checkpoint 操作集见 [docs/03-development/03-agent.md](./docs/03-development/03-agent.md)。

架构速览

flowchart LR
    U["用户 (Web/Android)"] --> NX["Nginx + HTTPS"]
    NX --> FE["Flutter Web/Android"]
    NX --> API["FastAPI + SSE"]
    API --> AG["LangGraph Agent<br/>(classify/rewrite/HyDE/retrieve/rerank/generate/self-RAG)"]
    AG --> LI["LlamaIndex Hybrid Retriever"]
    LI --> QD["Qdrant<br/>(dense 1024d)"]
    LI --> BM["BM25<br/>(sparse, by_spec jsonl)"]
    AG --> LLM["LiteLLM 本机<br/>(可配置 LLM)"]
    AG --> VG["Voyage AI<br/>embedding + rerank-2.5"]
    AG --> TV["Tavily Web Search<br/>(用户显式触发)"]
    API --> PG["PostgreSQL<br/>(LangGraph checkpoint + 业务)"]
    API --> RD["Redis<br/>(缓存 + 限流)"]
    AG -.trace.-> LF["Langfuse Cloud"]

    subgraph ingest["索引流水线 (offline)"]
        H["GSMA/3GPP HF Dataset<br/>(R18+R19, 1270 specs)"] --> CK["chunker<br/>(small2big)"]
        DL["Docling (兜底)"] --> CK
        CK --> VS["Vision 多模态 LLM<br/>(图片描述)"]
        VS --> QD
        VS --> BM
        VS --> PG
    end

快速开始（自托管完整指南）

零宿主依赖：standalone 把 Qdrant / LiteLLM / PostgreSQL / Redis 全部打进 compose，clone 下来一条命令起整栈，机器上无需预先跑任何服务。（若你已有现成的宿主 Qdrant / LiteLLM 想复用，走 make dev，见末尾「复用宿主服务」。）

前置要求

Docker + Docker Compose v2（docker compose version 可用）
内存 ≥ 4G（满量索引时 Qdrant 约 ~1.7G + api ~600M；想跑评测建议 ≥ 6G）
磁盘 ≥ 15G 空闲（镜像 + 索引 snapshot 2.2G + BM25 + Qdrant 数据）
拉现成索引需能访问 huggingface.co
至少一套模型上游 key：生成 LLM（OpenAI / 小米 MiMo / 任意 OpenAI 兼容）；embedding/rerank 可选（见步骤 4 兼容性）
（可选 Web UI）host 上装 Flutter SDK（镜像不含，见步骤 6）

部署步骤

# 0. 拉代码
git clone https://github.com/EpisodeYu/3GPP-Everything && cd 3GPP-Everything

# 1. 项目配置
cp .env.example .env
# 必填：
#   APP_SECRET_KEY               openssl rand -hex 32
#   POSTGRES_PASSWORD            任意强密码
#   REDIS_PASSWORD               任意强密码
#   LITELLM_API_KEY              = 下一步 deploy/litellm/.env 的 LITELLM_MASTER_KEY
#   BOOTSTRAP_ADMIN_INVITE_CODE  首个管理员注册码（创建后清空/轮换；见步骤 5）
# 国际用户用 OpenAI 全套：再设 LLM_AGENT_MODEL=gpt-4o / LLM_LIGHT_MODEL=gpt-4o-mini /
#   LLM_VISION_MODEL=gpt-4o；embedding 想用 OpenAI 设 EMBEDDING_PROVIDER=openai，
#   不接 rerank 设 RERANK_ENABLED=false（详见 .env.example 注释）

# 2. LiteLLM proxy 配置（把上面的模型名映射到真实上游；详见 deploy/litellm/README.md）
cp deploy/litellm/config.yaml.example deploy/litellm/config.yaml
cp deploy/litellm/.env.example         deploy/litellm/.env
# 编辑 deploy/litellm/.env：LITELLM_MASTER_KEY（=项目 .env 的 LITELLM_API_KEY）+ 上游 key
# 编辑 config.yaml：选国产栈（默认 mimo+voyage）或取消注释 OpenAI 栈

# 3. 起全栈，等就绪
make standalone-up
curl http://127.0.0.1:8002/ready    # 4 依赖（PG/Qdrant/Redis/LiteLLM）全绿即 OK（此时索引为空）

# 4. 拉现成索引（推荐；免从零 ingestion，省 Voyage 费用 + 数小时）
./scripts/bootstrap-index.sh        # 默认 HF: EpisodeYu/3gpp-everything-index
#   ⚠️ 索引按 voyage-4-large @1024 建；.env 的 EMBEDDING_PROVIDER/DIMENSIONS 须一致，
#      否则 bootstrap 直接 abort（换 provider 得自建索引，见「自建索引」）。
#      兼容性 / 离线用法见 deploy/index/README.md

# 5. 起 Web UI（可选；需 host 先装 Flutter 再 build，镜像不含 SDK）
FLUTTER=/path/to/flutter make web-build
docker compose -f deploy/docker-compose.standalone.yml --profile web up -d web   # → http://127.0.0.1:8082

创建账号（首个管理员 → 其他用户）

系统不开放自助注册，账号由管理员创建；首个管理员走 bootstrap：

打开 Web UI 登录页，展开 「首次部署？创建管理员」，填 .env 里的 BOOTSTRAP_ADMIN_INVITE_CODE → 创建首个管理员并登录。（或直接打 API：POST /api/v1/auth/bootstrap-admin，body 含 username/password/invite_code）
之后由管理员在「用户管理」给其他人开账号。

bootstrap 仅在 users 表为空时有效，已有用户后该入口一律返回 409。建议创建首个管理员后把 BOOTSTRAP_ADMIN_INVITE_CODE 清空或轮换。

故障排查

症状	处理
`/ready` 某依赖红	`make standalone-logs` 看日志；litellm 红多为 `config.yaml`/`.env` 的 key 名/master key 不一致（见 `deploy/litellm/README.md`）
`bootstrap-index` 上传/下载卡在 0 字节	hf_xet 在低配机卡死 → 加 `NO_XET=1`（publish 侧）或升级 `huggingface_hub`（见 `deploy/index/README.md`）
bootstrap 报「不兼容」	bundle 是 `voyage@1024`；`.env` 的 `EMBEDDING_PROVIDER`/`EMBEDDING_DIMENSIONS` 要一致，否则需自建索引
登录页「创建管理员」总失败	已有用户（409）；或 `.env` 未设 `BOOTSTRAP_ADMIN_INVITE_CODE`（401）
端口/容器名冲突	standalone 与 dev/prod 同名容器（`tgpp-*`），三者不可同跑；先 `make standalone-down`

自建索引（替代步骤 4）/ 评测 / 测试

# 自建索引（需 Voyage key + 时间；想自建 / 增量更新 / 换 embedding provider 时用）
uv run --project ingestion python -m ingestion.cli pull-manifest
uv run --project ingestion python -m ingestion.cli pipeline-hf --spec-id 38.331   # 单篇试跑
uv run --project ingestion python -m ingestion.cli index-status --provider voyage

# 评测 / 测试（开发用）
uv run --project eval python -m eval.cli golden validate -f eval/golden/v1.yaml
make lint && make test

复用宿主服务（make dev）

如果你的机器上已经跑着 Qdrant / LiteLLM（如多项目共享一套），用 make dev：它只起业务容器 + 项目专属 PG/Redis，通过 external network 用容器名连宿主的 Qdrant / LiteLLM。注意：deploy/docker-compose.yml 里的 external network 名（p2-rag-assistant_default / litellm_default）是按 maintainer 环境写的，复用前需改成你自己宿主上 Qdrant / LiteLLM 所在的 compose network 名。一般自托管直接用上面的 standalone 更省事。

生产部署

⚠️ 下面这套是 maintainer 自己的生产拓扑：业务容器（api + web + ingest）跑在 docker-compose.prod.yml，而 80/443 + TLS + Let's Encrypt + 跨项目分流抽到一个独立的私有 ingress 项目（~/infra/ingress/，不在本仓库内）。Qdrant + LiteLLM 复用宿主已运行实例。 外部用户不要照抄 ~/infra/ingress/ 那几步（你没有那个项目）—— 自托管上生产请用上文的 standalone（它直接 publish 8002/8082，前面自备任意反代 （Nginx / Caddy / Traefik）做 TLS 即可），无需本项目的私有 ingress。下面的步骤仅供 maintainer 同款环境复现参考。

# 1. 拉代码 + .env（ALLOWED_ORIGINS 追加 https://<DOMAIN>）
git clone <repo> && cd 3GPP-Everything && cp .env.example .env && vi .env

# 2. DNS A 记录 + 放行端口
sudo ufw allow 80,443/tcp

# 3. ingress 配置 + 业务镜像构建启动
cp ~/infra/ingress/.env.example ~/infra/ingress/.env && vi ~/infra/ingress/.env  # TGPP_DOMAIN/LETSENCRYPT_EMAIL/PUBLIC_IP
make prod-build && make prod-up

# 4. 签证书（先 staging 验链路，再切 prod）
cd ~/infra/ingress && ./scripts/init-letsencrypt.sh   # CERTBOT_STAGING=1→0 后再跑一次

# 5. 健康检查
make prod-health
curl -sS https://<DOMAIN>/health    # 200

# 6. 首个 admin（除非已有）
curl -X POST https://<DOMAIN>/api/v1/auth/bootstrap-admin ...

# 7（可选）: 全量索引
docker compose --profile ingest -f deploy/docker-compose.prod.yml run --rm ingest \
    python -m ingestion.cli pipeline-hf --releases 18,19 --provider $EMBEDDING_PROVIDER

# 日常运维
make prod-restart / prod-logs / prod-backup / prod-restore BACKUP=./backups/<ts>

完整 runbook、备份/恢复与故障回滚见 [docs/03-development/07-cicd-and-deployment.md](./docs/03-development/07-cicd-and-deployment.md)。

项目结构

3GPP-Everything/
├── docs/                  ← 需求 / 选型 / 开发文档
├── backend/               ← FastAPI + LangGraph Agent
│   ├── app/
│   │   ├── agent/         ← LangGraph 状态图 + 节点 + checkpoint 操作
│   │   ├── retrieval/     ← dense / sparse / hybrid / rerank / cache
│   │   ├── tools/         ← web_search / glossary / toc / params
│   │   ├── api/v1/        ← auth/sessions/chat SSE/checkpoint/reader/tools/
│   │   │                     favorites/notes/feedback/admin/users/docs
│   │   └── llm/           ← LiteLLM client + pricing
│   └── alembic/
├── ingestion/             ← HF 加载 + Docling 兜底 + Vision + chunker + indexer
├── frontend/              ← Flutter Web + Android（chat/reader/library/favorites/notes/admin）
├── eval/                  ← 金标准 175 题 + Ragas runner + 华为对比测试(eval/huawei_compare/)
├── deploy/                ← Docker Compose / Nginx / 脚本
├── .github/workflows/     ← CI / eval-daily / eval-weekly / deploy
├── .env.example
└── Makefile

设计要点

现成轮子优先：3GPP 文档主源走 [GSMA/3GPP](https://huggingface.co/datasets/GSMA/3GPP) 官方 HF 数据集（已预解析为结构化 markdown），避免从零造解析。
服务器友好：宿主已运行的 Qdrant / PostgreSQL / Redis / LiteLLM 全部复用，仅独立命名空间隔离。
混合 API 策略：embedding/reranker 走 Voyage 海外 SOTA（当前默认），生成 LLM 走本机 LiteLLM（OpenAI 协议，可自由配置/切换，不锁定供应商），平衡质量与成本/可控性。
严格 grounding：找不到证据明示"未在 3GPP 文档中找到"，Web 搜索仅在用户显式触发时启用并带"未经 3GPP 验证"标签。
流式 + 可取消 + 可恢复：LangGraph astream_events + SSE 10 类 event；AsyncPostgresSaver checkpoint 支持取消/暂停/恢复/fork/rollback 全套语义。

当前不支持

多用户高并发优化 / 复杂细粒度 RBAC / 灰度发布 / 自动定时索引更新 / LLM 微调。

许可证

MIT

3GPP 规范的版权归 3GPP / ETSI / ARIB / ATIS / CCSA / TSDSI / TTA / TTC 等成员所有；GSMA HuggingFace 数据集按其声明使用。

English (brief)

A production-grade RAG agent over 3GPP specifications — live at https://3gpp-everything.org/.

Coverage: GSMA Rel-18 + Rel-19 5G-series TS — 1270 specs / 394,859 chunks.
Stack: LangGraph (orchestration) + LlamaIndex (retrieval) + LangChain (adapters); FastAPI + SSE backend; Flutter Web/Android frontend.
Models: generation / Vision / self-RAG run on a configurable LLM via local LiteLLM (any OpenAI-compatible model — not hardcoded); Embedding / Reranker default to Voyage voyage-4-large @ 1024d & rerank-2.5. Eval-baseline judges: deepseek-v4-pro (Ragas) / glm-5.1 (Huawei comparison).
RAG: GSMA/3GPP HF dataset → small2big chunking (atomic blocks for tables/formulas/ASN.1/figures) → multimodal-LLM Vision for figures → hybrid retrieval (Qdrant dense + BM25 + RRF) → Voyage rerank → LangGraph dual-path (simple fast / complex with HyDE + multi-query + self-RAG). Strict citation-only grounding; web search only when explicitly invoked.
vs Huawei Telco-RAG (neutral 100-question R18 set, glm-5.1 judge): this project leads on every metric (fact-coverage 0.80 vs 0.22, spec-attribution 96% vs 7%, 0% vs 93% hallucination on negatives); RAG's value hinges on retrieval quality. Details: [eval/huawei_compare/results/REPORT.md](./eval/huawei_compare/results/REPORT.md).

See [docs/](./docs/) for full design docs.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

3GPP-Everything

是什么

核心能力（按当前实现）

与华为 Telco-RAG 的对比评测

技术栈

Agent / RAG 框架（三件套协同）

模型层

数据 / 存储 / 缓存（复用宿主已运行实例）

后端 / 前端 / 工具

RAG 策略

数据摄取（offline indexing）

Agent 状态图（online query）

架构速览

快速开始（自托管完整指南）

前置要求

部署步骤

创建账号（首个管理员 → 其他用户）

故障排查

生产部署

项目结构

设计要点

当前不支持

许可证

English (brief)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 229 Commits
.github/workflows		.github/workflows
assets/logo/final		assets/logo/final
backend		backend
deploy		deploy
docs		docs
eval		eval
frontend		frontend
ingestion		ingestion
scripts		scripts
.env.example		.env.example
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

3GPP-Everything

是什么

核心能力（按当前实现）

与华为 Telco-RAG 的对比评测

技术栈

Agent / RAG 框架（三件套协同）

模型层

数据 / 存储 / 缓存（复用宿主已运行实例）

后端 / 前端 / 工具

RAG 策略

数据摄取（offline indexing）

Agent 状态图（online query）

架构速览

快速开始（自托管完整指南）

前置要求

部署步骤

创建账号（首个管理员 → 其他用户）

故障排查

生产部署

项目结构

设计要点

当前不支持

许可证

English (brief)

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages