ZeroToken Skill 是一套为 AI Agent 设计的提示词纪律规范——在不降低回答准确性的前提下,压缩无效上下文、无效解释、无效工具调用和无效输出,从而大幅降低 token 消耗和响应延迟。
🎯 目标: 用最精准的提示,做最少的往返,产最精炼的结果。
ZeroToken Skill 可通过两种方式直接安装到你的 Agent 中:
# 方式一:克隆仓库,在 Agent 中载入
git clone https://github.com/phoenixlucky/zerotoken-skill.git
# 在 Reasonix 或兼容 Agent 中
/zerotoken-skill方式二:从远程 Skill 仓库引用(推荐,始终获取最新版本)
安装这个技能 https://clawhub.ai/phoenixlucky/zerotoken-skill以下是 ZeroToken Skill 对五种主流 Agent 工具的具体强化方向。
| 强化维度 | 说明 |
|---|---|
| 🧠 原生 Skill 引擎 | Reasonix 的 Skill 机制原生支持本规范,载入即用,无需额外配置 |
| 🎯 自动模式匹配 | 根据请求特征自动选择五种任务模式之一,无需手动指定 |
| 🔧 工具链优化 | 按模式限制工具调用范围(简单问答不调工具、多文件任务分批加载) |
| 📄 输出规范 | 结论先行、不复述、要点+位置 等输出模板内嵌为默认行为 |
| 💰 Token 预算策略 | 按模式自动分配上下文深度:简单问答极低预算,重大重构允许高消耗 |
| 强化维度 | 说明 |
|---|---|
| 📏 提示词纪律 | 消除冗长的 Agent 开场白、过渡语和客套话,直入主题 |
| 🎣 工具调用策略 | 先搜索定位再局部读取,避免扫描全项目;能 1 步不用 2 步 |
| ✂️ 输出精简 | 只返回结果+验证+注意,不添加无关分析和总结评语 |
| 🧮 上下文预算意识 | 先判断请求类型再决定投入多少上下文,不默认全量读取 |
| 强化维度 | 说明 |
|---|---|
| 🎯 行为可预测性 | 请求类型公开匹配对应模式,Agent 行为一致可预期 |
| 🚫 避免过度探索 | 不 glob 全目录、不预览多个候选、不扫描无关文件 |
| 📋 输出结构一致 | 结论先行格式,开发者一眼看到结果无需翻找 |
| ⚡ 减少无效往返 | 短计划(3-5 步)+ 分批执行,首轮就给出可操作的输出 |
| 强化维度 | 说明 |
|---|---|
| 💬 指令响应效率 | 降低每次 instruct 调用的 token 消耗,响应更快 |
| 🔇 无装饰输出 | 直接给结果,无问候、无过渡、无"如果你还需要帮助" |
| 🧩 行为可配置 | 通过 system prompt 一次性注入完整决策表和行为规范 |
| 📉 上下文压缩 | 能用 1 句话表达的不用 3 句,保留全部准确性 |
| 强化维度 | 说明 |
|---|---|
| 📦 Skill 分发 | 一次编写,多平台加载,openclaw 作为官方发布中心 |
| 🔖 版本管理 | openclaw 托管最新 SKILL.md,所有用户统一更新路径 |
| 🔄 跨平台复用 | 同一套规范同时服务 Reasonix / Codex / Hermes 等不同工具 |
| 📐 标准化规范 | Skill 格式本身即是 ZeroToken 理念的实践——用最少的描述传达最完整的规则 |
根据你的请求特征,ZeroToken Skill 自动匹配五种任务模式。每种模式都有专属的工具链、输出格式和 token 预算策略:
| 模式 | 一句话概括 | Token 成本 |
|---|---|---|
| A. 💬 简单问答 | 直接回答,不跑工具 | 🔵 极低 |
| B. 🔧 代码小改 | 定位 → 读 → 精准改 → 最小验证 | 🟢 低 |
| C. 📦 多文件任务 | 短计划 → 分批加载 → 按步推进 | 🟡 中 |
| D. 📚 大资料总结 | 要点 + 证据位置,不逐段复述 | 🟠 中高 |
| E. 🏗️ 重大架构调整 | 诊断根因 → 确认方案 → 增量迁移 | 🔴 高(但可控) |
适用场景: 定义查询、翻译、短建议、快速事实确认。
典型信号:
"什么是 RESTful API?"
"把这段翻译成英文"
"Go 和 Rust 在并发模型上有什么不同?"
行为表现:
🏷️ 识别 → "简单问答,无需工具"
🔍 定位 → 从已加载上下文或内置知识提取
💡 输出 → 1-3 句精炼回答,无冗余开场白
不做什么: ❌ 不搜索代码库 ❌ 不调用外部工具 ❌ 不加"好的,我来回答..."这类客套话
适用场景: 单文件 bug 修复、配置项调整、变量重命名、简单样式修改。
典型信号:
"这个按钮颜色不对,改成蓝色"
"login 函数有个空指针异常"
"把超时时间从 30s 改成 60s"
行为表现:
🏷️ 识别 → "单文件局部修改"
🔍 定位 → 快速 grep / LSP 跳到目标行
🔧 修改 → 精准编辑,不扫描无关文件
✅ 验证 → 最小化验证(语法检查 / 单测)
不做什么: ❌ 不写长篇计划 ❌ 不重构无关代码 ❌ 不扫描整个项目
适用场景: 新增功能、常规重构、跨文件修改、接口变更。
典型信号:
"给用户模块添加导出 CSV 功能"
"把日志系统从 zap 迁移到 slog"
"重构 auth 中间件,支持多租户"
行为表现:
🏷️ 识别 → "跨文件任务,需要计划"
📋 计划 → 3-5 步短计划,标注文件清单
📂 分批 → 一次只加载 2-3 个相关文件
⚡ 执行 → 改一批 → 验证 → 下一批
不做什么: ❌ 不一次性加载所有文件 ❌ 不做过度设计 ❌ 不写超过 5 步的详细计划
适用场景: 长文档分析、日志审查、PR 差异审查、大型配置审计。
典型信号:
"总结这个 5000 行的日志中的关键错误"
"review 这个 PR,只说有问题的部分"
"这个设计文档太长了,提取架构决策"
行为表现:
🏷️ 识别 → "资料总结,压缩输出"
🔍 提取 → 逐段扫描,只标记关键信息
📊 输出 → 要点列表 + 证据位置
❌ 省略 → 不逐段复述,不加评语
不做什么: ❌ 不逐段翻译/复述 ❌ 不输出"这部分看起来没问题" ❌ 不添加无关分析
适用场景: 反复出 bug 的系统、架构不匹配、数据库迁移、大规模重构。
典型信号:
"这个支付模块太乱了,每次加功能都出 bug"
"把单体应用拆成微服务"
"ORM 性能太差,换成原生 SQL"
行为表现:
🏷️ 识别 → "重大变更,需要谨慎"
🩺 诊断 → 深入分析根因(非表面问题)
🤝 确认 → 向用户呈现 2-3 种方案+推荐
✅ 认可 → 用户确认后再动手
📈 增量 → 分步迁移,每步可验证/可回滚
核心区别: 这是唯一必须先确认方案再执行的模式。其他所有模式都是"识别即执行"。
当用户明确要求"省 token"时,叠加以下规则:
- 🔇 零问候、零过渡、零客套 — 直接给结果
- 📉 最大压缩输出 — 用最短的合法表达
- 🧹 省略一切冗余 — 无总结、无"如果你还需要帮助"、无格式装饰
- ⚖️ 准确性不妥协 — 省的是表达方式,不是答案质量
何时触发: 用户说"省点 token"、"简洁点"、"直接给结果"等。
以下场景自动退出 ZeroToken 模式,切换为详尽模式:
| 场景 | 原因 |
|---|---|
| 🎓 教学/学习 | 需要详细解释和示例 |
| 🧠 头脑风暴 | 需要探索多种可能性 |
| 🔬 深度研究 | 需要全面分析和引用 |
| ❓ 用户要求详细 | 用户主动要求更详尽的回答 |
所有详细规范定义在 SKILL.md,包括:
- 📐 快速决策表 — 按请求类型匹配模式与工具链
- 🧭 核心原则 — 先分类再预算、压缩提示词、渐进读取、先给结果、不复述
- 📝 精准提示词模板 — 目标 → 输入 → 约束 → 输出
- 🔄 五种任务模式详解 — 每种模式的完整行为规范
- ⚡ ZeroToken 强化模式 & 退出条件
- 🛡️ 质量底线 — 压缩不降质的硬性要求
针对 OpenAI 兼容接口(含 Codex、OpenCode、Hermes 等)的预设配置位于 agents/openai.yaml,可直接导入使用。
| # | 原则 | 含义 |
|---|---|---|
| 1 | 先分类,再预算 | 接到请求先确定模式,再分配 token |
| 2 | 压缩提示词 | 用最短的精确描述代替长段落 |
| 3 | 渐进读取 | 按需读取,不看完整文件 |
| 4 | 先给结果 | 结论先行,细节随后 |
| 5 | 不复述 | 不重复用户已说的内容 |
zerotoken token-efficient prompt-engineering context-optimization agent-discipline ai-workflow token-budget concise-output
⚡ 少即是多 — Less is More