kaiwu-semi 是王者荣耀 1v1 复赛任务的 Kaiwu RL 提交仓库。代码预期运行在腾讯提供的训练和评估基础设施内。
本仓库的提交代码主要在 agent_ppo、agent_diy、conf 和 scripts。本地调试需要自行提供平台运行时或本机私有快照;Kaiwu 环境、Codex skills、checkpoint 和打包归档不随公开仓库发布。
本地基础检查:
python3 -m compileall -q agent_ppo agent_diy conf scripts远程部署脚本需要显式传入仓库地址,避免公开仓库中写死私有地址:
REPO_URL="https://github.com/<owner>/kaiwu-semi.git" \
BRANCH="main" \
bash scripts/deploy_hok1v1.sh仓库改动应集中在提交 agent 能控制的范围内:
agent_ppo:PPO agent、特征处理、reward 处理、模型和样本处理。agent_diy:保留的 baseline / 自定义 agent 入口。conf:Kaiwu 应用和算法配置。scripts:本地打包或部署辅助脚本。docs:环境参考、设计文档和按日期记录的实现变更。references:本地参考材料索引。大型运行时、checkpoint、归档包不进入公开仓库。
训练和评估默认使用平台工作流,因此仓库内的工程重点是:
- 特征构造
- reward 设计
- 模型结构
- 样本处理
- 监控与可观测性
- 平台支持的配置项
不要依赖官方基础设施内不可用的外部训练流水线、额外服务或提交时特殊行为。
从 docs/README.md 开始阅读。文档按用途组织:
docs/reference:环境和协议参考docs/design:设计计划和决策记录docs/changes:按日期记录的实现变更
根目录 README 只保留长期稳定摘要,不追踪最新实验状态。当前实现细节应写入 docs/changes 下的日期文档。
发布到 GitHub 前应确认:
- 根目录没有本地日志、base64 打包文本、训练任务 JSON 或生成 PDF 被跟踪。
references/只保留README.md,skills/和references/runtime/不进入公开仓库。- 私有平台 token、cookie、Authorization header 只通过环境变量或本机浏览器会话传入,不写入仓库。