flying_petal_in_cities flyingpetals520

飞花千城 ✿ flyingpetals520

Attention 时代炼丹师 ⚡ · 折腾 Vibe coding 工具链

🛠️ Tech Stack

🐾 About Me

THU PhD 在读，主攻 AI/ML 行业交叉方向，不是 CS 科班，菜菜求带。
日常：广读 AI 领域论文、随便搓搓小工具、致力于把 agent 嵌进日常研究流程、喜欢哈基米。

最近在想的事：

🧠 AI LLM Frontier —— Scaling、Linear Attention、Sparse Attention、SSM、Agentic reasoning、Alignment...
🤖 Agent for Autoresearch —— 让 LLM Agent 真正参与搜集阅读论文 → 想法碰撞 → 实验开展 → 高质量产出的闭环（成熟框架太多了，explore ING）
🐈 共情设计 —— 好看好用又温馨的 GUI 界面，严肃工具也可以有温度

🛠️ 正在搓的轮子

由于本人平时主要以 academic research 为主，精力有限，所以基本不怎么 commit，项目可能简陋些，有需求就 vibe 下热热身搓一个自己用，不过还是希望帮到大家，也在不断查找不足和迭代！（后面 paper 发出来了也会开源 research 的代码 soon！还有好多零散的 vibe coding 东西没整理出来，后面再计划）不是单品玩家，是希望构建一整套本地 AI reserach 工具链——围绕"读论文 → 标注 → 引用 → idea火花碰撞 → 复现 →高质量产出"的完整研究循环（类似的框架众多，我只是做个辅助，或抛砖引玉）：

🐾 WhiskerShelf ⭐

A cozy local LLM-powered paper library — with a cat on the shelf.

💡 Idea Spark —— 选 2-4 篇论文，AI brainstorm 碰撞出可执行的研究方向
🚀 Claude Code 集成 —— 一键导出 brief 项目直接当下游 CC 任务
🧠 5 个自己搓的 Skills —— 让 CC 真正成为研究伙伴（可以搭配其他更成熟的 skills 食用）
🐈 小黑随机出现趴在"最近阅读"上

MIT · Python · PDFs

🖼️ MLLM 智能图像标注工具

Local multimodal LLM annotation for image dataset.

🎨 文生图数据集 + DWpose 姿态识别 + 数据合成
🔌 三种模式：本地 VLM / 远程 API / 人工校正
🧠 支持 Qwen3.5 (4B/27B/35B) 等本地部署 VLM
📦 自建 10w+ 张高质量二次元图片数据集

Apache 2.0 · PyTorch · Autonomous

📜 Paper Reference Check Helper

Effective and light-flash assistant for checking references.

📚 上传 .bib + .tex，自动找引用错误
⚡ 写论文 / 改 literature review 时救命
🪶 单文件 GUI，PyInstaller 一键打包 exe
🎓 "Be flash and beautiful, not bloated and paid"

Python · pybtex · 单文件

🌐 flyingpetals520.github.io

An interactive AI evolution timeline.

📅 主流模型发布、巨头突破、研究里程碑的可视化时间线且可编辑更新
🧭 精选 AI 评测平台 & 新闻源导航
💾 离线持久化（localStorage + JSON 导入/导出）
🎨 静态站点，无后端依赖

HTML/CSS/JS · 静态站

🐈 此刻的桌面

📖  WhiskerShelf 开着，左边栏 Idea Spark 在等一个新 Idea 冒出来
🔧  刷着 X，导致 Skills 又下了几个黑科技
🖼️  MLLM 标注工具在跑 Qwen3.5-27B，标注 10w+ 图
🤖  Claude Code 正在 vibe-coding，写不动了就调动 superpowers 老祖让它接着写
📚  Mamba-3 / Gated DeltaNet-2 / Kimi Linear 一大堆在论文队列里等着读

🤖 我怎么用 agent

不是"按个发送 AI 就搞定一切"那种视频。真正的协作应该是这样：

想清楚到底要什么 —— prompt 描述，比写代码还重要，做真正的产品经理
拆解成可执行的小任务 —— agent 干一行就 commit
让它出方案 + 计划 —— review 完再让它动
review 它的设计，不只是结果 —— 风格、命名、工程结构
用 Skills 把经验沉淀下来 —— 不让它每次都从零学
公开 cat 也得让 agent 看 —— 它也需要上下文

🌱 长期关注的技术 Long-term Vision && Research Intersest

不希望发 agent 水文，更关注于基础模型的构建和训练这一长期主义工程，长期探究如何让注意力机制跑得更高效聪明而非更沉重，尤其看好线性注意力和稀疏注意力对长序列建模的解放和 scaling 的潜力。同时也在探索视觉-语言多模态基础模型的统一架构，想找一种更本质的方式把不同模态融进同一个全模态全双工框架。我相信，只有当注意力足够高效，甚至放弃反向传播，统一多模态模型才能真正摆脱算力束缚，走得更远。

🧠  LLM 架构    Mamba · RWKV · DeltaNet · Linear Attn · MoE · Diffusion LM 
🎨  多模态     VLM · Diffusion · Pose Estimation · 3D Generation
🤖  Agent       Claude Code · Codex · ReAct · Planning · Multi-Agent
🔧  Infra       vLLM · SGLang · KV Cache · Quantization · Speculative Decoding
🧬  Bio-inspired  SNN · Spiking Attention · Predictive Coding · HTM
🌍  World Model  JEPA · Sora · Genesis · Video Prediction

· 🐾 · 🌿 · 🐾 · 🍵 · 🐾 · 🌸 · 🐾 ·

📬 Find Me

🐙 GitHub Issues —— WhiskerShelf/issues 是最快的入口
🐦 X (Twitter) —— @flyingpetal472
💬 QQ —— 1665395842

"每只猫都值得一个温暖的书架，每篇论文都值得一个会思考的伙伴，每个 agent 都值得一个靠谱的协作框架。"

made with 🐾 and 🧠 by flyingpetals520

Provide feedback

Saved searches

Use saved searches to filter your results more quickly