Skip to content
View flyingpetals520's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report flyingpetals520

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
flyingpetals520/README.md

飞花千城 ✿ flyingpetals520

Attention 时代炼丹师 ⚡ · 折腾 Vibe coding 工具链 Typing SVG

🛠️ Tech Stack

Python PyTorch NumPy Transformers FLA (Fused Linear Attention)

🐈 伸懒腰的黑猫


🐾 About Me

THU PhD 在读,主攻 AI/ML 行业交叉方向,不是 CS 科班,菜菜求带。
日常:广读 AI 领域论文、随便搓搓小工具、致力于把 agent 嵌进日常研究流程、喜欢哈基米。

最近在想的事:

  • 🧠 AI LLM Frontier —— Scaling、Linear Attention、Sparse Attention、SSM、Agentic reasoning、Alignment...
  • 🤖 Agent for Autoresearch —— 让 LLM Agent 真正参与搜集阅读论文 → 想法碰撞 → 实验开展 → 高质量产出的闭环(成熟框架太多了,explore ING)
  • 🐈 共情设计 —— 好看好用又温馨的 GUI 界面,严肃工具也可以有温度

🛠️ 正在搓的轮子

由于本人平时主要以 academic research 为主,精力有限,所以基本不怎么 commit,项目可能简陋些,有需求就 vibe 下热热身搓一个自己用,不过还是希望帮到大家,也在不断查找不足和迭代!(后面 paper 发出来了也会开源 research 的代码 soon!还有好多零散的 vibe coding 东西没整理出来,后面再计划)不是单品玩家,是希望构建一整套本地 AI reserach 工具链——围绕"读论文 → 标注 → 引用 → idea火花碰撞 → 复现 →高质量产出"的完整研究循环(类似的框架众多,我只是做个辅助,或抛砖引玉):

🐾 WhiskerShelf

A cozy local LLM-powered paper library — with a cat on the shelf.

  • 💡 Idea Spark —— 选 2-4 篇论文,AI brainstorm 碰撞出可执行的研究方向
  • 🚀 Claude Code 集成 —— 一键导出 brief 项目直接当下游 CC 任务
  • 🧠 5 个自己搓的 Skills —— 让 CC 真正成为研究伙伴 (可以搭配其他更成熟的 skills 食用)
  • 🐈 小黑随机出现趴在"最近阅读"上

MIT · Python · PDFs

Local multimodal LLM annotation for image dataset.

  • 🎨 文生图数据集 + DWpose 姿态识别 + 数据合成
  • 🔌 三种模式:本地 VLM / 远程 API / 人工校正
  • 🧠 支持 Qwen3.5 (4B/27B/35B) 等本地部署 VLM
  • 📦 自建 10w+ 张高质量二次元图片数据集

Apache 2.0 · PyTorch · Autonomous

Effective and light-flash assistant for checking references.

  • 📚 上传 .bib + .tex,自动找引用错误
  • ⚡ 写论文 / 改 literature review 时救命
  • 🪶 单文件 GUI,PyInstaller 一键打包 exe
  • 🎓 "Be flash and beautiful, not bloated and paid"

Python · pybtex · 单文件

An interactive AI evolution timeline.

  • 📅 主流模型发布、巨头突破、研究里程碑的可视化时间线且可编辑更新
  • 🧭 精选 AI 评测平台 & 新闻源导航
  • 💾 离线持久化(localStorage + JSON 导入/导出)
  • 🎨 静态站点,无后端依赖

HTML/CSS/JS · 静态站


🐈 此刻的桌面

📖  WhiskerShelf 开着,左边栏 Idea Spark 在等一个新 Idea 冒出来
🔧  刷着 X,导致 Skills 又下了几个黑科技
🖼️  MLLM 标注工具在跑 Qwen3.5-27B,标注 10w+ 图
🤖  Claude Code 正在 vibe-coding,写不动了就调动 superpowers 老祖让它接着写
📚  Mamba-3 / Gated DeltaNet-2 / Kimi Linear 一大堆在论文队列里等着读

🤖 我怎么用 agent

不是"按个发送 AI 就搞定一切"那种视频。真正的协作应该是这样:

  1. 想清楚到底要什么 —— prompt 描述,比写代码还重要,做真正的产品经理
  2. 拆解成可执行的小任务 —— agent 干一行就 commit
  3. 让它出方案 + 计划 —— review 完再让它动
  4. review 它的设计,不只是结果 —— 风格、命名、工程结构
  5. 用 Skills 把经验沉淀下来 —— 不让它每次都从零学
  6. 公开 cat 也得让 agent 看 —— 它也需要上下文

GitHub Stats GitHub Streak Top Languages

🌱 长期关注的技术 Long-term Vision && Research Intersest

不希望发 agent 水文,更关注于基础模型的构建和训练这一长期主义工程,长期探究如何让注意力机制跑得更高效聪明而非更沉重,尤其看好线性注意力和稀疏注意力对长序列建模的解放和 scaling 的潜力。同时也在探索视觉-语言多模态基础模型的统一架构,想找一种更本质的方式把不同模态融进同一个全模态全双工框架。我相信,只有当注意力足够高效,甚至放弃反向传播,统一多模态模型才能真正摆脱算力束缚,走得更远。

🧠  LLM 架构    Mamba · RWKV · DeltaNet · Linear Attn · MoE · Diffusion LM 
🎨  多模态     VLM · Diffusion · Pose Estimation · 3D Generation
🤖  Agent       Claude Code · Codex · ReAct · Planning · Multi-Agent
🔧  Infra       vLLM · SGLang · KV Cache · Quantization · Speculative Decoding
🧬  Bio-inspired  SNN · Spiking Attention · Predictive Coding · HTM
🌍  World Model  JEPA · Sora · Genesis · Video Prediction

· 🐾 · 🌿 · 🐾 · 🍵 · 🐾 · 🌸 · 🐾 ·

📬 Find Me


"每只猫都值得一个温暖的书架,每篇论文都值得一个会思考的伙伴,每个 agent 都值得一个靠谱的协作框架。"

made with 🐾 and 🧠 by flyingpetals520

Popular repositories Loading

  1. Paper-Reference-Check-Helper Paper-Reference-Check-Helper Public

    This is an effective and light-flash assistant for checking the references and rapidly finding out problems in your papers with just uploading .bib and .tex file of the paper, which can provide gre…

    Python 1

  2. flyingpetals520.github.io flyingpetals520.github.io Public

    An interactive web-based chronicle tracking the evolution of artificial intelligence through a visual timeline of major model releases, company breakthroughs, and research milestones. Features cura…

    HTML 1

  3. Intelligent-image-annotation-web-tool-based-on-multimodal-LLM Intelligent-image-annotation-web-tool-based-on-multimodal-LLM Public

    Local MLLM Annotation Tool – Offline multimodal LLM for fast pose recognition (DWpose), one-click labeling & smart review. All local inference ensures data security. Features: batch processing, aut…

    HTML 1

  4. whiskershelf whiskershelf Public

    A cozy light local LLM-powered paper library manager with claude code skills for your spark— and a cute cat on the shelf!

    Python 1

  5. flyingpetals520 flyingpetals520 Public