Skip to content

DeconBear/learn-ai

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

learn-ai:图解 AI,一行代码看懂一个概念

从感知机到大模型 · 55 篇文章 · 200+ 张图解 · 100+ 个可运行代码示例

目录 · 快速开始 · 章节结构 · 文档站点 · 贡献


为什么做这个仓库

AI 领域每天都有新论文、新框架、新名词。但真正关键的底层原理并不多——神经网络的训练、反向传播、注意力机制、强化学习的 Bellman 方程——几十年没变过。

这个仓库的目标:用最直观的图解,配上一跑就能看到结果的代码,把 AI 的核心概念一个一个讲清楚

每篇文章只聚焦一个知识点,20-30 分钟读完。所有代码默认 CPU 运行,消费级笔记本就能跑,GPU 作为可选项。


学习路径推荐

不同背景的学习者,建议按不同的路径学习。下面是七种典型路径:

🔵 路径 A:AI 零基础系统学习

适合:在校学生、转行学习者,希望建立完整知识体系

按顺序推进:阶段一 → 阶段二 → 阶段三 → 阶段四 → 阶段五 → 阶段六 → 阶段七

建议每章花 1-2 天:读正文(30min)→ 推公式(30min)→ 跑代码(30min)→ 做练习(30min)。

🟡 路径 B:大模型重度使用者

适合:日常使用 ChatGPT/Claude,想理解 AI 底层原理,不追求成为 ML 工程师

顺序 章节 重点
1 s01 AI 全景:快速搞懂 AI/ML/DL 的区别,建立概念地图
2 s14-s18 NLP 完整链路:词向量→RNN→Transformer→BERT/GPT→LLM,理解 ChatGPT 的"引擎"
3 s21 RLHF:ChatGPT 怎么能"听懂人话"、对齐人类偏好
4 s22-s23 多模态 + RAG/Agent:GPT-4V 怎么看图、AI 怎么调用工具
5 s25 AI 安全:幻觉、越狱、偏见——大模型有哪些坑
6 s24 部署推理:KV Cache、量化——为什么大模型又贵又慢

💡 跳过:阶段一~二(数学细节)、CV、RL 理论、附录。目标不是训练模型,而是理解模型。

🟢 路径 C:ML 工程师补理论和算法

适合:已会深度学习,想补经典 ML 理论 + 算法基础

顺序 章节 重点
1 ml01-ml04 k-NN、贝叶斯、朴素贝叶斯、SVM — ML 四大基础分类器
2 ml05 决策树 树模型基础,为集成学习做铺垫
3 番外 ml06-ml07 随机森林、AdaBoost/GBDT/XGBoost — 工业界最爱
4 番外 ml08-ml09 聚类、降维 — 无监督学习核心
5 附录 algo01-algo16 算法与数据结构 — 面试/竞赛必备

🟠 路径 D:软件工程师转 AI

适合:有编程基础,缺 ML 理论 + DL 实战经验

顺序 章节 重点
1 s01 AI 全景,快速建立大局观
2 s02-s04 线性回归、逻辑回归、过拟合 — 速通 ML 三要素
3 ml01, ml04, ml05 k-NN、SVM、决策树 — 核心分类器
4 s05-s09 计算图→反向传播→优化器 — DL 基本功
5 s10-s13 CNN→目标检测→图像生成 — CV 方向
6 s14-s18 文本表示→Transformer→LLM — NLP 方向
7 s22-s23 多模态、RAG/Agent — 工程应用

🔵 路径 E:其他行业转行 AI

适合:非计算机/非数学背景,从其他行业转行,需要"够用、能上手、能面试"

阶段 章节 重点
建立直觉 s01 先搞清楚 AI 是什么,不用深究公式
核心三件套 s02-s04 线性回归、逻辑回归、过拟合 — ML 面试必问
必备经典 ml01(k-NN)、ml04(SVM)、ml05(决策树) 三道菜就能应付大部分 ML 面试问题
DL 入门 s05-s09 计算图→反向传播→Adam — 一个 epoch 跑通就行
项目为王 s10(CNN)、s16(Transformer)、s18(LLM) 简历上的硬通货:图像分类、文本生成
面试加分 s23(RAG)、s25(安全) 展示你对工程落地的理解
可选补课 附录 algo01-algo16 算法弱的话,优先看 algo02(数组/哈希)、algo10(分治/二分)、algo11(DP)

核心原则:先跑通再理解,先项目再理论,先面试再深入。不必死磕每一章的数学推导。

🟣 路径 F:面试冲刺(15 章核心)

适合:已学过,快速复习高频考点,备战 ML/AI 面试

核心必看:s02/s03(线性/逻辑回归)→ s04(过拟合/正则化)→ ml04(SVM)→ ml05(决策树)→ s06/s07(反向传播)→ s09(Adam)→ s10(CNN)→ s16(Transformer)→ s17(BERT/GPT)→ s18(LLM/RLHF)→ s21(RLHF)→ s23(RAG)→ s25(AI 安全)

番外篇和附录按面试岗位选择性翻阅:ML 岗重点看 ml06/ml07(集成学习);算法岗重点看附录;LLM 岗重点看 s18/s21/s23。

🔴 路径 G:算法竞赛(数据结构与算法)

适合:ACM/蓝桥杯/LeetCode 选手,系统刷算法

直接进入附录,按 algo01 → algo16 顺序学习。每节包含概念图解 + 手写实现 + 练习题。其余 AI 章节按需查阅。


阶段一:机器学习基石(4 篇)

编号 标题 核心内容 代码实操
s01 AI 全景图 AI/ML/DL 关系、三大范式、发展简史 NumPy 手写感知机
s02 线性回归 模型-损失-优化三要素、梯度下降 从零实现 + 正规方程 + sklearn 对比
s03 逻辑回归与分类 Sigmoid、交叉熵、Softmax 多分类 手写二分类 + 多分类器
s04 过拟合与正则化 Bias-Variance 权衡、L1/L2、交叉验证 多项式拟合 + 正则化路径 + K-Fold

阶段二:经典机器学习(5 篇)

编号 标题 核心内容 代码实操
ml01 k-近邻与距离度量 k-NN、距离度量、维数灾难 KNN 分类器 + 决策边界可视化
ml02 贝叶斯决策理论 先验/后验、最小风险决策、ROC/AUC 高斯贝叶斯分类器
ml03 朴素贝叶斯 条件独立性、高斯/多项式 NB、拉普拉斯平滑 垃圾邮件检测 + 文本分类
ml04 支持向量机 (SVM) 最大间隔、对偶问题、核技巧、软间隔 线性 SVM + RBF 核可视化
ml05 决策树 ID3/C4.5/CART、信息增益、剪枝 CART 决策树 + 决策面可视化

番外:经典机器学习进阶(9 篇,可选)

编号 标题 核心内容 代码实操
ml06 集成学习:Bagging 与随机森林 Bootstrap、OOB、特征子空间 随机森林 + 特征重要性
ml07 集成学习:Boosting 与 Stacking AdaBoost、GBDT、XGBoost AdaBoost + 简单 GBDT
ml08 聚类 K-Means、DBSCAN、层次聚类 聚类算法对比可视化
ml09 降维与特征工程 PCA、t-SNE、LDA PCA 手写 + t-SNE 可视化
ml10 蒙特卡洛方法 MC 积分、重要性采样、MCMC π 估计 + Metropolis-Hastings
ml11 隐马尔可夫模型 (HMM) 前向算法、Viterbi、Baum-Welch HMM + 词性标注
ml12 EM 算法与高斯混合模型 E-Step/M-Step、GMM、ELBO GMM 聚类 + 软分配可视化
ml13 概率图模型 贝叶斯网、d-分离、信念传播 变量消除 + 因子图推理
ml14 核方法与高斯过程 核技巧、KRR、GP 回归 GP 回归 + 不确定性可视化

阶段三:深度学习基础(5 篇)

编号 标题 核心内容 代码实操
s05 计算图与前向传播 计算图、感知机、激活函数深度解析 纯 NumPy 搭建 MLP
s06 反向传播与链式法则 局部梯度规则、链式法则、fan-out 从零实现 mini autograd 引擎
s07 多层网络的矩阵反传 δ 递推公式、梯度检查、消失/爆炸 手写 MLP + 梯度检查
s08 优化器:从 SGD 到 Adam Momentum、RMSProp、自适应步长 四种优化器轨迹对比
s09 Adam 深度解析 偏差修正、AdamW、梯度裁剪、诊断 MNIST 训练 + 优化器对比

阶段四:计算机视觉(5 篇)

编号 标题 核心内容 代码实操
s10 CNN 核心原理 卷积、池化、感受野、参数共享 从零实现 Conv2d + 特征图
s11 经典架构演进 LeNet → ResNet → EfficientNet 从零写 ResNet 训练 CIFAR-10
s12 目标检测 R-CNN → YOLO、IoU、NMS、mAP 从零实现 IoU + NMS
s12b Vision Transformer Patch Embedding、位置编码 ViT vs CNN 对比实验
s13 图像生成 GAN、VAE、扩散模型原理 训练 GAN + VAE 生成 MNIST

阶段五:自然语言处理(5 篇)

编号 标题 核心内容 代码实操
s14 文本表示 词袋→TF-IDF→word2vec 训练 Skip-gram + 词向量可视化
s15 序列模型 RNN、LSTM、GRU 门控机制 字符级语言模型 + 情感分类
s16 Attention & Transformer Q/K/V、多头注意力、位置编码 从零实现 nanoGPT
s17 预训练范式 BERT vs GPT、MLM vs CLM BERT 微调 + 掩码预测
s18 大语言模型 Scaling Law、涌现、RLHF/DPO LoRA 微调 + DPO 对齐

阶段六:强化学习(3 篇)

编号 标题 核心内容 代码实操
s19 强化学习入门 MDP、Q 表、ε-greedy、Bellman Q-Learning 走迷宫
s20 深度强化学习 DQN、经验回放、REINFORCE DQN 玩 CartPole
s21 RLHF PPO、DPO、Reward Model PPO + DPO 对比训练

阶段七:前沿与应用(4 篇)

编号 标题 核心内容 代码实操
s22 多模态模型 CLIP、对比学习、LLaVA 架构 CLIP 零样本分类
s23 RAG 与 AI Agent 检索增强、ReAct、工具调用 完整 RAG + Agent 系统
s24 部署与推理优化 KV Cache、量化、Flash Attention KV Cache + INT8 量化
s25 AI 安全与对齐 幻觉、越狱、偏见、深度防御 安全扫描 + 幻觉检测

附录:算法与数据结构基础(16 节,默认折叠)

编号 标题 核心内容 代码实操
algo01 复杂度分析 大 O/Ω/Θ、主定理、均摊分析 排序算法复杂度对比
algo02 数组链表哈希表 动态数组、链表、哈希表、LRU 各数据结构手写实现
algo03 栈与队列 单调栈/队列、表达式求值 表达式求值 + 滑动窗口
algo04 树与二叉树 遍历、BST、AVL 旋转、哈夫曼 BST + AVL 手写实现
algo05 堆并查集跳跃表 堆排序、路径压缩、SkipList 堆 + 并查集 + Kruskal
algo06 图论基础 存储方式、BFS/DFS、拓扑排序 图的遍历 + 拓扑排序
algo07 最短路径 Dijkstra、Bellman-Ford、Floyd、A* 最短路算法全实现
algo08 MST 与网络流 Prim/Kruskal、Dinic、二分图匹配 MST + 最大流
algo09 贪心算法 活动选择、哈夫曼编码、区间调度 贪心 + 正确性证明
algo10 递归分治与二分 归并排序、快速排序、二分查找 分治算法 + 逆序对
algo11 动态规划(上) 背包、LCS、LIS、编辑距离 DP 经典问题全实现
algo12 动态规划(下) 区间/树形/状压/数位 DP 高级 DP + 优化
algo13 字符串算法 KMP、Trie、AC 自动机、Manacher 字符串匹配全家桶
algo14 线段树与树状数组 BIT、线段树、懒标记、可持久化 线段树 + BIT 手写
algo15 数论与组合数学 快速幂、筛法、CRT、组合数 数论算法 + 取模运算
algo16 计算几何与博弈论 叉积、凸包、Nim、SG 函数 Graham Scan + Nim 求解

快速开始

环境配置

# 1. 克隆仓库
git clone https://github.com/DeconBear/learn-ai.git
cd learn-ai

# 2. 创建虚拟环境(推荐 Python 3.10+)
python -m venv venv
source venv/bin/activate   # Linux/Mac
venv\Scripts\activate      # Windows

# 3. 安装依赖
pip install -r requirements.txt

运行代码

# 每章都是独立可运行的——直接跑
cd s01_ai_overview/code
python demo.py       # 完整教学代码
python exercise.py   # 动手练习(需先补全 TODO)

# 更多章节
cd s08_optimizers_sgd_to_adam/code && python demo.py
cd s16_attention_transformer/code && python demo.py

硬件要求

阶段 最低配置 推荐配置
阶段一~三(s01-s09, ml01-ml14) CPU,任意笔记本
阶段四~六(s10-s21) CPU(已优化训练量) GPU 4GB+
阶段七(s22-s25) CPU GPU 8GB+
附录(algo01-algo16) CPU,任意笔记本

所有代码默认 CPU 运行,自动检测 GPU。有 GPU 的章节在 CPU 下会自动减少训练量,保证快速出结果。

学习建议

  1. 选择路径:参考上面「学习路径推荐」,选最适合你背景的路线
  2. 先图后文再代码:图解建直觉 → 文字理解原理 → 跑代码验证 → 做练习巩固
  3. 完成 exercise.py:每章练习留有空缺,先独立尝试再对照 demo.py
  4. 动手实验:改超参数、换数据集、加噪音——比死记硬背有用得多
  5. 番外篇按需学:集成学习、聚类、HMM、概率图等属于进阶内容,可跳过或按需查阅

文档站点

本仓库附带 VitePress 文档站点,支持全文搜索、深色模式、Mermaid 流程图和 LaTeX 公式渲染。

# 启动文档站点
npm install
npm run dev        # http://localhost:5173

# 构建静态站点
npm run build      # 输出到 .vitepress/dist/
npm run preview    # 预览构建结果

站点功能:

  • 侧边栏导航(七阶段 + 番外 + 附录,共 55 篇)
  • 全文搜索
  • LaTeX 公式渲染
  • 深色/浅色模式
  • 每章代码在线查看 + 下载

每章结构

sXX_topic/
├── index.md                # 图解正文(在线浏览)
├── CODE.md                 # 代码说明与运行报告
├── code-demo.md            # demo.py 查看页面(含说明 + 完整代码)
├── code-exercise.md        # exercise.py 查看页面
├── code/
│   ├── demo.py             # 完整教学代码(中文注释)
│   └── exercise.py         # 动手练习
└── images/                 # 手绘图解 + 代码运行结果
    ├── XX-01-xxx.png       # 概念图解
    ├── XX-02-xxx.png       # 概念图解
    └── ...                 # 运行生成的图表

每章配套:

  • 正文(index.md):图文讲解,100+ 张手绘级插图
  • 代码报告(CODE.md):嵌入实际运行结果的图片 + 解读说明
  • 在线查看(code-demo.md / code-exercise.md):语法高亮代码 + 下载

贡献

欢迎贡献!你可以:

  • 提交 Issue 指出错误或改进建议
  • 提交 PR 修正错误、改进代码注释
  • 贡献新文章(认同「图解 + 代码」风格即可)

致谢


License

MIT License — 自由使用、修改、分发。

About

通过一个仓库,拆解 AI 的运行逻辑和建构方式,培养从 0 到 1 设计和训练 AI 模型的能力

Topics

Resources

License

Stars

Watchers

Forks

Contributors