错题本 / Mistake Book¶
深度学习课程复习 · 错题与易混点笔记。本文件只放索引和维护约定,不放任何笔记正文。
维护约定(任务本身)¶
- 一条笔记 = 一个独立 MD 文件,互不嵌套,方便检索。
- 文件按章节子文件夹存放,文件夹命名对齐 wiki/。
- 每个笔记文件统一四段式:问题/疑问 → 正确答案 → 易错点/为什么错 → 出处(必要时加「背诵模板」「备注」)。
- 忠于原课本:每条尽量核对到 wiki,再回
txt/结构化原文或raw/课本原图,并在「出处」标明页码/文件。课本外的补充须显式标注「非本书内容」。 - 公式用标准 LaTeX(
$...$行内、$$...$$块级)。 - 提交(git commit)由用户本人完成;需要提交时由助手提示,不自动提交。
索引¶
第7章 · 支持向量机 (SVM)¶
- 硬间隔 SVM:为什么能令 γ̂=1、约束怎么变 ≥1
- 硬间隔 SVM:支持向量、间隔 2/‖w‖、w 是法向量
- SVM 对偶问题:要背的 min 版与硬/软/核三类的区别
- 软间隔 SVM:合页损失等价写法(了解级)
- 核函数与核技巧:为什么是高维内积(例7.3、正定核、常用核)
- 非线性 SVM 压轴计算题:异或(XOR) 四步完整解法
- 课本三例题:7.1 原始法 · 7.2 对偶法 · 7.3 核映射(重在记方法)
第23章 · 前馈神经网络¶
- BN · 批量归一化:作用、作用层、批次依赖
- 反向传播:通用激活梯度、δ 的角色、内积 vs 外积
- 线性变换:W^T x 转置从哪来、靠维度判别
- 反向传播:为什么权重梯度是外积 x·δᵀ(逐元素链式推导)
- 反向传播:作业二·5 完整算例 + 老师对「两类符号」的转置裁决
- 反向传播:要点总结 + 自测清单
- 暂退法 dropout(课本完整版 + 预测缩放为什么这么做)
- 暂退法(dropout) vs 早停法(early stopping):别记混
第24章 · 卷积神经网络 (CNN)¶
(暂无)
第29.1节 · 优化算法¶
第25章 · 循环神经网络 (RNN)¶
- RNN 全公式速查:SRNN / LSTM / GRU(字母与函数对齐)
- RNN 的缺点:通用「不能并行」 + S-RNN「长程依赖/梯度问题」
- LSTM 直觉:c 是加性高速公路、h 输出为何过 tanh(自问自答)
第26章 · 序列到序列与 Transformer¶
- 注意力为什么除以 √d:尺度变换避免梯度消失
- RNN Search 注意力:Q=s_{i-1} / K=V=h_j、自回归但不能并行
- Transformer 必背:七大技术 + 核心公式(书本/PPT 对齐)
综合 / 跨章¶
(暂无)