# Summary
实践中,过于复杂的模型族不一定包括目标函数或真实数据生成过程,甚至也不包括近似过程。我们几乎从未知晓真实数据的生成过程,所以我们永远不知道被估计的模型族是否包括生成过程。然而,深度学习算法的大多数应用都是针对这样的情况 其中真实数据的生成过程几乎肯定在模型族之外。深度学习算法通常应用于极为复杂的领域,如图像、音频序列和文本,本质上这些领域的真实生成过程涉及模拟整个宇宙。从某种程度上说,我们总是持方枘(数据生成过程)而欲内圆凿(模型族)。
这意味着控制模型的复杂度不是找到合适规模的模型(带有正确的参数个数)这样一个简单的事情。相反,我们可能会发现,或者说在实际的深度学习场景中我们几乎总是会发现,最好的拟合模型(从最小化泛化误差的意
# 学习思路
李沐和吴恩达是看了让你大概知道深度学习里大概有什么东西,这些东西干嘛用的。比如[cnn](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=cnn&zhida_source=entity)是什么,[transformer](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=transformer&zhida_source=entity)是什么,[激活函数](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=%E6%BF%80%E6%B4%BB%E5%87%BD%E6%95%B0&zhida_source=entity),[归一化](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=%E5%BD%92%E4%B8%80%E5%8C%96&zhida_source=entity),[残差](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=%E6%AE%8B%E5%B7%AE&zhida_source=entity)。后面你看论文有个大概的印象,到时候看论文看一眼摘要引言,看一下模型框图和最后实验效果,心里就八九不离十了。
小土堆那个看了是真的告诉你深度学习代码的架构是什么样的。比如[batchsize](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=batchsize&zhida_source=entity)是什么,学习率是什么,维度是什么。一个工程大概有哪几个文件,每个文件干嘛用的。看代码时候直接奔着model.py过去就行了,别傻乎乎的看那些底层的数据预处理和训练测试的代码,看了半天没啥用。
然后找你本领域经典的论文和代码精读一篇,吃透以后去复现当年的[sota](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=sota&zhida_source=entity)。成熟领域大部分都是在一篇祖师爷的基础上改的,一通百通的。
然后在[SOTA](SOTA.md)上面魔改就行了,改出效果去翻论文拼理论解释。
另外,[深蓝学院](https://zhida.zhihu.com/search?content_id=687851418&content_type=Answer&match_order=1&q=%E6%B7%B1%E8%93%9D%E5%AD%A6%E9%99%A2&zhida_source=entity)的课程也很值得推荐。其中的《深度神经网络加速:cuDNN 与 TensorRT》这门课程能够加深你对深度学习的理解和认识。同时具备CUDA编程操作能力,使用cuDNN、TensorRT这两个当下热门的深度神经网络加速工具。感兴趣的可以直接看看下面这个链接。
[[👨🏻💻小土堆]]
# Notes
| 过程 |
| ------ |
| 数据探索 |
| 特征工程 |
| 数据清洗 |
| 数据划分 |
| 模型训练 |
| 超参数调优 |
| 模型评估 |
| 可解释性分析 |
| 组件 | |
| ----------------- | ----------- |
| criterion | 定义什么是误差 |
| [[优化器 optimizer]] | 在山谷中的下山移动策略 |
# 工具 & 平台
| 工具或平台名称 | 主要用途 | 特点与优势 | 备注 |
| --------------------------- | -------------- | ------------------------------- | ------------------- |
| [[WandB]](Weights & Biases)| 深度学习实验管理与结果可视化 | 实验记录云端同步;超参配置一目了然;支持交互式图表嵌入 | 强烈推荐,免费使用 |
| Hydra + OmegaConf | YAML配置管理与实验提交 | 配置变量自动填充;命令行动态修改;支持继承与引用 | 与Wandb结合效果最佳,Meta出品 |
| Plotly | 高度自定义化数据可视化 | 支持交互式图表,定制化曲线导出;可与Wandb联动 | 弥补Matplotlib交互性不足 |
| VS Code Remote | 远程服务器与集群开发调试 | 支持SSH与Docker容器访问;远程Git管理;远程图片查看 | 调试与开发一站式完成 |
| Fitlog | 实验管理与版本控制 | 自动记录超参与结果;代码版本自动管理;前端可视化操作 | 轻量级,适用不同深度学习框架 |
| Google Sheets | 灵活记录实验信息 | 自由配置字段;支持多人协作 | 定制化需求较高时推荐 |
| Acronymify | 模型或论文缩写自动生成 | 快速创建朗朗上口的缩写 | 适合论文命名传播 |
| Linggle | 英文写作词语搭配查询 | 精准提供学术英文写作常见搭配 | 特别适合非母语写作者 |
| Mathpix | 手写或截图公式转LaTeX | 一键截图公式生成代码,快速高效 | 大幅节省LaTeX公式输入时间 |
| Colorbrewer2 | 色盲友好型颜色搭配 | 提供学术论文作图的常用配色方案 | 保证论文图表视觉友好性 |
| Papers with Code | 快速查找论文相关代码 | 查找论文复现代码最有效的工具之一 | 与GitHub结合使用效果最佳 |
| Google Text-to-Speech | 高质量文字转语音 | 提供多种语速与音调选择,适合制作论文讲解视频 | Google官方产品,品质高 |
这些工具组合使用,能够大幅提高深度学习研究与开发过程中实验管理、数据可视化和学术写作的效率。
| | | | |
| ------ | --------------- | -------------- | ------------------------ |
| 循环神经网络 | 具有记忆能力,可处理序列数据 | 自然语言处理、时序预测 | [[循环神经网络RNN]]、[[长短期记忆网络LSTM]]、[[GRU]] |
| 生成对抗网络 | 由生成器和判别器组成的对抗学习 | 图像生成、数据增强、风格迁移 | DCGAN、StyleGAN、CycleGAN |
| 自编码器 | 无监督学习,可压缩和重构数据 | 降维、特征学习、数据去噪 | AE、VAE、DAE |
| 图神经网络 | 可处理图结构数据 | 社交网络分析、分子性质预测 | GCN、GAT、GraphSAGE |
| 变形金刚网络 | 基于注意力机制,并行处理能力强 | 机器翻译、文本理解、视觉任务 | [[Transformer]]、BERT、GPT |
| 概率神经网络 | 基于概率论,可量化不确定性 | 贝叶斯推理、风险评估 | BNN、PNN、DBN |
# 学习资源
还是李宏毅老师讲得好,李沐老师讲的适合李宏毅老师的课看完以后,在工程上复现了一遍,然后再回来听,会发现更多有趣的细节谷 04-17.福建回复 ∞ 6 E
如何六个月内学会深度学习 - 园长的文章 - 知乎
https://zhuanlan.zhihu.com/p/33669739
MLP可以被看作是深度学习的前身之一。
但是,深度学习不仅仅是增加层数,还包括各种复杂的架构和技术。例如,[CNN](CNN.md)使用卷积层,[循环神经网络RNN](循环神经网络RNN.md)使用循环连接,如注意力机制、残差连接等。
[Hugging Face](Hugging%20Face.md)
[Transformer](Transformer.md)

| Category | Tasks |
| ---------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| [多模态](多模态.md) | • Image-Text-to-`Text<br>`• Visual Question `Answering<br>`• Document Question Answering |
| [计算机视觉CV](计算机视觉CV.md) | • Depth `Estimation<br>`• Image `Classification<br>`• [目标检测](目标检测.md)<br>• Image `Segmentation<br>`• Text-to-`Image<br>`• Image-to-`Text<br>`• Image-to-`Image<br>`• Image-to-`Video<br>`• Unconditional Image `Generation<br>`• Video `Classification<br>`• Text-to-`Video<br>`• Zero-Shot Image `Classification<br>`• Mask `Generation<br>`• Zero-Shot Object `Detection<br>`• Text-to-`3D<br>`• Image-to-`3D<br>`• Image Feature Extraction |
| [自然语言处理](自然语言处理.md) | • Text `Classification<br>`• Token `Classification<br>`• Table Question `Answering<br>`• Question `Answering<br>`• Zero-Shot `Classification<br>`• `Translation<br>`• `Summarization<br>`• Feature `Extraction<br>`• Text `Generation<br>`• Text2Text `Generation<br>`• Fill-`Mask<br>`• Sentence Similarity |
| Audio | • Text-to-`Speech<br>`• Text-to-`Audio<br>`• Automatic Speech `Recognition<br>`• Audio-to-`Audio<br>`• Audio `Classification<br>`• Voice Activity Detection |
| Tabular | • Tabular `Classification<br>`• Tabular `Regression<br>`• Time Series Forecasting |
| [强化学习](强化学习.md) | • Reinforcement `Learning<br>`• Robotics |
| Other | • Graph Machine Learning |
[[余弦退火]]