在深度学习中,存在两种截然不同的参数:
- **模型参数(Model Parameters)**
是模型通过大量数据自动学习得到的,例如神经网络连接之间的权重(weights)和偏置(biases)。
这些参数在模型训练过程中被不断优化调整。
- **超参数(Hyperparameters)**
是人为预先设定的、不由模型自动学习的参数,用于指导学习过程本身。
例如:
- 学习率(Learning Rate):控制模型学习新知识的步幅大小。
- 批量大小(Batch Size):模型每次学习多少个样本数据。
- 迭代次数(Epochs):整个训练数据被反复学习的次数。
- 神经网络层数与每层神经元数量。
- 优化算法的选择(如SGD、Adam、RMSProp等)。
你当前的盲点可能是未区分模型“自动学到的参数”与“人为提前设定的超参数”。