在深度学习中,存在两种截然不同的参数: - **模型参数(Model Parameters)** 是模型通过大量数据自动学习得到的,例如神经网络连接之间的权重(weights)和偏置(biases)。 这些参数在模型训练过程中被不断优化调整。 - **超参数(Hyperparameters)** 是人为预先设定的、不由模型自动学习的参数,用于指导学习过程本身。 例如: - 学习率(Learning Rate):控制模型学习新知识的步幅大小。 - 批量大小(Batch Size):模型每次学习多少个样本数据。 - 迭代次数(Epochs):整个训练数据被反复学习的次数。 - 神经网络层数与每层神经元数量。 - 优化算法的选择(如SGD、Adam、RMSProp等)。 你当前的盲点可能是未区分模型“自动学到的参数”与“人为提前设定的超参数”。