梯度 - 𓀚 转了码的刘公子

> _所以，如果偏导数是告诉你"向东走多陡"和"向北走多陡"，那么梯度就是直接告诉你"要快速上山，就往这个方向走"。这就是为什么梯度在优化算法中如此重要。梯度描述的是多元函数的某点处，沿某方向斜率最大时的向量我来帮你处理这段话中的 LaTeX 公式： # 一元函数的梯度（导数）对于一元函数 f(x)，其梯度就是导数： $ \nabla f(x) = f'(x) = \frac{d}{dx}f(x) $ # 二元函数的梯度对于二元函数 f(x,y)，其梯度是一个向量，包含了两个偏导数： $ \nabla f(x,y) = \begin{bmatrix} \frac{\partial f}{\partial x} \\ \frac{\partial f}{\partial y} \end{bmatrix} $ 或者写成行向量形式： $ \nabla f(x,y) = \begin{bmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \end{bmatrix} $ 其中： - $ \frac{\partial f}{\partial x} $ 是 f 对 x 的偏导数（固定 y） - $ \frac{\partial f}{\partial y} $ 是 f 对 y 的偏导数（固定 x）例如，对于函数 f(x,y) = x² + xy + y²，其梯度为： $ \nabla f(x,y) = \begin{bmatrix} 2x + y \\ x + 2y \end{bmatrix} $ 梯度就是把所有方向的偏导数"打包"在一起的向量： 1. 梯度的定义： - 梯度是一个向量，包含了所有变量的偏导数 - 对于二元函数 f(x,y)，梯度是 ∇f = (∂f/∂x, ∂f/∂y) - 箭头的方向指向函数值增加最快的方向 - 箭头的长度表示这个最大增长率的大小 1. 形象理解： - 想象你站在山坡上（点P） - 梯度就像一个指南针，指出： - 哪个方向爬最陡（方向） - 有多陡（大小） 1. 梯度的重要特性： - 梯度垂直于等高线（图中白色虚线） - 指向函数值增加最快的方向 - 大小表示在这个方向上的变化率 - 在极值点处梯度为零（山顶或山谷） 1. 实际应用： - 机器学习中的梯度下降： - 想象一个盲人在山上找最低点 - 感受当前位置最陡的方向（计算梯度） - 向相反方向走一小步（更新参数） - 重复这个过程直到找到山谷（最小值） ## [[梯度爆炸]]