> _所以,如果偏导数是告诉你"向东走多陡"和"向北走多陡",那么梯度就是直接告诉你"要快速上山,就往这个方向走"。这就是为什么梯度在优化算法中如此重要。
梯度描述的是多元函数的某点处,沿某方向斜率最大时的向量
我来帮你处理这段话中的 LaTeX 公式:
# 一元函数的梯度(导数)
对于一元函数 f(x),其梯度就是导数:
$ \nabla f(x) = f'(x) = \frac{d}{dx}f(x) $
# 二元函数的梯度
对于二元函数 f(x,y),其梯度是一个向量,包含了两个偏导数:
$ \nabla f(x,y) = \begin{bmatrix}
\frac{\partial f}{\partial x} \\
\frac{\partial f}{\partial y}
\end{bmatrix} $
或者写成行向量形式:
$ \nabla f(x,y) = \begin{bmatrix}
\frac{\partial f}{\partial x} & \frac{\partial f}{\partial y}
\end{bmatrix} $
其中:
- $ \frac{\partial f}{\partial x} $ 是 f 对 x 的偏导数(固定 y)
- $ \frac{\partial f}{\partial y} $ 是 f 对 y 的偏导数(固定 x)
例如,对于函数 f(x,y) = x² + xy + y²,其梯度为:
$ \nabla f(x,y) = \begin{bmatrix}
2x + y \\
x + 2y
\end{bmatrix} $
梯度就是把所有方向的偏导数"打包"在一起的向量:
1. 梯度的定义:
- 梯度是一个向量,包含了所有变量的偏导数
- 对于二元函数 f(x,y),梯度是 ∇f = (∂f/∂x, ∂f/∂y)
- 箭头的方向指向函数值增加最快的方向
- 箭头的长度表示这个最大增长率的大小
1. 形象理解:
- 想象你站在山坡上(点P)
- 梯度就像一个指南针,指出:
- 哪个方向爬最陡(方向)
- 有多陡(大小)
1. 梯度的重要特性:
- 梯度垂直于等高线(图中白色虚线)
- 指向函数值增加最快的方向
- 大小表示在这个方向上的变化率
- 在极值点处梯度为零(山顶或山谷)
1. 实际应用:
- 机器学习中的梯度下降:
- 想象一个盲人在山上找最低点
- 感受当前位置最陡的方向(计算梯度)
- 向相反方向走一小步(更新参数)
- 重复这个过程直到找到山谷(最小值)
## [[梯度爆炸]]