前言
本文隸屬于專欄《機器學習數學通關指南》,該專欄為筆者原創,引用請注明來源,不足和錯誤之處請在評論區幫忙指出,謝謝!
本專欄目錄結構和參考文獻請見《機器學習數學通關指南》
正文
一句話總結
泰勒公式是用多項式函數逐步逼近復雜函數的工具,其核心思想是:用某一點的函數值及各階導數信息,構建一個多項式,像“放大鏡”一樣,在局部無限接近原函數。
直觀理解方式
-
以直代曲 → 逐步修勻
- 一階泰勒公式就是常用的“以直代曲”(例如用切線近似函數)。
- 加入高階項后,逐漸加入“彎曲校正項”,使得多項式在更廣范圍內貼合原函數。
- 類比:調手機相機的“放大鏡”功能——起始是模糊的直線輪廓(低階近似),逐步放大細節后,曲線形狀清晰可見(高階近似)。
-
低階盯局部,高階管全局
- 低階項(如一次項、二次項):主導當前點附近的形狀。
- 高階項(如三次及以上):在遠離當前點的區域逐漸起主要作用(例如
y = x3
會比y = x2
在x > 1
時增長更快)。 - 示例:
- 在原點展開的
e?
,低階項(1 + x)在靠近0時與真實值接近,高階項(x2/2! + x3/3! + ...
)逐漸修正遠端的誤差。 sin x
的泰勒展開通過奇次項(x3、x?)交替抵消,精確模擬波動特性。
- 在原點展開的
關鍵要點
1. 階數是精度的標尺
- 階數越高,多項式逼近的范圍越廣、精度越高。
- 例子對比:
- 用
1 + x
近似e?
(1階),只能在x → 0
時勉強可用。 - 用
1 + x + x2/2! + x3/3!
近似e?
(3階),在x = 1
附近誤差已小于0.01。
- 用
2. 階乘的作用:壓制高階冪的爆炸增長
- 問題:x?比x2增長快得多,直接相加會導致高階項完全主導多項式。
- 解決方法:用階乘
n!
作為分母,均衡冪函數的增長速度(例如x3/3!
中,3! = 6會顯著減緩x3的增速)。 - 說明:
- 未加階乘時,高階項會過早壓制低階項(如x?完全覆蓋x2的影響)。
- 加入階乘后,低階項先起主導作用,高階項逐漸接管更遠的區域。
3. 數學形式與物理意義
- 單變量公式:
f ( x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! ( x ? x 0 ) k + R n ( x ) f(x) = \sum_{k=0}^n \frac{f^{(k)}(x_0)}{k!}(x - x_0)^k + R_n(x) f(x)=k=0∑n?k!f(k)(x0?)?(x?x0?)k+Rn?(x)
其中R_n(x)
為余項,表示誤差(余項越小,逼近越精確)。 - 物理意義:
- 導數各階信息 = 函數當前位置(0階)、瞬時變化方向(1階)、彎曲程度(2階)等。
- 綜合所有導數信息即可預測函數未來走勢。
應用場景
- 工程計算:用多項式替換復雜函數(如
sin x
)快速計算近似值。 - 機器學習:函數的局部近似用于優化算法(如牛頓法)。
- 物理建模:描述微小振動、波動時的高精度展開(如諧振子方程)。
與微分中值的區別
- 泰勒公式:提供全局的逐階近似多項式,反映各階導數的綜合貢獻。
- 微分中值定理:僅保證某一點的存在性(如梯度方向的最速上升)。
- 聯系:泰勒公式的一階展開對應微分中值的局部線性近似。
一句話總結
泰勒公式是用多項式“鏡頭”逐步聚焦函數的工具——階數決定了精度,階乘平衡了增長,展開式中的每一項都是導數信息的精確調用,從而在局部和全局間架起橋梁。