微分学

微分学（英语：Differential calculus）是微积分学的一部分，是通过导数和微分来研究曲线斜率、加速度、最大值和最小值的一门学科，也是探讨特定数量变化速率的学科。微分学是微积分的二个主要分支之一^{[注 1]}^[1]。

函数的图（以黑色线表示）以及函数的切线（以红色直线表示）。切线的斜率即为函数在该位置的导数

微分学主要研究的主题是函数的导数、相关的标示方式（例如微分）以及其应用。函数在特定点的导数可以说明函数在此输入值附近的变化率。寻找导数的过程即为微分。若以图示表示，函数在某一点的微分是函数图形在那一点的切线斜率（前提是在那一点的导数存在而且有定义）。针对单实数变数的实值函数（英语：Real-valued function）而言，函数在某一点的导数也就可以决定在那一点最佳的线性近似。微分和积分的关系可以由微积分基本定理来说明，此定理说明微分是积分的逆运算。

几乎所有量化的学科中都有微分的应用。例如在物理学中，运动物体其位移对时间的导数即为其速度，速度对时间的导数就是加速度、物体动量对时间的导数即为物体所受的力，重新整理后可以得到牛顿第二运动定律 $F=ma$ 。化学反应的化学反应速率也是导数。在运筹学中，会透过导数决定在运输或是设计上最有效率的作法。

导数常用来找函数的极值。含有微分项的方程式称为微分方程，是自然现象（英语：Natural phenomenon）描述的基础。微分以及其广义概念出现在许多数学领域中，例如复分析、泛函分析、微分几何、测度及抽象代数。

导数

在

(x, f (x))

处的切线

一个可微函数在不同位置的导数

假设 $x$ 和 $y$ 是实数，而且 $y$ 是 $x$ 的函数，也就是说，针对每一个 $x$ ，都有一个对应的 $y$ 。两者的关系可以表示为 $y = f (x)$ 。若 $f (x)$ 是直线的方程式（称为一次方程），则会存在两个实数 $m$ 和 $b$ 使得 $y = mx + b$ 。在这个“斜率－截距式”中， $m$ 是斜率，可以用下式来求得：

m={\frac {{\text{change in }}y}{{\text{change in }}x}}={\frac {\Delta y}{\Delta x}},

其中符号 $Δ$ （是希腊大写字母Δ）表示“变化”。以下的式子会成立： $Δ y = m Δ x$ .

一般的函数不是直线，因此没有斜率。在几何上来看，函数 $f$ 在 $x = a$ 的导数就是函数 $f$ 在 $a$ 点切线的斜率（如图）。常会表示为 $f'(a)$ 或 $.mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}dy/dx|x = a$ 。因为导数是 $f$ 在 $a$ 点线性近似的斜率，因此导数（以及函数 $f$ 在 $a$ 点的值）是函数 $f$ 在 $a$ 点附近最佳的线性化近似。

若在函数 $f$ 定义域中的每一点 $a$ 都有导数，则存在一函数可以将每一点 $a$ 对应到函数 $f$ 在 $a$ 点的导数。例如，若函数 $f (x) = x 2$ ，则其导数函数 $f'(x) = dy / dx = 2 x$ 。

另一个有关的表示法是函数的微分。若 $x$ 和 $y$ 是实数变数，函数 $f$ 在 $x$ 点的导数为函数 $f$ 在 $x$ 点切线的斜率。因为 $f$ 的引数及输出都是标量，因此 $f$ 的导数也是实数。若 $x$ 和 $y$ 是向量，则 $f$ 图形的最佳线性近似会和函数 $f$ 在不同方向的变化有关。找到在单一方向的最佳近似，也就决定了偏微分，一般会表示为 $\partial y / \partial x$ 。若找到了函数 $f$ 在所有方向的线性化近似，则称为全微分。

微分的历史

若以切线来看，微分的概念很早以前就出现了，像希腊几何学家欧几里得（约300 BC）、阿基米德（约287–212 BC）及阿波罗尼奥斯（约262–190 BC）^[2]。阿基米德也引进了无穷小量的使用，不过最早是用在面积及体积上的研究，而不是在导数及切线上，参考阿基米德使用的无穷小量（英语：Archimedes' use of infinitesimals）。

在印度数学家（英语：Indian mathematics）的研究中有看到用无穷小量来探讨量的变化，最早也许可以推到公元500年，当时天文学家及数学家阿耶波多用无穷小量来研究月球轨道^[3]。在印度数学家婆什迦罗第二（1114–1185）时，用无穷小量来计算量变化的研究有显著的进展，也有人提到^[4]在他的著作中已提到许多微分学的重要概念，例如罗尔定理^[5]。

伊斯兰数学家纳色阿尔图斯（英语：Sharaf al-Dīn al-Tūsī）（1135年–1213年）在其著作《Treatise on Equations》中说明了部分三次方程有解的条件，是透过找适当三次多项式的最大值来求得。他证明了三次多项式 $a x 2 — x 3$ 的最大值出现在 $x = 2 a /3$ ，并且得到结论：方程式 $a x 2 — x 3 = c$ 在 $c = 4 a 3 /27$ 时恰有一正值的解，若 $0 < c < 4 a 3 /27$ 会有二个正值的解^[6]。科学历史学家Roshdi Rashed（英语：Roshdi Rashed）^[7]认为阿尔图斯一定是用到了三次多项式的导数才得到此一结果。不过也有其他学者质疑Rashed的想法，他们认为Rashed也可能用了其他不用导数概念的作法^[6]。

普遍认为近代微积分的发展是因为艾萨克·牛顿（1643年–1727年）及戈特弗里德·莱布尼茨（1646年–1716年）同时但独立个别的研究^[8]，并且整合了有关微分及导数的作法。不过其中关键的概念（也是后来认定微积分是由他们两人创始的原因）是结合微分以及积分的微积分基本定理^[9]，这也让以往计算面积及体积，自从海什木（Alhazen）以来没有大幅进步的的方式变的过时^[10]。有关牛顿和莱布尼茨在微分上的想法，都是以早期数学家的贡献为基础，例如皮埃尔·德·费马（1607年-1665年）、伊萨克·巴罗（1630年–1677年）、勒内·笛卡尔（1596年–1650年）、克里斯蒂安·惠更斯（1629年–1695年）、布莱兹·帕斯卡（1623年–1662年）及约翰·沃利斯 (1616年–1703年）。有关费马的影响，牛顿曾在一封信中提到：“我从费马画切线的方式得到有关（通量）方法的暗示，将其用在抽象的方程……，我扩展了这个概念（directly and invertedly, I made it general.）^[11]。一般会将导数早期的发展归功于伊萨克·巴罗^[12]，不过牛顿和莱布尼茨仍在微分学的历史上有重要的贡献，其中也包括了牛顿将微分用在理论物理学中，而莱布尼茨发展的符号到现今仍在普遍使用。

自从17世纪起，许多数学家都对微分学有所贡献。在19世纪时，在奥古斯丁·路易·柯西（1789年–1857年）、波恩哈德·黎曼（1826年–1866年）及卡尔·魏尔斯特拉斯（1815年–1897年）等数学家的贡献下，微分学已更加的严谨。微分学也在此一时期扩展到欧几里得空间及复平面。

微分的应用

最佳化

若 $f$ 是在 $ℝ$ （或是其他开区间）内的可微函数，而 $x$ 是 $f$ 有局部最小值或是局部最大值的位置，则 $f$ 在 $x$ 处的导数为零。满足 $f' (x) = 0$ 的点称为临界点或是驻点（则 $f$ 在 $x$ 处的值称为临界值（英语：critical value））。若 $f$ 没有处处可微的特性，则 $f$ 不可微的点也称为临界点。

若 $f$ 是二次可微，则 $f$ 的临界点 $x$ 可以用 $f$ 在 $x$ 的二次导数来分析：

若二次导数为正，则 $x$ 是局部最小值
若二次导数为负，则 $x$ 是局部最大值
若二次导数为零，则 $x$ 可能是局部最小值、是局部最大值，也可能都不是（例如， $f (x) = x 3$ 在 $x = 0$ 处为临界点，但不是局部最小值也不是局部最大值，而 $f (x) = \pm x 4$ 在 $x = 0$ 处为临界点，分别是局部最小值及局部最大值）

上述作法称为二次导数测试（英语：second derivative test）。一次导数测试（英语：first derivative test）是另一种分析方式，考虑 $f'$ 在临界点前后的符号变化。

取导数，并且求解临界点是要找局部最小值或最大值的最简单作法，常应用在最优化中。根据极值定理，连续函数在闭区间内至少会有一次局部最小值及局部最大值。若函数可微，其局部最小值及局部最大值只会出现在临界点或是端点上。

取局部最小值及局部最大值也可以在函数图形的绘制上：只要找到可微分函数的局部最小值、局部最大值以及位，可以根据观察函数在各临界点之间的趋势来绘制简图。

在高维度的空间中，标量函数的临界点是其梯度为0的点。仍然可以用二次导数测试来分析临界点，作法是考虑函数在临界点上二阶导数形成海森矩阵的特征值。若所有特征值都为正，此点为局部最小值；若所有特征值都为负，此点为局部最大值；若部分为正，部分为负，表示临界点为鞍点；不过若有部分特征值为零，则无法以此方式判断。

变分法

最佳化问题的一个例子是：找到在一曲面上，通过曲面上二点的最短路径。若是在平面上，其最短路径是直线。不过若曲面是较复杂的形状（例如蛋形），最短路问题的解就不是那么直观了，此路径称为测地线，而这也是最佳化问题中最简单的问题之一。另一个例子是：找到可以填充空间中封闭曲线的最小面积曲面，此曲面称为极小曲面，也可以透过变分法求得。

物理

微分在物理学上格外重要：许多物理的现象都是用有关微分的方程式来描述，这类方程称为微分方程。物理学格外关注物理量随时间的变化，而时间导数是物理量随时间的变化率，是许多重要概念精准定义的基础。尤其在牛顿力学中，很重视一物体位置的时间导数：

速度是一物体位移（相对于时间）的微分。
加速度是一物体速度（相对于时间）的微分，也就是位移（相对于时间）的二阶微分。

例如：若物体在一直线上的位置可以用下式表示

x(t)=-16t^{2}+16t+32,\,\!

则其速度为

{\dot {x}}(t)=x'(t)=-32t+16,\,\!

而加速度为

{\ddot {x}}(t)=x''(t)=-32,\,\!

此时加速度已为定值。

微分方程

微分方程是指一函数和其微分之间的关系。常微分方程会描述单变数函数和其微分之间的关系。而偏微分方程则是多变数函数和其偏微分之间的关系。在自然科学、数学建模，甚至是数学领域中都常常会出现微分方程。例如，牛顿第二定律描述力和加速度的关系，可以表示为以下的常微分方程

F(t)=m{\frac {d^{2}x}{dt^{2}}}.

一维空间下的热传导方程式描述热在一杆状物上如何传递，其偏微分方程如下

{\frac {\partial u}{\partial t}}=\alpha {\frac {\partial ^{2}u}{\partial x^{2}}}.

此处 $u (x, t)$ 为杆状物时间 $t$ 时，在位置 $x$ 的温度，而 $α$ 为一常数，和热在杆状物上传递的速度成正比。

均值定理

均值定理：对于每个可微分函数

f:[a,b]\to \mathbb {R}

（

a<b

），存在

c\in (a,b)

使得

f'(c)={\tfrac {f(b)-f(a)}{b-a}}

.

均值定理提供了函数的导数和其原始值之间的关系。若 $f (x)$ 是实值函数，而 $a$ 和 $b$ 是实数，且 $a < b$ ，则根据均值定理（配合少许的假设），两点 $(a, f (a))$ 和 $(b, f (b))$ 之间的斜率会等于在 $a$ 和 $b$ 中间某一点 $c$ 的切线斜率。换句话说

f'(c)={\frac {f(b)-f(a)}{b-a}}.

实际上，均值定理是以其导数的方式来控制一个函数。例如，假设 $f$ 有导数，在每一点均为0，这表示其每一点的切线都是水平线，因此其函数应该也就是水平线。均值定理证明这是对的： $f$ 图上二点之间的斜率必须等于 $f$ 中的某一条切线。而所有的切线斜率都是0，因此从函数上任二点之的直线斜率也是0。这表示函数不会上升也不会下降，因此是水平线。若是导数的条件比较复杂，所产生的原函数资讯会比较不准确，但仍然有用。

泰勒多项式及泰勒级数

一函数的某一点的微分是对该点附近最佳的线性近似，不过这和实际的函数可能有很大的差异。改善近似的一个方式就是进行二次近似。也就是说，实值函数 $f (x)$ 在 $x 0$ 点的线性化是线性多项式 $a + b (x - x 0)$ ，若考虑一个二次多项式 $a + b (x - x 0) + c (x - x 0) 2$ ，可能会有更好的近似结果。若二次多项式改为三次多项式 $a + b (x - x 0) + c (x - x 0) 2 + d (x - x 0) 3$ ，近似效果会更好一些，此概念可以扩展到任意多次的高次多项式。针对一个多项式，都应该会有一个最佳的系数 $a$ 、 $b$ 、 $c$ 、 $d$ ……的组合，让近似的效果最好。

在 $x 0$ 的邻域，对 $a$ 来说，最理想的数值一定是 $f (x 0)$ ，对 $b$ 来说，最理想的数值一定是 $f' (x 0)$ ，对For $c$ 、 $d$ 及更高阶的系数来说，其系数最理想的数值是由 $f$ 更高阶的导数决定。 $c$ 最理想的数值一定是 $f'' (x 0) / 2$ ，and $d$ 最理想的数值一定是 $f''' (x 0) / 3!$ 。利用这些系数，可以得到 $f$ 的泰勒多项式。 $d$ 次的泰勒多项式是对 $f$ 可以有最佳近似的 $d$ 次多项式，其系数可以用上述公式推广而得。泰勒公式提供近似程度的精确范围。若函数 $f$ 是次数小于等于 $d$ 的多项式。则此函数的 $d$ 次泰勒多项式即为函数 $f$ 。

泰勒多项式的极限是无穷级数，称为泰勒级数。多半来说泰勒级数是原函数非常理想的近似。一函数若都各点等于其泰勒级数，称为解析函数。若函数有不连续点或是斜率不连续的尖角，此函数不会是解析函数，不过相反的，存在一些函数是光滑函数（无穷阶可导的函数），却不是解析函数（非解析的光滑函数（英语：Non-analytic_smooth_function））。

隐函数定理

有些几何图形（例如圆）无法用函数图形来表示。例如若 $f (x, y) = x 2 + y 2 - 1$ ，其圆即为所有使 $f (x, y) = 0$ 的点 $(x, y)$ 的集合。这个集合称为 $f$ 的零集。这和 $f$ 本身的图形（抛物面）不同。隐函数定理可以将 $f (x, y) = 0$ 之类的关系转换为函数。其中提到，若 $f$ 是连续可微函数， $f$ 的零集中大部分都可以表示为函数图形“粘贴”的组合。零集上的个点是否满足上述条件，可以用一个和 $f$ 微分有关的方式来确认。例如圆可以表示成二个函数图形± ${\sqrt {{1}-{{x}^{2}}}}$ “粘贴”后的结果。圆上除了(−1, 0)和(1, 0)二点之外，在其余每一个点的邻域上，上述二个函数中都有一个的图形和圆的图形类似。（上述二个函数其实刚好也通过(−1, 0)和(1, 0)，不过这不是隐函数定理中提到的内容）

隐函数定理和反函数定理有密切的关系。反函数定理提到一函数在一点的开区域内具有反函数的充分条件。

注释

^ 另一个分支则是积分学，探讨曲线下的面积

参见

参考资料

^ "Integral Calculus - Definition of Integral calculus by Merriam-Webster". www.merriam-webster.com. [2018-05-01]. （原始内容存档于2021-11-22）（英语）.
^ ，可参考《几何原本》、阿基米德重写本（英语：Archimedes Palimpsest）及约翰·J·奥康纳; 埃德蒙·F·罗伯逊（英语：Edmund F. Robertson）, Apollonius of Perga, MacTutor数学史档案（英语）
^ 约翰·J·奥康纳; 埃德蒙·F·罗伯逊（英语：Edmund F. Robertson）, Aryabhata the Elder, MacTutor数学史档案（英语）
^ Ian G. Pearce. Bhaskaracharya II. （页面存档备份，存于互联网档案馆）
^ Broadbent, T. A. A.; Kline, M. Reviewed work(s): The History of Ancient Indian Mathematics by C. N. Srinivasiengar. The Mathematical Gazette. October 1968, 52 (381): 307–8. JSTOR 3614212. doi:10.2307/3614212.
^ ^6.0 ^6.1 J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
^ Cited by J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
^ 牛顿在1666年开始此研究，莱布尼茨在1676年开始。但是莱布尼茨在1684年发表第一篇相关的论文，在牛顿1693年的第一篇论文之前。有可能莱布尼茨看过牛顿在1673年或1676年研究的草稿，也有可能是牛顿用了莱布尼茨的研究来改进他自己的论文。最后造成了牛顿和莱布尼茨在微积分上的争议（英语：Newton v. Leibniz calculus controversy），内容就是谁才是第一个创建微积分的人，这造成18世纪初期的数学家群体中的震撼
^ 此定理限制较多的版本以往已由詹姆斯·格雷果里（1638年–1675年），而皮埃尔·德·费马（1601年–1665）的著作中也有提到一些关键的例子，不过这仍是具有纪念性的成就
^ Victor J. Katz (1995), "Ideas of Calculus in Islam and India", Mathematics Magazine 68 (3): 163-174 [165-9 & 173-4]
^ Sabra, A I. Theories of Light: From Descartes to Newton. Cambridge University Press. 1981: 144. ISBN 978-0521284363.
^ Eves, H. (1990).

J. Edwards. Differential Calculus. London: MacMillan and Co. 1892 [2018-07-18]. （原始内容存档于2019-05-21）.

[1] 另一个分支则是积分学，探讨曲线下的面积

[2] "Integral Calculus - Definition of Integral calculus by Merriam-Webster". www.merriam-webster.com. [2018-05-01]. （原始内容存档于2021-11-22）（英语）.

[3] ，可参考《几何原本》、阿基米德重写本（英语：Archimedes Palimpsest）及约翰·J·奥康纳; 埃德蒙·F·罗伯逊（英语：Edmund F. Robertson）, Apollonius of Perga, MacTutor数学史档案（英语）

[4] 约翰·J·奥康纳; 埃德蒙·F·罗伯逊（英语：Edmund F. Robertson）, Aryabhata the Elder, MacTutor数学史档案（英语）

[5] Ian G. Pearce. Bhaskaracharya II. （页面存档备份，存于互联网档案馆）

[6] Broadbent, T. A. A.; Kline, M. Reviewed work(s): The History of Ancient Indian Mathematics by C. N. Srinivasiengar. The Mathematical Gazette. October 1968, 52 (381): 307–8. JSTOR 3614212. doi:10.2307/3614212.

[#1-7] 6.0 ^6.1 J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.

[8] Cited by J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.

[9] 牛顿在1666年开始此研究，莱布尼茨在1676年开始。但是莱布尼茨在1684年发表第一篇相关的论文，在牛顿1693年的第一篇论文之前。有可能莱布尼茨看过牛顿在1673年或1676年研究的草稿，也有可能是牛顿用了莱布尼茨的研究来改进他自己的论文。最后造成了牛顿和莱布尼茨在微积分上的争议（英语：Newton v. Leibniz calculus controversy），内容就是谁才是第一个创建微积分的人，这造成18世纪初期的数学家群体中的震撼

[10] 此定理限制较多的版本以往已由詹姆斯·格雷果里（1638年–1675年），而皮埃尔·德·费马（1601年–1665）的著作中也有提到一些关键的例子，不过这仍是具有纪念性的成就

[Katz-11] Victor J. Katz (1995), "Ideas of Calculus in Islam and India", Mathematics Magazine 68 (3): 163-174 [165-9 & 173-4]

[Sabra-12] Sabra, A I. Theories of Light: From Descartes to Newton. Cambridge University Press. 1981: 144. ISBN 978-0521284363.

[13] Eves, H. (1990).

[注 1]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]