微分学

微分学(英语:Differential calculus)是微积分学的一部分,是通过导数微分来研究曲线斜率加速度最大值最小值的一门学科,也是探讨特定数量变化速率的学科。微分学是微积分的二个主要分支之一[注 1][1]

函数的图(以黑色线表示)以及函数的切线(以红色直线表示)。切线的斜率即为函数在该位置的导数

微分学主要研究的主题是函数导数、相关的标示方式(例如微分)以及其应用。函数在特定点的导数可以说明函数在此输入值附近的变化率。寻找导数的过程即为微分。若以图示表示,函数在某一点的微分是函数图形在那一点的切线斜率(前提是在那一点的导数存在而且有定义)。针对单实数变数的实值函数英语Real-valued function而言,函数在某一点的导数也就可以决定在那一点最佳的线性近似。微分和积分的关系可以由微积分基本定理来说明,此定理说明微分是积分的逆运算。

几乎所有量化的学科中都有微分的应用。例如在物理学中,运动物体其位移对时间的导数即为其速度,速度对时间的导数就是加速度、物体动量对时间的导数即为物体所受的力,重新整理后可以得到牛顿第二运动定律化学反应化学反应速率也是导数。在运筹学中,会透过导数决定在运输或是设计上最有效率的作法。

导数常用来找函数的极值。含有微分项的方程式称为微分方程,是自然现象英语Natural phenomenon描述的基础。微分以及其广义概念出现在许多数学领域中,例如复分析泛函分析微分几何测度抽象代数

导数

 
(x,f(x))处的切线
 
一个可微函数在不同位置的导数

假设 y实数,而且yx函数,也就是说,针对每一个x,都有一个对应的y。两者的关系可以表示为y = f(x)。若f(x)是直线的方程式(称为一次方程),则会存在两个实数mb使得y = mx + b。在这个“斜率-截距式”中,m斜率,可以用下式来求得:

 

其中符号Δ(是希腊大写字母Δ)表示“变化”。以下的式子会成立:Δy = m Δx.

一般的函数不是直线,因此没有斜率。在几何上来看,函数fx = a的导数就是函数fa切线的斜率(如图)。常会表示为f ′(a)dy/dx|x = a。因为导数是fa点线性近似的斜率,因此导数(以及函数fa点的值)是函数fa点附近最佳的线性化近似。

若在函数f定义域中的每一点a都有导数,则存在一函数可以将每一点a对应到函数fa点的导数。例如,若函数f(x) = x2,则其导数函数f ′(x) = dy/dx = 2x

另一个有关的表示法是函数的微分。若xy是实数变数,函数fx点的导数为函数fx点切线的斜率。因为f的引数及输出都是标量,因此f的导数也是实数。若xy是向量,则f图形的最佳线性近似会和函数f在不同方向的变化有关。找到在单一方向的最佳近似,也就决定了偏微分,一般会表示为y/x。若找到了函数f在所有方向的线性化近似,则称为全微分

微分的历史

若以切线来看,微分的概念很早以前就出现了,像希腊几何学家欧几里得(约300 BC)、阿基米德(约287–212 BC)及阿波罗尼奥斯(约262–190 BC)[2]阿基米德也引进了无穷小量的使用,不过最早是用在面积及体积上的研究,而不是在导数及切线上,参考阿基米德使用的无穷小量英语Archimedes' use of infinitesimals

印度数学家英语Indian mathematics的研究中有看到用无穷小量来探讨量的变化,最早也许可以推到公元500年,当时天文学家及数学家阿耶波多用无穷小量来研究月球轨道[3]。在印度数学家婆什迦罗第二(1114–1185)时,用无穷小量来计算量变化的研究有显著的进展,也有人提到[4]在他的著作中已提到许多微分学的重要概念,例如罗尔定理[5]

伊斯兰数学家纳色阿尔图斯英语Sharaf al-Dīn al-Tūsī(1135年–1213年)在其著作《Treatise on Equations》中说明了部分三次方程有解的条件,是透过找适当三次多项式的最大值来求得。他证明了三次多项式 a x2 — x3的最大值出现在x = 2a/3,并且得到结论:方程式 a x2x3 = cc = 4 a3/27时恰有一正值的解,若0 < c < 4 a3/27会有二个正值的解[6]。科学历史学家Roshdi Rashed英语Roshdi Rashed[7]认为阿尔图斯一定是用到了三次多项式的导数才得到此一结果。不过也有其他学者质疑Rashed的想法,他们认为Rashed也可能用了其他不用导数概念的作法[6]

普遍认为近代微积分的发展是因为艾萨克·牛顿(1643年–1727年)及戈特弗里德·莱布尼茨(1646年–1716年)同时但独立个别的研究[8],并且整合了有关微分及导数的作法。不过其中关键的概念(也是后来认定微积分是由他们两人创始的原因)是结合微分以及积分的微积分基本定理[9],这也让以往计算面积及体积,自从海什木(Alhazen)以来没有大幅进步的的方式变的过时[10]。有关牛顿和莱布尼茨在微分上的想法,都是以早期数学家的贡献为基础,例如皮埃尔·德·费马(1607年-1665年)、伊萨克·巴罗(1630年–1677年)、勒内·笛卡尔(1596年–1650年)、克里斯蒂安·惠更斯(1629年–1695年)、布莱兹·帕斯卡(1623年–1662年)及约翰·沃利斯 (1616年–1703年)。有关费马的影响,牛顿曾在一封信中提到:“我从费马画切线的方式得到有关(通量)方法的暗示,将其用在抽象的方程……,我扩展了这个概念(directly and invertedly, I made it general.)[11]。一般会将导数早期的发展归功于伊萨克·巴罗[12],不过牛顿和莱布尼茨仍在微分学的历史上有重要的贡献,其中也包括了牛顿将微分用在理论物理学中,而莱布尼茨发展的符号到现今仍在普遍使用。

自从17世纪起,许多数学家都对微分学有所贡献。在19世纪时,在奥古斯丁·路易·柯西(1789年–1857年)、波恩哈德·黎曼(1826年–1866年)及卡尔·魏尔斯特拉斯(1815年–1897年)等数学家的贡献下,微分学已更加的严谨。微分学也在此一时期扩展到欧几里得空间复平面

微分的应用

最佳化

f是在(或是其他开区间)内的可微函数,而xf有局部最小值或是局部最大值的位置,则fx处的导数为零。满足f'(x) = 0的点称为临界点或是驻点(则fx处的值称为临界值英语critical value)。若f没有处处可微的特性,则f不可微的点也称为临界点。

f是二次可微,则f的临界点x可以用fx的二次导数来分析:

  • 若二次导数为正,则x是局部最小值
  • 若二次导数为负,则x是局部最大值
  • 若二次导数为零,则x可能是局部最小值、是局部最大值,也可能都不是(例如,f(x) = x3x = 0处为临界点,但不是局部最小值也不是局部最大值,而 f(x) = ± x4x = 0处为临界点,分别是局部最小值及局部最大值)

上述作法称为二次导数测试英语second derivative test一次导数测试英语first derivative test是另一种分析方式,考虑f'在临界点前后的符号变化。

取导数,并且求解临界点是要找局部最小值或最大值的最简单作法,常应用在最优化中。根据极值定理,连续函数在闭区间内至少会有一次局部最小值及局部最大值。若函数可微,其局部最小值及局部最大值只会出现在临界点或是端点上。

取局部最小值及局部最大值也可以在函数图形的绘制上:只要找到可微分函数的局部最小值、局部最大值以及位,可以根据观察函数在各临界点之间的趋势来绘制简图。

在高维度的空间中,标量函数的临界点是其梯度为0的点。仍然可以用二次导数测试来分析临界点,作法是考虑函数在临界点上二阶导数形成海森矩阵特征值。若所有特征值都为正,此点为局部最小值;若所有特征值都为负,此点为局部最大值;若部分为正,部分为负,表示临界点为鞍点;不过若有部分特征值为零,则无法以此方式判断。

变分法

最佳化问题的一个例子是:找到在一曲面上,通过曲面上二点的最短路径。若是在平面上,其最短路径是直线。不过若曲面是较复杂的形状(例如蛋形),最短路问题的解就不是那么直观了,此路径称为测地线,而这也是最佳化问题中最简单的问题之一。另一个例子是:找到可以填充空间中封闭曲线的最小面积曲面,此曲面称为极小曲面,也可以透过变分法求得。

物理

微分在物理学上格外重要:许多物理的现象都是用有关微分的方程式来描述,这类方程称为微分方程。物理学格外关注物理量随时间的变化,而时间导数是物理量随时间的变化率,是许多重要概念精准定义的基础。尤其在牛顿力学中,很重视一物体位置的时间导数:

  • 速度是一物体位移(相对于时间)的微分。
  • 加速度是一物体速度(相对于时间)的微分,也就是位移(相对于时间)的二阶微分。

例如:若物体在一直线上的位置可以用下式表示

 

则其速度为

 

而加速度为

 

此时加速度已为定值。

微分方程

微分方程是指一函数和其微分之间的关系。常微分方程会描述单变数函数和其微分之间的关系。而偏微分方程则是多变数函数和其偏微分之间的关系。在自然科学、数学建模,甚至是数学领域中都常常会出现微分方程。例如,牛顿第二定律描述力和加速度的关系,可以表示为以下的常微分方程

 

一维空间下的热传导方程式描述热在一杆状物上如何传递,其偏微分方程如下

 

此处u(x,t)为杆状物时间t时,在位置x的温度,而α为一常数,和热在杆状物上传递的速度成正比。

均值定理

 
均值定理:对于每个可微分函数  ),存在 使得 .

均值定理提供了函数的导数和其原始值之间的关系。若f(x)是实值函数,而ab是实数,且a < b,则根据均值定理(配合少许的假设),两点(a, f(a))(b, f(b))之间的斜率会等于在ab中间某一点c的切线斜率。换句话说

 

实际上,均值定理是以其导数的方式来控制一个函数。例如,假设f有导数,在每一点均为0,这表示其每一点的切线都是水平线,因此其函数应该也就是水平线。均值定理证明这是对的:f图上二点之间的斜率必须等于f中的某一条切线。而所有的切线斜率都是0,因此从函数上任二点之的直线斜率也是0。这表示函数不会上升也不会下降,因此是水平线。若是导数的条件比较复杂,所产生的原函数资讯会比较不准确,但仍然有用。

泰勒多项式及泰勒级数

一函数的某一点的微分是对该点附近最佳的线性近似,不过这和实际的函数可能有很大的差异。改善近似的一个方式就是进行二次近似。也就是说,实值函数f(x)x0点的线性化是线性多项式a + b(xx0),若考虑一个二次多项式a + b(xx0) + c(xx0)2,可能会有更好的近似结果。若二次多项式改为三次多项式a + b(xx0) + c(xx0)2 + d(xx0)3,近似效果会更好一些,此概念可以扩展到任意多次的高次多项式。针对一个多项式,都应该会有一个最佳的系数abcd……的组合,让近似的效果最好。

x0邻域,对a来说,最理想的数值一定是f(x0),对b来说,最理想的数值一定是f'(x0),对For cd及更高阶的系数来说,其系数最理想的数值是由f更高阶的导数决定。c最理想的数值一定是f''(x0)/2,and d最理想的数值一定是f'''(x0)/3!。利用这些系数,可以得到f泰勒多项式d次的泰勒多项式是对f可以有最佳近似的d次多项式,其系数可以用上述公式推广而得。泰勒公式提供近似程度的精确范围。若函数f是次数小于等于d的多项式。则此函数的d次泰勒多项式即为函数f

泰勒多项式的极限是无穷级数,称为泰勒级数。多半来说泰勒级数是原函数非常理想的近似。一函数若都各点等于其泰勒级数,称为解析函数。若函数有不连续点或是斜率不连续的尖角,此函数不会是解析函数,不过相反的,存在一些函数是光滑函数(无穷阶可导的函数),却不是解析函数(非解析的光滑函数英语Non-analytic_smooth_function)。

隐函数定理

有些几何图形(例如)无法用函数图形来表示。例如若f(x, y) = x2 + y2 − 1,其圆即为所有使f(x, y) = 0的点 (x, y)的集合。这个集合称为f的零集。这和f本身的图形(抛物面)不同。隐函数定理可以将f(x, y) = 0之类的关系转换为函数。其中提到,若f连续可微函数f的零集中大部分都可以表示为函数图形“粘贴”的组合。零集上的个点是否满足上述条件,可以用一个和f微分有关的方式来确认。例如圆可以表示成二个函数图形± “粘贴”后的结果。圆上除了(−1, 0)(1, 0)二点之外,在其余每一个点的邻域上,上述二个函数中都有一个的图形和圆的图形类似。(上述二个函数其实刚好也通过(−1, 0)(1, 0),不过这不是隐函数定理中提到的内容)

隐函数定理和反函数定理有密切的关系。反函数定理提到一函数在一点的开区域内具有反函数的充分条件。


注释

  1. ^ 另一个分支则是积分学,探讨曲线下的面积

参见

参考资料

  1. ^ "Integral Calculus - Definition of Integral calculus by Merriam-Webster". www.merriam-webster.com. [2018-05-01]. (原始内容存档于2021-11-22) (英语). 
  2. ^ ,可参考《几何原本》、阿基米德重写本英语Archimedes Palimpsest约翰·J·奥康纳; 埃德蒙·F·罗伯逊英语Edmund F. Robertson, Apollonius of Perga, MacTutor数学史档案 (英语) 
  3. ^ 约翰·J·奥康纳; 埃德蒙·F·罗伯逊英语Edmund F. Robertson, Aryabhata the Elder, MacTutor数学史档案 (英语) 
  4. ^ Ian G. Pearce. Bhaskaracharya II.页面存档备份,存于互联网档案馆
  5. ^ Broadbent, T. A. A.; Kline, M. Reviewed work(s): The History of Ancient Indian Mathematics by C. N. Srinivasiengar. The Mathematical Gazette. October 1968, 52 (381): 307–8. JSTOR 3614212. doi:10.2307/3614212. 
  6. ^ 6.0 6.1 J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
  7. ^ Cited by J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
  8. ^ 牛顿在1666年开始此研究,莱布尼茨在1676年开始。但是莱布尼茨在1684年发表第一篇相关的论文,在牛顿1693年的第一篇论文之前。有可能莱布尼茨看过牛顿在1673年或1676年研究的草稿,也有可能是牛顿用了莱布尼茨的研究来改进他自己的论文。最后造成了牛顿和莱布尼茨在微积分上的争议英语Newton v. Leibniz calculus controversy,内容就是谁才是第一个创建微积分的人,这造成18世纪初期的数学家群体中的震撼
  9. ^ 此定理限制较多的版本以往已由詹姆斯·格雷果里(1638年–1675年),而皮埃尔·德·费马(1601年–1665)的著作中也有提到一些关键的例子,不过这仍是具有纪念性的成就
  10. ^ Victor J. Katz (1995), "Ideas of Calculus in Islam and India", Mathematics Magazine 68 (3): 163-174 [165-9 & 173-4]
  11. ^ Sabra, A I. Theories of Light: From Descartes to Newton. Cambridge University Press. 1981: 144. ISBN 978-0521284363. 
  12. ^ Eves, H. (1990).