微分学
微分学(英语:Differential calculus)是微积分学的一部分,是通过导数和微分来研究曲线斜率、加速度、最大值和最小值的一门学科,也是探讨特定数量变化速率的学科。微分学是微积分的二个主要分支之一[注 1][1]。
微分学主要研究的主题是函数的导数、相关的标示方式(例如微分)以及其应用。函数在特定点的导数可以说明函数在此输入值附近的变化率。寻找导数的过程即为微分。若以图示表示,函数在某一点的微分是函数图形在那一点的切线斜率(前提是在那一点的导数存在而且有定义)。针对单实数变数的实值函数而言,函数在某一点的导数也就可以决定在那一点最佳的线性近似。微分和积分的关系可以由微积分基本定理来说明,此定理说明微分是积分的逆运算。
几乎所有量化的学科中都有微分的应用。例如在物理学中,运动物体其位移对时间的导数即为其速度,速度对时间的导数就是加速度、物体动量对时间的导数即为物体所受的力,重新整理后可以得到牛顿第二运动定律。化学反应的化学反应速率也是导数。在运筹学中,会透过导数决定在运输或是设计上最有效率的作法。
导数常用来找函数的极值。含有微分项的方程式称为微分方程,是自然现象描述的基础。微分以及其广义概念出现在许多数学领域中,例如复分析、泛函分析、微分几何、测度及抽象代数。
导数
假设 和y是实数,而且y是x的函数,也就是说,针对每一个x,都有一个对应的y。两者的关系可以表示为y = f(x)。若f(x)是直线的方程式(称为一次方程),则会存在两个实数m和b使得y = mx + b。在这个“斜率-截距式”中,m是斜率,可以用下式来求得:
其中符号Δ(是希腊大写字母Δ)表示“变化”。以下的式子会成立:Δy = m Δx.
一般的函数不是直线,因此没有斜率。在几何上来看,函数f在x = a的导数就是函数f在a点切线的斜率(如图)。常会表示为f ′(a) 或dy/dx|x = a。因为导数是f在a点线性近似的斜率,因此导数(以及函数f在a点的值)是函数f在a点附近最佳的线性化近似。
若在函数f定义域中的每一点a都有导数,则存在一函数可以将每一点a对应到函数f在a点的导数。例如,若函数f(x) = x2,则其导数函数f ′(x) = dy/dx = 2x。
另一个有关的表示法是函数的微分。若x和y是实数变数,函数f在x点的导数为函数f在x点切线的斜率。因为f的引数及输出都是标量,因此f的导数也是实数。若x和y是向量,则f图形的最佳线性近似会和函数f在不同方向的变化有关。找到在单一方向的最佳近似,也就决定了偏微分,一般会表示为∂y/∂x。若找到了函数f在所有方向的线性化近似,则称为全微分。
微分的历史
若以切线来看,微分的概念很早以前就出现了,像希腊几何学家欧几里得(约300 BC)、阿基米德(约287–212 BC)及阿波罗尼奥斯(约262–190 BC)[2]。阿基米德也引进了无穷小量的使用,不过最早是用在面积及体积上的研究,而不是在导数及切线上,参考阿基米德使用的无穷小量。
在印度数学家的研究中有看到用无穷小量来探讨量的变化,最早也许可以推到公元500年,当时天文学家及数学家阿耶波多用无穷小量来研究月球轨道[3]。在印度数学家婆什迦罗第二(1114–1185)时,用无穷小量来计算量变化的研究有显著的进展,也有人提到[4]在他的著作中已提到许多微分学的重要概念,例如罗尔定理[5]。
伊斯兰数学家纳色阿尔图斯(1135年–1213年)在其著作《Treatise on Equations》中说明了部分三次方程有解的条件,是透过找适当三次多项式的最大值来求得。他证明了三次多项式 a x2 — x3的最大值出现在x = 2a/3,并且得到结论:方程式 a x2 — x3 = c在c = 4 a3/27时恰有一正值的解,若0 < c < 4 a3/27会有二个正值的解[6]。科学历史学家Roshdi Rashed[7]认为阿尔图斯一定是用到了三次多项式的导数才得到此一结果。不过也有其他学者质疑Rashed的想法,他们认为Rashed也可能用了其他不用导数概念的作法[6]。
普遍认为近代微积分的发展是因为艾萨克·牛顿(1643年–1727年)及戈特弗里德·莱布尼茨(1646年–1716年)同时但独立个别的研究[8],并且整合了有关微分及导数的作法。不过其中关键的概念(也是后来认定微积分是由他们两人创始的原因)是结合微分以及积分的微积分基本定理[9],这也让以往计算面积及体积,自从海什木(Alhazen)以来没有大幅进步的的方式变的过时[10]。有关牛顿和莱布尼茨在微分上的想法,都是以早期数学家的贡献为基础,例如皮埃尔·德·费马(1607年-1665年)、伊萨克·巴罗(1630年–1677年)、勒内·笛卡尔(1596年–1650年)、克里斯蒂安·惠更斯(1629年–1695年)、布莱兹·帕斯卡(1623年–1662年)及约翰·沃利斯 (1616年–1703年)。有关费马的影响,牛顿曾在一封信中提到:“我从费马画切线的方式得到有关(通量)方法的暗示,将其用在抽象的方程……,我扩展了这个概念(directly and invertedly, I made it general.)[11]。一般会将导数早期的发展归功于伊萨克·巴罗[12],不过牛顿和莱布尼茨仍在微分学的历史上有重要的贡献,其中也包括了牛顿将微分用在理论物理学中,而莱布尼茨发展的符号到现今仍在普遍使用。
自从17世纪起,许多数学家都对微分学有所贡献。在19世纪时,在奥古斯丁·路易·柯西(1789年–1857年)、波恩哈德·黎曼(1826年–1866年)及卡尔·魏尔斯特拉斯(1815年–1897年)等数学家的贡献下,微分学已更加的严谨。微分学也在此一时期扩展到欧几里得空间及复平面。
微分的应用
最佳化
若f是在ℝ(或是其他开区间)内的可微函数,而x是f有局部最小值或是局部最大值的位置,则f在x处的导数为零。满足f'(x) = 0的点称为临界点或是驻点(则f在x处的值称为临界值)。若f没有处处可微的特性,则f不可微的点也称为临界点。
若f是二次可微,则f的临界点x可以用f在x的二次导数来分析:
- 若二次导数为正,则x是局部最小值
- 若二次导数为负,则x是局部最大值
- 若二次导数为零,则x可能是局部最小值、是局部最大值,也可能都不是(例如,f(x) = x3在x = 0处为临界点,但不是局部最小值也不是局部最大值,而 f(x) = ± x4在x = 0处为临界点,分别是局部最小值及局部最大值)
上述作法称为二次导数测试。一次导数测试是另一种分析方式,考虑f'在临界点前后的符号变化。
取导数,并且求解临界点是要找局部最小值或最大值的最简单作法,常应用在最优化中。根据极值定理,连续函数在闭区间内至少会有一次局部最小值及局部最大值。若函数可微,其局部最小值及局部最大值只会出现在临界点或是端点上。
取局部最小值及局部最大值也可以在函数图形的绘制上:只要找到可微分函数的局部最小值、局部最大值以及位,可以根据观察函数在各临界点之间的趋势来绘制简图。
在高维度的空间中,标量函数的临界点是其梯度为0的点。仍然可以用二次导数测试来分析临界点,作法是考虑函数在临界点上二阶导数形成海森矩阵的特征值。若所有特征值都为正,此点为局部最小值;若所有特征值都为负,此点为局部最大值;若部分为正,部分为负,表示临界点为鞍点;不过若有部分特征值为零,则无法以此方式判断。
变分法
最佳化问题的一个例子是:找到在一曲面上,通过曲面上二点的最短路径。若是在平面上,其最短路径是直线。不过若曲面是较复杂的形状(例如蛋形),最短路问题的解就不是那么直观了,此路径称为测地线,而这也是最佳化问题中最简单的问题之一。另一个例子是:找到可以填充空间中封闭曲线的最小面积曲面,此曲面称为极小曲面,也可以透过变分法求得。
物理
微分在物理学上格外重要:许多物理的现象都是用有关微分的方程式来描述,这类方程称为微分方程。物理学格外关注物理量随时间的变化,而时间导数是物理量随时间的变化率,是许多重要概念精准定义的基础。尤其在牛顿力学中,很重视一物体位置的时间导数:
例如:若物体在一直线上的位置可以用下式表示
则其速度为
而加速度为
此时加速度已为定值。
微分方程
微分方程是指一函数和其微分之间的关系。常微分方程会描述单变数函数和其微分之间的关系。而偏微分方程则是多变数函数和其偏微分之间的关系。在自然科学、数学建模,甚至是数学领域中都常常会出现微分方程。例如,牛顿第二定律描述力和加速度的关系,可以表示为以下的常微分方程
一维空间下的热传导方程式描述热在一杆状物上如何传递,其偏微分方程如下
此处u(x,t)为杆状物时间t时,在位置x的温度,而α为一常数,和热在杆状物上传递的速度成正比。
均值定理
均值定理提供了函数的导数和其原始值之间的关系。若f(x)是实值函数,而a 和b是实数,且a < b,则根据均值定理(配合少许的假设),两点(a, f(a))和(b, f(b))之间的斜率会等于在a和b中间某一点c的切线斜率。换句话说
实际上,均值定理是以其导数的方式来控制一个函数。例如,假设f有导数,在每一点均为0,这表示其每一点的切线都是水平线,因此其函数应该也就是水平线。均值定理证明这是对的:f图上二点之间的斜率必须等于f中的某一条切线。而所有的切线斜率都是0,因此从函数上任二点之的直线斜率也是0。这表示函数不会上升也不会下降,因此是水平线。若是导数的条件比较复杂,所产生的原函数资讯会比较不准确,但仍然有用。
泰勒多项式及泰勒级数
一函数的某一点的微分是对该点附近最佳的线性近似,不过这和实际的函数可能有很大的差异。改善近似的一个方式就是进行二次近似。也就是说,实值函数f(x)在x0点的线性化是线性多项式a + b(x − x0),若考虑一个二次多项式a + b(x − x0) + c(x − x0)2,可能会有更好的近似结果。若二次多项式改为三次多项式a + b(x − x0) + c(x − x0)2 + d(x − x0)3,近似效果会更好一些,此概念可以扩展到任意多次的高次多项式。针对一个多项式,都应该会有一个最佳的系数a、b、c、d……的组合,让近似的效果最好。
在x0的邻域,对a来说,最理想的数值一定是f(x0),对b来说,最理想的数值一定是f'(x0),对For c、d及更高阶的系数来说,其系数最理想的数值是由f更高阶的导数决定。c最理想的数值一定是f''(x0)/2,and d最理想的数值一定是f'''(x0)/3!。利用这些系数,可以得到f的泰勒多项式。d次的泰勒多项式是对f可以有最佳近似的d次多项式,其系数可以用上述公式推广而得。泰勒公式提供近似程度的精确范围。若函数f是次数小于等于d的多项式。则此函数的d次泰勒多项式即为函数f。
泰勒多项式的极限是无穷级数,称为泰勒级数。多半来说泰勒级数是原函数非常理想的近似。一函数若都各点等于其泰勒级数,称为解析函数。若函数有不连续点或是斜率不连续的尖角,此函数不会是解析函数,不过相反的,存在一些函数是光滑函数(无穷阶可导的函数),却不是解析函数(非解析的光滑函数)。
隐函数定理
有些几何图形(例如圆)无法用函数图形来表示。例如若f(x, y) = x2 + y2 − 1,其圆即为所有使f(x, y) = 0的点 (x, y)的集合。这个集合称为f的零集。这和f本身的图形(抛物面)不同。隐函数定理可以将f(x, y) = 0之类的关系转换为函数。其中提到,若f是连续可微函数,f的零集中大部分都可以表示为函数图形“粘贴”的组合。零集上的个点是否满足上述条件,可以用一个和f微分有关的方式来确认。例如圆可以表示成二个函数图形± “粘贴”后的结果。圆上除了(−1, 0)和(1, 0)二点之外,在其余每一个点的邻域上,上述二个函数中都有一个的图形和圆的图形类似。(上述二个函数其实刚好也通过(−1, 0)和(1, 0),不过这不是隐函数定理中提到的内容)
隐函数定理和反函数定理有密切的关系。反函数定理提到一函数在一点的开区域内具有反函数的充分条件。
注释
参见
参考资料
- ^ "Integral Calculus - Definition of Integral calculus by Merriam-Webster". www.merriam-webster.com. [2018-05-01]. (原始内容存档于2021-11-22) (英语).
- ^ ,可参考《几何原本》、阿基米德重写本及约翰·J·奥康纳; 埃德蒙·F·罗伯逊, Apollonius of Perga, MacTutor数学史档案 (英语)
- ^ 约翰·J·奥康纳; 埃德蒙·F·罗伯逊, Aryabhata the Elder, MacTutor数学史档案 (英语)
- ^ Ian G. Pearce. Bhaskaracharya II. (页面存档备份,存于互联网档案馆)
- ^ Broadbent, T. A. A.; Kline, M. Reviewed work(s): The History of Ancient Indian Mathematics by C. N. Srinivasiengar. The Mathematical Gazette. October 1968, 52 (381): 307–8. JSTOR 3614212. doi:10.2307/3614212.
- ^ 6.0 6.1 J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
- ^ Cited by J. L. Berggren (1990). "Innovation and Tradition in Sharaf al-Din al-Tusi's Muadalat", Journal of the American Oriental Society 110 (2), pp. 304-309.
- ^ 牛顿在1666年开始此研究,莱布尼茨在1676年开始。但是莱布尼茨在1684年发表第一篇相关的论文,在牛顿1693年的第一篇论文之前。有可能莱布尼茨看过牛顿在1673年或1676年研究的草稿,也有可能是牛顿用了莱布尼茨的研究来改进他自己的论文。最后造成了牛顿和莱布尼茨在微积分上的争议,内容就是谁才是第一个创建微积分的人,这造成18世纪初期的数学家群体中的震撼
- ^ 此定理限制较多的版本以往已由詹姆斯·格雷果里(1638年–1675年),而皮埃尔·德·费马(1601年–1665)的著作中也有提到一些关键的例子,不过这仍是具有纪念性的成就
- ^ Victor J. Katz (1995), "Ideas of Calculus in Islam and India", Mathematics Magazine 68 (3): 163-174 [165-9 & 173-4]
- ^ Sabra, A I. Theories of Light: From Descartes to Newton. Cambridge University Press. 1981: 144. ISBN 978-0521284363.
- ^ Eves, H. (1990).
- J. Edwards. Differential Calculus. London: MacMillan and Co. 1892 [2018-07-18]. (原始内容存档于2019-05-21).