微分与求导

1,136 阅读4分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

一些关于微分与导数的简单笔记。适合微积分的初学者食用。特别适合物理学生食用

微积分的初学者通常都会集中精力学习大量关于导数使用技巧和计算方法,毕竟大部分相关考题都与导数及其应用有关。然而,所谓微积分,指的是微分和积分,其实在大部分意义上,微分是一种比导数更加重要的概念(毕竟没有叫“导积分”嘛)。本文将简要讲解微分与导数的关系,以巩固各位同学的微积分知识。

何为函数?

函数,是英文单词function的翻译。我以为这一个词翻译的极好:

凡此变数中函彼变数者,则此为彼之函数。

——清代数学家李善兰《代数学》

这一翻译体现出了非常重要的逻辑内涵:函数描述的是两个量之间的关系(非常物理)。例如,

y=f(x)=x2y = f(x) = x^2

在没有这个函数的时候,xxyy是两个独立的变量,它们可以在各自的取值范围内快乐的玩耍。但是函数关系y=f(x)y = f(x)打破了这种自由,它规定了两个变量取值上的关系,yy的值必须是xx的平方。

何为微分?

微分的定义为infinitesimal change。这个词我不准备翻译,原因有二:

  1. 它精确地指出了微分的两个性质:极限小(infinitesimal)和变化量(change)。
  2. infinitesimal这个词读起来很有节奏感。

简单来说,大部分well-behaved(没有奇怪的性质的)变量都可以自由的变化,它的变化量趋向于0的极限,就是它的微分。因此,微分是一个普遍存在的概念,可以形象地理解为变量在跑动(变化)的时候留下的残影。这一理解非常有趣,因为牛顿将微积分称为“流数术”,想必也是对变量的变化有这种感性的理解。

dx=limΔx0Δxdx = \lim_{\Delta x \to 0}\Delta x

看起来好像我在说废话,其实要区分微分和以下两个量:

  1. 变化量Δx\Delta x,没有极限小,和微积分没啥关系。
  2. 小量dˉQd\hspace*{-0.08em}\bar{}\hspace*{0.1em}Q,仅仅是小量,并不是变化量。例如,极短时间内的吸热,其实QQ本身就表示传递的热量大小(能量的变化量),加一个划线的dˉd\hspace*{-0.08em}\bar{}\hspace*{0.1em}仅仅表示它很小。非微分的小量不满足微积分基本定理(因为不是变化量),例如耗散力做功与路径有关。

何为导数?

在函数出现之前,两个变量是独立的。但是,函数关系y=f(x)y = f(x)固定了两个变量的值之间的关系,那么这两个变量的微分之间是否有关系呢?在极限小的情况下,我们假设线性关系:

y=f(x)    dy=  ?  dxy = f(x) \implies dy = \;?\; dx

这个微分之间的关系即被定义为导数,将dxdx除到左侧:

?  =dydx=limΔx0ΔyΔx=limΔx0f(x+Δx)f(x)Δx?\;=\frac{dy}{dx} = \lim_{\Delta x\to 0}\frac{\Delta y}{\Delta x} = \lim_{\Delta x\to 0}\frac{f(x+\Delta x) - f(x)}{\Delta x}

同样,在多元微积分中,我们考虑多元函数y=f(x1,x2,,xn)y = f(x_1, x_2, \cdots, x_n)。这个函数固定了yynn个自变量值的关系,也同时提示我们它们的微分之间存在关系:

dy=  ?1  dx1+  ?2  dx2++  ?n  dxndy = \;?_1\; dx_1 + \;?_2\; dx_2+\cdots+\;?_n\; dx_n

如何求某一个问号?i?_i呢?自然的想法是使得其他的dxj=0dx_j = 0,然后因变量微分dydy除以自变量xix_i的微分dxidx_i。这组关系被定义为对某一个变量xix_i的偏导数:

?i  =yxi=dydxidxj=0,ij?_i\;=\frac{\partial y}{\partial x_i} = \frac{dy}{dx_i}\big|_{dx_j = 0, i\neq j}

如何运算?

根据上述讨论,我们可以明白微分的化简方式是对函数关系求导:

dy=d(f(x))=f(x)dxdy = d(f(x)) = f'(x)dx

这被称为一阶微分形式不变性,即微分永远是微分,只是换了变量。显然,因为常数不会变化,所以常数的微分永远等于0。

特别注意,这一形式不变性自动导出了求导的链式法则

y=f(u(x))    dy=f(u)du    dy=f(u)u(x)dx    dydx=f(u)u(x)y = f(u(x)) \implies dy = f'(u)du \implies dy = f'(u)u'(x)dx \implies \frac{dy}{dx} = f'(u)u'(x)

微分的运算法则与导数类似(因为导数的运算法则来自微分):

d(u±v)=du±dvd(uv)=udv+vdud(uv)=vduudvv2d(u\pm v) = du\pm dv\quad d(uv) = udv + vdu \quad d\big(\frac{u}{v}\big) = \frac{vdu-udv}{v^2}

比求导更强的是,求导必须要明确对什么自变量求导,而微分是普遍的。等式两侧的值处处相等,因此两侧的微分也处处相等。对于隐函数求导一类的问题,我们可以两边微分。例如:

x2+y2=r2    d(x2+y2)=d(r2)x^2+y^2 = r^2 \implies d(x^2 + y^2) = d(r^2)

右侧为常数,微分为0。左侧用一阶微分形式不变性求解微分,两者相除求得导数:

2xdx+2ydy=0    dydx=xy2xdx + 2ydy = 0 \implies \frac{dy}{dx} = -\frac{x}{y}