6.2 函数的斜率
如上所述,微分运算包括求“斜率”。从图6.2a所示的|x|的图像我们清楚地看到,函数在原点的斜率不唯一,因为这里有个折角。但除原点之外,在其他地方斜率是唯一确定的。|x|在原点处的这种麻烦被称为|x|在原点处不可微,换一种等价的说法,就是函数在此处不光滑。相反,如图6.2(b)所示的函数x2则是处处都有唯一定义的斜率,它因此也是处处可微的。
图6.2(c)所示的函数θ(x)比|x|更麻烦,因为θ(x)在原点(x=0)处有一“跳跃”。这时我们说θ(x)在原点不连续。相比之下,函数x2和|x|则是处处连续的。|x|在原点处的麻烦不是连续性失效而是可微性失效。(虽然连续性失效和可微性失效不是一回事,但二者实际上是彼此相关的概念,这一点我们一会儿就要谈到。)
图6.3 (a)x3和(b)x|x|(即如果x≥0,则x2;如果x<0,则-x2)的图像。
可以想象,这两种缺失哪一种都不会令欧拉高兴,它们似乎正是|x|和θ(x)不能成为“真”函数的理由。现在我们来考虑图6.3所示的两个函数。第一个是x3,它在任何意义下都称得上是函数;而第二个是x|x|,它在x非负区域的图像与x2相同,但在x为负的区域相当于-x2吗?乍一看,两个图像彼此非常相像且肯定“光滑”。二者不仅在原点的“斜率”有绝对完好的值,即都是零(这意味着曲线在此处有水平的斜率),而且在最直接的意义上也是处处“可微”的。但是,x|x|肯定不是令欧拉满意的那种“漂亮”函数。
x|x|的“错误”在于它在原点没有定义完好的曲率,曲率的概念也涉及微分计算。实际上,“曲率”是一种与所谓“二次导数”有关的运算,就是说要做两次微分。因此我们可以说,函数x|x|在原点不是二次可微的。我们将在§6.3来考虑二次和更高次导数。
图6.4 笛卡儿坐标系下的(a)y=f(x),(b)一阶导数u=f′(x)(=dy/dx)和(c)二阶导数f″(x)=d2y/dx2的图像。(注意,f(x)在f′(x)与x轴相交的地方有水平斜率,而在f″(x)与x轴相交的地方有拐点。)
为了开始正确理解这些事情,我们有必要看看微分运算实际是如何进行的。为此我们得知道如何来量度斜率。如图6.4所示,我画了一条比较有代表性的函数图像f(x)。图6.4(a)的曲线描述的是关系y=f(x)。正如通常笛卡儿坐标描述的那样,这里坐标y的值量度的是高度,x值量度的是水平位移。我曾说过,曲线在某一点p处的斜率就是该点的y坐标的增量除以x坐标的增量,相当于我们在p点作曲线的切线。(“切线”的数学定义取决于适当的求极限过程,但这不是我在这里要达到的目的。我希望读者能够明白我的这种直观描述足以满足我们当前的需要。[3])斜率的标准记法是dy/dx(读成“dy比dx”)。我们可将“dy”看成是y值沿曲线的一个非常小的增量,“dx”为相应的x值的小的增量。(这里,技术上严格说来都要求取“极限”,即是说这些小量应尽量减小到零。)
现在我们来考虑另一种曲线,即前述曲线上每一点p的斜率值关于x的曲线,见图6.4(b)。这里我们再次用笛卡儿表示法,但垂直轴表示的是dy/dx而非y。水平移位则仍由x量度。画出的这个函数通常称为f′(x),也可以写成dy/dx=f′(x)。我们把dy/dx称作y关于x的导数,把f′(x)称作f(x)的导数。[4]