数学物理 笔记

2021/8/17 数学物理

# SO(2) 的自由度

TODO: 什么是系统的自由度

我们继续以平面旋转群为例。平面旋转群的自由度 n=1n=1 ,这很好理解,用一个角度 θR\theta \in \mathbb{R} 就可以确定一个旋转。沿用前面的记号, SO(2)SO(2) 的实矩阵表达为:

ρ:RSO(2)θρ(θ)=[cosθsinθsinθcosθ]\begin{aligned} &\rho: \mathbb{R} \rightarrow SO(2) \\ &\theta \mapsto \rho(\theta)=\left[\begin{array}{cc}\cos \theta & -\sin \theta \\ \sin \theta & \cos \theta\end{array}\right] \end{aligned}

这个实矩阵空间的维度为 2×22 \times 2 ,故自由度也是 2×22 \times 2 。

SO(2)S O(2) 的复数表达为:

τ:R{eiθθR}ττ(θ)=eiθ\begin{aligned} &\boldsymbol{\tau}: \mathbb{R} \rightarrow\left\{e^{i \theta} \mid \theta \in \mathbb{R}\right\} \\ &\tau \mapsto \tau(\theta)=e^{i \theta} \end{aligned}

这个复平面的自由度为 2 。

实际上,无论那种表达,单自由度的角度 θ\theta 都构成了一个实数参数,而群同态 τ,ρ\tau, \rho 各自构成了参数曲线,嵌入到高维的实矩阵空间和复空间中。这两条参数曲线本身都是单自由度的,或者说和角度 θ\theta 一样都是 11 维的。

我们在前面反复研究 2×22 \times 2 自由度的实矩阵表达和 22 自由度的复平面,然而我们从来不关心在旋转群的表达集合之外的其它矩阵或者其它复数。其它的东西,有和没有都无所谓,和我们研究的对象没有关系。我们研究的对象,也就是那两条参数曲线,具有内蕴的维度,这个维度和谁去包含参数曲线是无关的。

这种内蕴几何的研究方式,是现代微分几何区别于古典微分几何的重要分水岭。在微分几何中,这种具有内蕴维度的几何体,称为流形(manifold)。 SO(2)SO(2) 在复平面上的表达,具有直观的几何意义,即单位圆(更切确说是把实数一圈圈绕在单位圆上)。而矩阵表达就没有那么直观了。它是一个微分流形,也是一个 Lie 群,是具有更大自由度的 Lie 群的一个子群。

### 点集拓扑:开集、拓扑、拓扑空间

集合 XX 上的子集族 τ\tau ,若满足以下三条拓扑公理,则称 τ\tau 中的元素为开集(X,τ)(X, \tau) 称为 XX 上的拓扑空间:

1. 平凡:,Xτ2. 任意并:iτ3. 有限交:i=1nτiτ,nN\begin{aligned} &1. 平凡:\quad \varnothing, X \in \tau \\ &2. 任意并:\bigcup_{i} \in \tau \\ &3. 有限交:\bigcap_{i=1}^{n} \tau_{i} \in \tau, n \in \mathbb{N} \end{aligned}

我们现在用 Rn\mathbb{R}^n 上的开区间来构造开集和拓扑空间。Rn\mathbb{R}^n 上一个开区间是一个集合

(a,b)={xRn,ai<xi<bi}(a, b)=\left\{x \in \mathbb{R}^{n}, a_{i}<x_{i}<b_{i}\right\}

直观理解为去掉了边界的 nn 维矩形。开区间之间的有限交,要么是空集 \varnothing ,要么仍然是开区间;开区间之间的任意并,要么是全集,要么是没有边界的集合

所谓边界,按照拓扑学的定义:令点 xx 在拓扑空间 XX 的子集 AA 中:xAXx \in A \subset X, 若存在开集 UU s.t. xUA,   则 称  xx \in U \subset A \mathrm{~, ~ 则 称 ~} x 是 AA 的内点,AA 是 xx 的邻域。我们可以理解为,不存在邻域的点是边界点,这些点构成了边界。

粗略地说,开区间具有单连通的拓扑性质,开区间中点都是内点,也都存在邻域。在数学分析中,极限收敛的判断往往是进入某个作为邻域(开集)的开区间,一旦进入就不再离开,这个进入过程也是拓扑性质的体现。

由开区间和开区间的并,加上空集和全集,这些放在一起作为开集,便构成了我们常用的拓扑空间,这个拓扑空间有助于建立起点集拓扑和几何直观之间的联系。

# 映射的连续性:数学分析的回顾

在学习拓扑学之前,数学分析基础的连续性是建立在 ϵδ\epsilon - \delta 语言上的。

ϵδ\epsilon - \delta 语言有一个隐含的概念,就是在 R\mathbb{R} 上用差的绝对值定义的距离: xx00|x - x_0| \geq 0 和 f(x)f(x0)0|f(x) - f(x_0)| \geq 0 。在序列收敛中,也借助了这个距离的结构 xx00|x - x_0| \rightarrow 0 。实际上,这里的距离构造了一个拓扑,而连续性是一个拓扑特性。

距离或者叫度量的概念是我们易于理解的。

集合 XX 上的度量 dd 是一个映射: d:X×XR+d: X \times X \rightarrow \mathbb{R}^{+}

1. 正定:xX,d(x,x)=0,xyd(x,y)>0\forall x \in X, d(x, x)=0, x \neq y \Rightarrow d(x, y)>0

2. 对称性:x,yX,d(x,y)=d(y,x)\quad \forall x, y \in X, d(x, y)=d(y, x)

3. 三角不等式:x,y,zX,d(x,z)d(x,y)+d(y,z)\quad \forall x, y, z \in X, d(x, z) \leq d(x, y)+d(y, z)

定义了度量的集合称为度量空间,而度量空间可以诱导出度量拓扑,构成拓扑空间。所以我们现在知道,过去数学分析中学习的 ϵδ\epsilon - \delta 语言上定义的连续性,实际上是按照我们熟知的绝对值定义的度量拓扑构造的。

绕开距离,直接用拓扑特性来描述连续性的方式如下:

若开集 VV 包含了 f(x0)f\left(x_{0}\right), 则存在包含了 x0x_{0} 的开集 UU ,使得 f(U)Vf(U) \subset V ,那么 ff 在 x0x_{0} 连续。

# 同胚、范畴论初步

若有单满映射 f:XYf: X \rightarrow Y ,且 f,f1f, f^{-1} 都是连续的,则称 ff 是一个同胚映射。当两个拓扑空间之间存在同胚映射,则称它们同胚(homeomorphism)。现在,我们终于回到了具有直观感受的橡皮球几何学,捏一下橡皮球相当于进行了一次同胚映射,把它从原来的样子变成了捏它的样子。

范畴论是现代数学的重要分支,广泛统一着不同领域的数学思想。从现代数学观点看,越早用范畴论的观点学习数学越好。拓扑学和范畴论的发展息息相关,下面我们介绍一点范畴论的基础知识。

一个范畴(category) CC 的定义包含:

对象(object)的集合 Obj(C)Obj(C)

对于 A,BObj(C)\exists A, B \in Obj(C) ,对象 AA 到对象 BB 有箭头(arrow)或者态射(morphism),态射的集合记为 Homc(A,B)Hom_c(A,B) 或 C(A,B)C(A,B)

将所有拓扑空间的集合记为 TopTop ,每一个具体的拓扑空间都视为对象。我们注意到拓扑空间之间的同胚关系是 TopTop 中的一个等价关系,满足范畴定义中态射的传递性。于是,以拓扑空间为对象,以同胚为态射,构成了拓扑范畴

Top= 拓扑空间;同胚Top = {拓扑空间;同胚}

范畴论重要的概念是函子(functor)。令 CC 和 DD 是两个范畴,函子 FF 作用于对象的方式类似于映射:

F:CDcCd=f(c)D\begin{aligned} &F: \mathcal{C} \rightarrow \mathcal{D} \\ &c \in \mathcal{C} \mapsto d=f(c) \in \mathcal{D} \end{aligned}

函子 FF 还可以作用于态射,把范畴 CC 中的态射对应到范畴 DD 中的态射。这又是一个抽象的概念。回到应用上,我们刚才有了拓扑范畴

Top= 拓扑空间;同胚Top = {拓扑空间;同胚}

还记得我们是在集合上定义拓扑空间的,而同胚也是在集合的映射上附加了双向连续的数学结构,于是我们还可以定义一个更泛化的集合范畴

Set= 集合;映射Set = {集合;映射}

那么,初步理解,函子 F:TopSetF: Top \rightarrow Set 是一个遗忘函子(forgetfull functor)

1. 它将拓扑空间 (X,τ)(X,\tau) (拓扑范畴中的对象)对应到它的集合 XX (集合范畴中的对象),遗忘了拓扑结构 τ\tau

2. 它将同胚(拓扑范畴中的态射)对应到映射(集合范畴中的态射),遗忘了同胚附加在映射上的连续性条件

# 拓扑流形

如果拓扑空间 MM 的任何两个不同点有不相交的邻域,则称它满足 T2T_2 分离公理(自然还有其它的分离公理,请参考点集拓扑教材),此刻 XX 称为 Hausdorff 空间。在 Hausdorff 空间中,一个序列不会收敛到两个以上的点,用数学分析的话说,收敛序列有唯一的极限点。

对于 Hausdorff 空间 MM ,若它的任何一点都有一个开邻域 UU ,且 UU 同胚于 Rn\mathbb{R}^n 。则称 MM 为 nn 维拓扑流形。注意 Rn\mathbb{R}^n 本身就是一个 nn 维拓扑流形。

以上的标准定义告诉我们几个事实:

1. 一个(拓扑)流形,处处具有唯一的维度。一条不与自身相交的曲线和一个圆都是 [公式] 维的(拓扑)流形,而天花板和上面垂下来的一条线构成的整体却不是(拓扑)流形。

2. 定义中用了任意点的开邻域,这表示讨论是局限在这一点局部的,只要这一点满足条件,是不必关心其它点的。这种局部化的处理,在微分几何中比比皆是。我们在数学分析中学习的到点的收敛性、函数在某一点的连续性、可微性,本质上都是局部化处理。

3. 与 [公式] 同胚,提示我们可以用 [公式] 中的自然基和自然坐标来表示流形上的点,使流形被坐标化。拓扑流形是有开覆盖的(还记得实变函数么?),后面我们会介绍坐标卡,它本质上是可以用坐标转换相互过渡的开覆盖。坐标转换的性质决定了流形的性质(相容性、多少次可微)。

4. 如果 [公式] 维流形 [公式] 作为拓扑空间有边界点,则边界点的集合记为 [公式] ,它构成一个 [公式] 维流形,这个概念将来在 Stokes 定理(统一任意维度按外微分的积分,一维就是微积分基本的 Newton-Leibniz 定理)以及同调-上同调(代数拓扑的后继课程)中非常重要。

# 微分流形

::: tips

微分几何。一维情况求导和微分的区别太微妙,不好看明白,放多维情况下就明白了。求导给出了切空间,而微分是切空间之间的线性变换。一维情况下切空间退化为直线,直线到直线的线性变换只差一个系数,所以看不清微分的含义

:::

如同数学分析中先研究连续性再研究可微性,在流形上,也是先由同胚(满足映射的连续性)得到拓扑流形,再给映射附加更强的坐标转换的相容性条件,得到微分流形。

复习一下前面的范畴学知识,函子 F:TopSetF: Top \rightarrow Set 是一个遗忘函子:

1. 它将拓扑空间 (X,τ)(X, \tau) (拓扑范畴中的对象)对应到它的集合 XX (集合范畴中的对象),遗忘了拓扑结构 τ\tau

2. 它将同胚(拓扑范畴中的态射)对应到映射(集合范畴中的态射),遗忘了同胚附加在映射上的连续性条件

那么类似地,函子 CmMMC^m M \rightarrow M 是一个遗忘函子:

1. 它将 mm 次可微的微分流形 CmMC^m M (mm 次可微的微分流形范畴中的对象)对应到它的拓扑流形 MM (拓扑流形范畴中的对象),遗忘了mm 次可微的微分结构

2. 它将 mm 次可微同胚(mm 次可微的微分流形范畴中的态射)对应到同胚(拓扑流形范畴中的态射),遗忘了附加在映射上的 mm 次相容性条件

熟悉这套范畴的语言,微分流形的理解就非常容易。回到 [Chern 1999] 对微分流形的定义,其中出现了:

令 MM 为 nn 维拓扑流形,则 pM\forall p \in M 都 U\exists U :

pUMp \in U \subset M

使得开邻域 UU 和 Rn\mathbb{R}^{n} 中的开集同胚,将这个同胚记为:

φ:Uφ(U)Rn\varphi: U \rightarrow \varphi(U) \subset \mathbb{R}^{n}

把开邻域及其同胚映射一起记为坐标卡(coordinate chart)(U,φ)(U, \varphi)。坐标卡的意义在于,微分流形上的任何一个点 pp ,都会被至少一个坐标卡所在的开集 UU 所覆盖,这个坐标卡的同胚 φ\varphi 建立了点 ppRn\mathbb{R}^n 上一个(带自然坐标的)点的双向可逆而且连续(同胚的定义)的对应。于是,点 pp 在这个坐标卡下被赋予一个 Rn\mathbb{R}^n 上的局部坐标

微分流形的定义中还谈到了坐标卡之间是 CmC^m -相容的,也就是说,两个坐标卡重合(交集)的地方,其坐标变换的映射是 mm 次可微的。我们把微分流形视作平直空间的区域,也就是一组坐标卡,粘合为整体几何结构。在粘合的地方,也就是两个坐标卡相互重合交集的地方,其中的每个点都有一个以上的局部坐标,每个局部坐标都由所在的坐标卡 (U,φ)(U, \varphi) 中的映射 φ\varphi 决定。同一点有多个局部坐标,其间需要以可微的方式实现坐标变换(只有可微,才能在上面做数学分析),所以需要坐标卡之间 CmC^m -相容的条件。

既然坐标卡重叠的地方,实现了 CmC^m以相容过渡,在两个坐标卡之间穿行时,重叠之处也可以相容过渡,这样就实现了整体上的相容性。有了这样优秀的性质,就可以讨论微分流形上的可微函数乃至光滑函数的问题,从而开启微分几何领域的大门。

# 微分流形上的场

我们在学习多元微积分时,了解了在线性空间上建立的矢量分析和场论。现在我们有了微分流形的概念,过去场论的部分概念可以延展到微分流形上。

微分流形 MM 上的标量场 ff 就是定义在 MM 上的数量函数:

MRpf(p)\begin{aligned} &M \rightarrow \mathbb{R} \\ &p \mapsto f(p) \end{aligned}

这很好理解。中学以及数学分析中,定义域为平直的空间 Rn\mathbb{R}^n 来描述。

下面问题来了,在 Rn\mathbb{R}^n 上可以定义向量场

RnRnpf(p)\begin{aligned} &\mathbb{R}^{n} \rightarrow \mathbb{R}^{n} \\ &p \mapsto f(p) \end{aligned}

譬如 3 维空间的重力场、电场、磁场等,这些都是我们在物理中熟知的。那么矢量场的定义可以推广到流形吗?看看这样定义的是什么:

MRnpf(p)\begin{aligned} &M \rightarrow \mathbb{R}^{n} \\ &p \mapsto f(p) \end{aligned}

举个例,如果每根头发类比为一个向量,头部可是视为流形 M ,那么头发的分布是否是一个场?仔细考虑,我们发现这里的问题没那么简单:

  1. 头皮类比为流形 MM,而这个流形是 2 维的;头发作为向量是 3 维的。我们或者可以认为我们站在 3 维的世界,观察嵌入其中的 2 维流形,然而 3 维的头发,又如何放入流形中研究呢?
  2. 头上两点各有一根头发向量,两个向量如何比较呢?它们的向量起点处于不同的点,虽然都是空间向量,实际上生长的条件都不一样,怎么比较。

类似这样的问题,虽然来自直观,但已经揭示出微分流形和平直空间非常不同的特性。微分流形的研究要复杂得多。平直空间中许多显然的结论,如 Rn\mathbb{R}^n 上的矢量场,完全是退化的特例。

# 局部线性化:从 Taylor 展开到微分形式

回顾微分流形 MM 的定义,其中提到

pM 都 U:pUM使得开邻域 U 和 Rn 中的开集同胚。 \begin{aligned} &\forall p \in M \text { 都 } \exists U:\\ &p \in U \subset M\\ &\text {使得开邻域 } U \text { 和 } \mathbb{R}^{n} \text { 中的开集同胚。 } \end{aligned}

这使我们注意到:

  1. 这里是逐点定义的,且只考虑每一点的某个邻域的存在性。这提示我们采用了局部的方法。
  2. 局部(开邻域)和 Rn\mathbb{R}^n 中的开集同胚,意味着在局部试图接近 Rn\mathbb{R}^n 这样的平直空间,所谓平直,就是线性,实际上 Rn\mathbb{R}^n 中嵌入的平直空间(直线、平面、超平面)就称为线性流形

这些思路,我们总结为局部线性化。局部线性化的思想贯穿于微分几何的研究中,这也是我们一直强调同学们学好线性代数的原因(另一个思想是借助拓扑学的整体微分几何)。

# Taylor 展开

微积分中我们熟知 Taylor 展开,在一维的情况,函数 f(x)f(x) 在点 x0Rx_0 \in \mathbb{R} 附近可以写为幂级数和的形式:

f(x)=k=0f(k)(x0)k!(xx0)k=f(x0)+f(x0)1!(xx0)+f(x0)2!(xx0)2+\begin{aligned} &f(x)=\sum_{k=0}^{\infty} \frac{f^{(k)}\left(x_{0}\right)}{k !}\left(x-x_{0}\right)^{k} \\ &=f\left(x_{0}\right)+\frac{f^{\prime}\left(x_{0}\right)}{1 !}\left(x-x_{0}\right)+\frac{f^{\prime \prime}\left(x_{0}\right)}{2 !}\left(x-x_{0}\right)^{2}+\ldots \end{aligned}

注意到 k=0k=0 次项 f(x0)f(x_0) 是常数项,而当 xx0x \rightarrow x_0 求极限时:

dfdx(x)x=x0=limxx0f(x)f(x0)xx0=limxx01xx0{f(x0)1!(xx0)+f(x0)2!(xx0)2+}\begin{aligned} &\left.\frac{d f}{d x}(x)\right|_{x=x_{0}}=\lim _{x \rightarrow x_{0}} \frac{f(x)-f\left(x_{0}\right)}{x-x_{0}} \\ &=\lim _{x \rightarrow x_{0}} \frac{1}{x-x_{0}}\left\{\frac{f^{\prime}\left(x_{0}\right)}{1 !}\left(x-x_{0}\right)+\frac{f^{\prime \prime}\left(x_{0}\right)}{2 !}\left(x-x_{0}\right)^{2}+\ldots\right\} \end{aligned}

x0x_0 处求导将消去 1 次以上高阶无穷小量,只剩下 1 次的线性项,得到我们熟知的关系:

dfdx(x)x=x0=f(x0)\left.\frac{d f}{d x}(x)\right|_{x=x_{0}}=f^{\prime}\left(x_{0}\right)

站在我们现在的角度看,Taylor 展开就是一种函数逼近技术,当考察固定点 x0Rx_0 \in \mathbb{R} 附近的局部(邻域)时,成为了一种线性化的,只保留一次导数 f(x0)f'(x_0) 的逼近。

注意到 Taylor 展开的局部线性化也可以表示成:

df=fdxdf = f' dx

这一方面反映了导数的局部线性的性质,另一方面,导数 ff' 在固定点上是常数,它本身可以视为线性系数。在 nn 维看得更加清楚。nn 维函数 f(x)f(x) 在点 x0Rnx_0 \in \mathbb{R}^n 附近的 Taylor 展开,进行局部线性化后得到:

df=k=1nfxidxi=fxidxi=(if)dxid f=\sum_{k=1}^{n} \frac{\partial f}{\partial x_{i}} d x^{i}=\frac{\partial f}{\partial x_{i}} d x^{i}=\left(\partial_{i} f\right) d x^{i}

这里用了 Einstein 求和约定。显然,偏导数 if{\partial_i f} 起到了线性系数的作用。现在我们得到了某种类似线性组合的关系。然而,若要放心地用线性代数的方法来处理,我们首先需要明确两个问题:

  1. dfdf 和  {dxi}\{dx^i\} 是否是某个向量空间中的向量?
  2. 如果是, {dxi}\{dx^i\} 能否构成基?

如果我们能够解决这两个问题,过去我们所理解的所谓无穷小量微分将被赋予线性空间的新的内涵,它是将来要讨论的余切向量的原形。

# 超平面系

Rn\mathbb{R}^n 中,记自然基为 {xi}\{x_i\} 。考虑一组特殊的函数分量函数 C={xi(x)=xi}C=\left\{x^{i}(x)=x_{i}\right\} ,其中每一个表现为:

xi:RnRxxi(x)=xi\begin{aligned} &x^{i}: \mathbb{R}^{n} \rightarrow \mathbb{R} \\ &x \mapsto x^{i}(x)=x_{i} \end{aligned}

即把点 xRn\forall x \in \mathbb{R}^n 的第 ii 个分量 xix_i 输出为函数值。

注意:指标 ii 在上面表示它是函数xi=xi(x)x^i = x^i (x)
指标在下面表示它是坐标分量xiRx_i \in \mathbb{R}

分量函数 xi=xi(x)x^i = x^i (x) 对分量 xjx_j 求偏导数:

dxi(x)dxj=δij\frac{d x^{i}(x)}{d x_{j}}=\delta_{i j}

这里用了 Kronecker 记号。于是仅在指标 i=ji=j 时有意义:

dxi(x)dxi=δii=1\frac{d x^{i}(x)}{d x_{i}}=\delta_{i i}=1

dxi=dxi(x)=dxid x^{i}=d x^{i}(x)=d x_{i}

上式中,左边的指标 ii 在上面表示函数的微分,右边的指标在下面表示自变量的微分。我们理解为,函数微分自变量微分可以等同看待。

由分量函数的函数微分和自变量微分的等同关系可见,分量函数 C={xi(x)=xi}C=\left\{x^{i}(x)=x_{i}\right\} 的几何意义是,每一个函数 xi(x)=xix^i (x) = x^i 都是线性函数,它构成一个超平面(线性流形),这组超平面相互正交

# 1-微分形式

nn 维实线性函数所构成的空间记为 L(Rn)L\left(\mathbb{R}^{n}\right) 。这个线性函数空间蕴含了自然的线性运算,即 α,βR,f,gL(Rn):\forall \alpha, \beta \in \mathbb{R}, \forall f, g \in L\left(\mathbb{R}^{n}\right):

f,g:RnR(αf+βg)(x)=αf(x)+βg(x),xRn\begin{aligned} &f, g: \mathbb{R}^{n} \rightarrow \mathbb{R}\\ &(\alpha f+\beta g)(x)=\alpha f(x)+\beta g(x), \forall x \in \mathbb{R}^{n} \end{aligned}

我们注意到上面讨论的分量函数

C={xi(x)=xi}C=\left\{x^{i}(x)=x_{i}\right\}

中的每个函数都是 nn 维实线性函数。前面谈到它们构成了正交的超平面,代数上意味着 CC 是函数空间 L(Rn)L(\mathbb{R}^n) 中的线性无关子集。

现在考虑某一点 x0Rnx_0 \in \mathbb{R}^n 附近的线性函数空间 Lx0(Rn)L_{x_0}\left(\mathbb{R}^{n}\right) 。如前面的讨论,任意函数 f(x)f(x) 在点 x0x_0 附近若可微,则可以通过 Taylor 展开,在 x0x_0 附近消去高阶无穷小量后,局部视为一个线性函数 fLx0(Rn)f \in L_{x_0}\left(\mathbb{R}^{n}\right)

f:RnRxf(x)=f(x0)+λixi\begin{aligned} &f: \mathbb{R}^{n} \rightarrow \mathbb{R} \\ &x \mapsto f(x)=f\left(x_{0}\right)+\lambda_{i} x^{i} \end{aligned}

更重要的,可以把这个线性函数 ff 表达为点 x0x_{0} 附近分量函数

C={xi(x)=xi}Lx0(Rn)C=\left\{x^{i}(x)=x_{i}\right\} \subset L_{x_{0}}\left(\mathbb{R}^{n}\right)

的线性组合:

f(x)=f(x0)+λixi=f(x0)+λixi(x)f(x)=f\left(x_{0}\right)+\lambda_{i} x^{i}=f\left(x_{0}\right)+\lambda_{i} x^{i}(x)

对它求全微分:

df=k=1nfxidxi=fxidxi=(if)dxi=λidxid f=\sum_{k=1}^{n} \frac{\partial f}{\partial x_{i}} d x^{i}=\frac{\partial f}{\partial x_{i}} d x^{i}=\left(\partial_{i} f\right) d x^{i}=\lambda_{i} d x^{i}

这里的 λi=if\lambda_{i}=\partial_{i} f 是线性系数。这里出现的 dxidx^i 既可以视为变量 xix^i 的微分,也可以视为函数 xi(x)=xix^{i}(x)=x_{i} 的微分。**非常重要!**回到前面我们提出的问题:

  1. dfdf{dxi}\{dx^i\} 是否是某个向量空间中的向量?
  2. 如果是, {dxi}\{dx^i\} 能否构成基?

现在,在某一点 x0Rnx_0 \in \mathbb{R}^n 附近,由于 f=f(x)f=f(x) 被局部线性化, ff{xi(x)=xi}\left\{x^{i}(x)=x_{i}\right\} 的成员都是 Lx0(Rn)L_{x_0}\left(\mathbb{R}^{n}\right) 中的元素。我们把微分算子 dd 视为从线性函数空间函数微分集合的映射:

d:Lx0(Rn)Dx0(Rn)fdfxi=xi(x)dxi\begin{aligned} &d: L_{x_{0}}\left(\mathbb{R}^{n}\right) \rightarrow D_{x_{0}}\left(\mathbb{R}^{n}\right) \\ &f \mapsto d f \\ &x^{i}=x^{i}(x) \mapsto d x^{i} \end{aligned}

由于微分的线性性,自然可以在函数微分集合 Dx0(Rn)D_{x_{0}}\left(\mathbb{R}^{n}\right) 中构建线性运算,构成线性的函数微分空间。于是,dfdf{dxi}\{dx^i\} 是函数微分线性空间 Dx0(Rn)D_{x_{0}}\left(\mathbb{R}^{n}\right) 中的向量。

其次,由于 C={xi(x)=xi}Lx0(Rn)C=\left\{x^{i}(x)=x_{i}\right\} \subset L_{x_{0}}\left(\mathbb{R}^{n}\right) 是一个线性无关的集合,可以证明微分算子 dd 将它映射成函数微分线性空间 Dx0(Rn)D_{x_{0}}\left(\mathbb{R}^{n}\right) 中的基 {dxi}\{dx^i\}

最后,根据全微分公式:

df=(if)dxi=λidxid f=\left(\partial_{i} f\right) d x^{i}=\lambda_{i} d x^{i}

即:任意函数 f(x)f(x) 在点 x0Rnx_0 \in \mathbb{R}^n 附近若可微,则可以通过 Taylor 展开在 x0x_0 附近进行局部线性化,得到函数微分 df=(if)dxid f=\left(\partial_{i} f\right) d x^{i} ,它是基 {dxi}\{dx^i\} 的线性组合。

这个函数微分线性空间 Dx0(Rn)D_{x_{0}}\left(\mathbb{R}^{n}\right) 中的元素称为** 1-微分形式 (differential form),简称 1-形式**。本质上,1-形式相当于局部(在相差一个常数的意义下等价,后面详述)线性函数。

# 1-形式的几何直观

函数 C={xi(x)=xi}C=\left\{x^{i}(x)=x_{i}\right\} 的几何意义是,在点 x0Rnx_0 \in \mathbb{R}^n 附近,每一个函数 xi(x)=xix^i(x)=x_i 都是 Lx0(Rn)L_{x_{0}}\left(\mathbb{R}^{n}\right) 中的线性函数,它构成一个超平面(线性流形),这组超平面相互正交

微分算子 dd 将这组线性函数映射成函数微分,即:

d:Lx0(Rn)Dx0(Rn)xi=xi(x)dxi\begin{aligned} &d: L_{x_{0}}\left(\mathbb{R}^{n}\right) \rightarrow D_{x_{0}}\left(\mathbb{R}^{n}\right) \\ &x^{i}=x^{i}(x) \mapsto d x^{i} \end{aligned}

注意这种映射不是单射,若有任意实数 cRc \in \mathbb{R} 则:

xi(x)dxixi(x)+cd(xi+c)=dxi\begin{aligned} &x^{i}(x) \mapsto d x^{i} \\ &x^{i}(x)+c \mapsto d\left(x^{i}+c\right)=d x^{i} \end{aligned}

即,相差为常数的线性函数具有相同的函数微分,相同的函数微分对应着等价类。由于任意线性函数也是 C={xi(x)=xi}C=\left\{x^{i}(x)=x_{i}\right\} 的线性组合,这种等价关系对于任意函数微分 dfDx0(Rn)d f \in D_{x_{0}}\left(\mathbb{R}^{n}\right) 都成立。于是满足微分为 dfdf 的线性函数是一个集合,这个集合中的线性函数两两之间相差一个常数。几何上看, dfdf 决定了一组平行的(相差常数)超平面(线性函数)。

作为 1-形式, df=(if)dxid f=\left(\partial_{i} f\right) d x^{i} 体现了基 {dxi}\{dx^i\} 的线性组合,几何上看,每一个基向量(1-微分形式)都代表一组平行超平面,基向量之间相互正交,通过系数(偏导数 {if}\{\partial_i f\} )组合,构成了具有任意梯度的一组平行超平面。

# 重新认识向量场:方向导数、偏导数、梯度

  1. 矢量就是方向导数算子
  2. 1-形式就是梯度

我们首先确认方向导数是方向向量和梯度的双线性映射。这种双线性映射可以表达为内积的形式,方向向量和梯度的分量互为对方的线性组合系数。

然后,我们回顾方向导数的定义,确认向量可以定义为给标量函数求方向导数的东西,这种定义的好处是它只依赖于局部结构,而不需要原点或者位置的概念。

接着,我们继续上讲中关于 1-形式的讨论,发现梯度和 1-形式是相等的。它们不仅在运算结果上相等,在几何直观上也是等效的,于是我们确认 1-形式就是梯度。

上一讲谈到:作为 1-形式, [公式] 体现了基![公式] (opens new window) 的线性组合,几何上看,就是这一组具有固定梯度的平行平面系,通过系数(偏导数 [公式] ) 组合,构成了具有任意梯度的平行平面。

# 回顾我们所理解的向量场:方向导数、偏导数、梯度

[公式] 中,记自然基为 [公式] ,记偏导数求导符号为 [公式]

方向导数(directional derivative)[公式] 是数量函数 [公式] 以向量 [公式] 作为方向求导所得到的导数,它也是一个数量函数

偏导数 (partial derivative): [公式][公式] 沿自然基向量 [公式] 方向求得的方向导数

梯度(gradient):[公式] 在某点上沿所有方向求导时,在某个方向达到最大方向导数,梯度

[公式]

是一个矢量,其分量是各个坐标上的偏导数。[公式] 在某点上沿所有方向求导时,在梯度 [公式] 的方向达到最大方向导数,其大小就是梯度的长度。

方向导数是方向向量和梯度的双线性映射。将来我们会知道,方向向量和梯度是一对对偶空间,故写成:

[公式]

[公式]

实际上可以写为内积形式:

[公式]

这个式子有很多个理解的角度。我们可以将方向导数视为以方向向量 [公式] 的各分量作为线性系数,将偏导数进行线性组合。i.e., [公式] 作为某种基,通过方向 [公式] 上分量的组合构成了函数的总变化率,即方向导数。

# 换个角度理解向量:向量就是那个可以求方向导数的家伙

我们发现,前面所讨论的方向导数 [公式] 本身的性质是和具体的函数 [公式] 无关的。从算子的角度分析,将 [公式] 上的所有光滑(无限次可微,方便讨论)标量场/数量函数的集合记为 [公式] ,那么任何一个函数 [公式] 都是形如以下的映射:

[公式]

[公式]

于是方向导数 [公式] 、梯度 [公式] 、偏导数 [公式] 都可以视作算子。方向导数 [公式] 作为算子视作偏导数算子 [公式] 的线性组合:

[公式]

这里用了 Einstein 求和约定。注意:偏导数也是一种方向导数,偏导数之间是线性无关的,所有偏导数构成一个基。

基于我们原先的知识和直观理解,我们认为 [公式] 上的向量场是在 [公式] 的每一点上密密麻麻生长出来的箭头:

向量就是那个可以给函数求方向导数的家伙

我们过去理解的那堆箭头可以表述为 [公式] ,这是在 [公式] 中的自然表述,它偏重于或者位置的概念。,而方向导数 [公式] 算子是由这堆箭头 [公式] 所决定的,在每一个 [公式] 上,都可以对任意光滑函数在 [公式] 的方向求导的算子。既然箭头和方向导数如此对应,索性就把向量定义为:

可以给函数求方向导数的家伙

相比于前面偏重于位置的定义,这样的定义偏重于向量的方向长度

前面提到方向导数 [公式] 作为算子可以视作偏导数算子 [公式] 的线性组合:

[公式]

于是我们用算子重新定义 [公式] 上的向量 [公式] :在 [公式] 点上,对任意函数都有偏导数算子 [公式]。以偏导数算子 [公式] 为基进行线性组合得到向量

[公式]

[公式] 的每一点如此定义,得到向量场:

[公式]

我们把 [公式] 称为点 [公式] 上向量的基,这种定义方式已经有了向量丛的味道,以后详谈。

# 作为对偶向量的梯度

我们回到梯度。[公式] 在某点上沿所有方向求导时,在某个方向达到最大方向导数,梯度

[公式]

是一个矢量,其分量是各个坐标上的偏导数。[公式] 在某点上沿所有方向求导时,在梯度 [公式] 的方向达到最大方向导数,其大小就是梯度的长度。

前面我们知道向量就是用来给函数求方向导数的。那么任意给一个向量 [公式] 都决定了一个方向导数:

[公式]

注意到,在 [公式] 附近(凡是讲到附近就意味着存在无限小的领域),方向导数是两个矢量 [公式][公式] 的内积,确切地说,是 [公式][公式] 的内积。若是给定了向量场 [公式] ,而让 [公式] 去变化又如何?

前面我们学过对偶空间和对偶向量,不难验证,此刻 [公式] 是相对于 [公式] 的对偶向量:

[公式]

我们印象中的梯度 [公式] 是一个向量。这里,我们看到,确切地说梯度是一个对偶向量

# 梯度与 1-形式

上一讲的最后谈到:1-形式 [公式] 体现了基![公式] (opens new window) 的线性组合,几何上看,就是这一组相互正交的超平面元,通过系数(偏导数 [公式] )组合,构成了具有任意梯度的超平面元。我们有意在那里提到梯度,就是为了联想到刚才我们所谈到的,作为对偶向量的梯度。

1-形式的几何意义是具有梯度的超面元。[公式] 代表了一组相差为常数的,体现为平行超平面的线性函数,这一组线性函数求微分后得到了相同的 [公式] 。对 1-形式可以展开为:

[公式]

这里解读为,以梯度 [公式] 的分量为线性系数,可以在基 [公式] 上通过线性组合构建 1-形式。即梯度决定 1-形式。反过来,上一讲谈到,1-形式是超平面元,超平面确定了梯度。于是,我们现在认为梯度等效于 1-形式

令向量 [公式] 在基 [公式] 中表为:

[公式]

那么方向导数则为

[公式]

由于

[公式]

以上两个 Einstein 求和(线性组合)项再做内积,通过 Kronecker 符号消去大部分,仅留下指标 [公式] 的情况,于是整理式子得到:

[公式]

通过以上一对对偶向量 [公式][公式] 在一对对偶基 [公式][公式] 上的运算,我们得到了方向导数 [公式] 。再根据前面的讨论

[公式]

对任意向量 [公式] 成立,我们有:

[公式]

即 1-形式就是梯度。

# 小结

这一讲中我们得到两个新的观点:

矢量就是方向导数算子 1-形式就是梯度

并且,也直观认知到了矢量和 1-形式互为对偶向量,[公式] 和![公式] (opens new window) 互为对偶基。固定点上的这两类向量-对偶向量构成对偶空间,这就是微分流形上切空间-余切空间的雏形。有这一讲的铺垫,我们将来会比较容易地把这些概念推广到微分流形上。

# 微分流形上的函数和参数曲线

我们自一开始介绍微分流形概念后,就谈到了微分流形上的标量场和向量场问题。其中的标量场可以容易地从 [公式] 过渡过来,而向量场则遇到了麻烦。

我们在上一讲中得到了几个重要的认知:

矢量就是方向导数算子 1-形式就是梯度

并且,也直观认知到了矢量和 1-形式互为对偶向量,[公式] 和![公式] (opens new window) 互为对偶基。固定点上的这两类向量-对偶向量构成对偶空间,这就是微分流形上切空间-余切空间的雏形。

现在我们开始设法将平直空间 [公式] 中相关的场论的结果推广到微分流形上,首先想到的当然还是方向导数。在微分流形上构造向量:参数曲线

很容易定义微分流形上的标量函数:

[公式]

[公式]

我们在前一讲中提到,在 [公式] 上一点可以按照给定方向向量 [公式] 求方向导数:

[公式]

然而,现在是在微分流形上,尽管 [公式] 有良好的定义,但 [公式] 是没法照搬的。

记得我们谈到局部线性化是微分几何的研究思想,如果我们要研究微分流形 [公式] 在点 [公式] 附近的类似于方向导数的性质,我们需要考虑所有可能的方向向量,于是需要从所有可能的方向去穿过这一点。嵌入在流形上且穿过这一点的曲线,是方便的研究工具。在曲线上的运动也是在流形上的运动,穿过点的不同速度(对参数的导数),也体现了切向量的各种可能性。于是,我们利用参数曲线来研究:

[公式]

[公式]

[公式]

这一光滑映射是从实数的子集映射到流形的子集,这类映射的集合记为 [公式]

# 微分流形上的方向导数

上一讲提到过,方向向量和梯度是在对偶空间中的对偶向量,我们暂且理解这对对偶空间是从流形上一点 [公式]生长出来的,那么方向导数是以下的双线性映射:

[公式]

[公式]

过去我们讨论 [公式] 上的情况是一种退化情况,即 [公式] 都是不依赖于具体点的。所以,过去我们在平直的空间上所学习的场论,都等同看待

[公式]

而没有区分其中微妙的差别。这种差别在微分流形中就是不可避免的了

那么,现在我们试图构造一个类似的双线性映射。首先,有流形上的光滑函数 [公式]

[公式]

[公式]

将其视为流形上一点附近光滑函数空间中的元素:

[公式]

又有穿过这一点的参数曲线,视为参数曲线集合中的元素:

[公式]

于是有了复合映射

[公式]

[公式]

它把参数曲线的参数空间![公式] (opens new window) 光滑地映射到了实数 [公式] ,于是可以定义二者之间的复合导数。既然函数芽限制于 [公式] 的局部,我们只考虑这一点上的导数:

[公式]

它完全是由参数曲线 [公式] 和光滑函数 [公式] 决定的,于是定义以下二元映射:

[公式]

[公式]

至此,我们得到了一个非常类似于平直 [公式] 中方向导数的结构。对比

[公式]

两者类似之处在于:

[公式] 在点 [公式] 附近对参数求导的局部线性化,从几何直观上看是一个方向向量,相当于 [公式] 在考虑方向向量时, [公式] 可以看作类似于 [公式] 的算子,它们都和 [公式] 无关 在固定 [公式] 时, [公式] 是作为 [公式] 的对偶存在的,类似于 [公式] 是作为 [公式] 的对偶向量存在 [公式] 在局部具有某种双线性,严格的阐述留到后面

# 总结

我们在这一讲中,通过对复合映射求导的方式,得以由任意的参数曲线 [公式] 和光滑函数 [公式] 来构造一个类似方向导数的结构,从而由机会把我们在前面研究的方向导数相关的概念,向微分流形上推广。

在这里,无论是参数曲线还是光滑函数,都是要在 [公式] 点局部线性化的。在 [Chern 1999] 上,借助了各种等价关系来描述不同对象局部线性化之后的等价关系。我们在这一系列的讲座中吸取了其中一些思想。希望有时间多咀嚼 [Chern 1999] 的逻辑过程,对培养代数化的思维方式非常有帮助。这本书也是公认的对初学者不友好的教材,但反过来也的确体现了大师的高度。

Last Updated: 2023-10-29T08:26:04.000Z