本文较为硬核,请酌情跳过部分内容。
不过,若是你真想理解薛定谔方程,我建议你看完全文。
薛定谔:德布罗意的论文是在说,波可以是粒子,粒子也可以是波。
德拜:有了波,就要有个波动方程。
薛定谔:我试试。
二十世纪初,物理学界有一项大发现:光,具有波粒二象性(可以用波动模型去描述光,也可以用粒子模型去描述光)。这启发了德布罗意,于是这位公子提出了相位波的思想。
简单地说,人们习惯于将原子、电子这些实物用粒子模型去描述,而忽略了它们的波动属性。
为此,德布罗意还写出了这些实物对应的波的频率和波长的公式:
这两个公式被称为德布罗意方程组。这种波后来被称为物质波,而薛定谔方程就是在描述物质波,主要用于描述电子的物质波。
(电子、原子、石头、炮弹、星球、……,都可以被看成是物质波。)
物理学的精髓是测量与描述,最好是用数学语言描述。
如何用数学语言描述物质波呢?
别急,咱们先看看如何用数学语言描述经典的波。
你可能会问:上面的德布罗意方程组,难道没有用数学语言描述物质波吗?
可以说,描述地不完整。
至于怎么不完整?
还是要从经典的波谈起。波是振动形式在空间中的传递,想要描述波,就要先描述振动。
如何描述振动?
首先要清楚,振动有三个要素:幅值、频率、相位。
着重介绍一下相位,相位其实就是振动周期中的一个时刻,比较多个振动的先后顺序的时候,就是在比较相位。
影视剧中的台词“明年的今日就是你的xx”中的“今日”其实就是相位。
这三个要素可以被振动函数整合到一起。考虑最简单的振动:简谐振动。简谐振动的振动函数是正弦函数(也可以是余弦函数)。
振动的三个要素,都被包含在振动函数里,振动函数只有一个自变量,就是时间t(为了待会儿和波函数比较,我需要在这里使用偏向于数学的语言。)
那么,如何描述一个波?
波有五个要素:幅值、频率、波长、波速、相位。和振动相比,多了波长和波速,这五个要素可以被经典的波函数整合到一起。
频率、波长、波速这三个量,只有两个是独立的,知道任意两个,就可以求出第三个。
所以,暂时可以减去一个要素,只关注其中的四个要素。
经典的波函数自然也要包含这四个要素:幅值、相位,以及频率、波长、波速中的任意两个量。
为了进一步简化问题,这里只介绍一维的波函数,波只朝一个方向传播。并且,不考虑波的衰减,波的幅值不变。只考虑最简单的波:简谐波(任意波形的波,都能由一系列的简谐波叠加而成)。
简谐波是简谐振动在空间中的传递,可以从简谐振动的振动函数出发,推导出简谐波的波函数。由于简谐波在空间中传播,因此它有有两个自变量,时间:t、距离:x。
对于一个以波速v传播的简谐波,例如下图:
A点离波源较近,B点离波源较远,因此B点比A点的相位要滞后。
如果分别写出A点和B点的振动函数,那么将A点的振动函数向右平移就可以得到B点的振动函数(左加右减,基本的数学知识还是要有的)。向右平移的“距离”,就是简谐波从A传到B所需的时间(距离除以波速就是这个时间)。
以此类推,可以写出波速为v,与波源距离为x的点的振动函数,这其实就是波函数。
观察一下经典的波函数,它整合了我们关注的四个要素,所以它完整地描述了经典的波。
还可以利用欧拉公式,把经典的波函数写成复指数形式。
有不少读者反应:不理解把波函数写成复指数形式的过程,笔者在此详细说明一下(部分读者可以酌情跳过)。
首先需要一个公式(后面会说到这个公式的意义)。
在这里简单介绍一下复数和复平面。
依葫芦画瓢,可以得到下面这个公式。
然后我们需要知道的是:
任意波形的波,都能由一系列的正弦波相加而成!
把正弦函数或余弦函数写成复指数形式以后,我们可以发现:一系列的正弦波相加,其实就是一系列的复指数函数相加。所以,可以把任意一个波的“最小单元”看成是:复指数函数。
(我们之前用正弦函数代表波,也是因为可以把任意一个波的“最小单元”看成是正弦函数。)
这样一来,我们也可以用复指数函数来表示波:
波函数的复指数形式的内容是为了最终推导薛定谔方程做铺垫。至于为什么要写成复指数形式,是因为对相位的表达更加方便。波函数是正弦函数(余弦函数),而正弦函数(余弦函数)的导数仅仅只是相位超前了90度(导数就是变化率,有高中数学基础的话,应该很熟悉)。
对写成复指数形式的波函数求导数时,只需要乘一个虚数单位i。
和经典的波函数一比较,会发现:德布罗意方程组并没有完整地描述物质波(没有把波的要素整合到一起)。想要完整地描述物质波,就需要写出物质波的波函数。
有了前面的铺垫,这一步非常简单,直接把德布罗意方程组代入经典的波函数就行了!
你经常在科普量子力学的作品中看到的那个Ψ,就是这里的波函数。
每个波函数,都描述了一种物质波。
波函数有了,那波动方程该怎么写?
别急,咱们先看另一个问题。我知道有人会问:波函数不是已经可以描述物质波了吗,为什么还要再写个波动方程?
简单地说,波函数是个代数方程,而物理学家需要的波动方程是个微分方程。说白了,波函数只是表像,而波动方程才是内在的规律(说得数学一点,代数方程只是表像,而微分方程才是内在的规律)。
从波动方程出发,可以求解出各种各样的波函数,就像从牛顿第二定律出发,可以求解出各种各样的运动轨迹(这个类比非常恰当,微观粒子的波函数就相当于宏观物体的运动轨迹)。而薛定谔要构建的,就是可以比肩牛顿第二定律的波动方程。换言之,薛定谔方程之于量子力学,犹如牛顿第二定律之于经典力学。
那这个波动方程到底该怎么写?
它有什么特点?
首先,有个等号。
其次,等号两边分别让波函数对时间和距离求二阶偏导数。
至于什么是偏导数,可以按物理意义理解成变化率(偏导数和导数只是名字不同,并没有实质上的差别)。
那好,咱们先把物质波的波函数对时间和距离求偏导数,再看看能构建什么样的等量关系。
(至于具体怎么计算偏导数,也够写一篇长文了,笔者在此略过。)
如果可以找到能量和动量的等量关系,那不就搞出了波动方程吗?
(没错,就是依葫芦画瓢!)
能量和动量有什么等量关系?
在经典力学里,有两种运动的量度。动能:决定物体可以运动多长距离。动量:决定物体可以运动多长时间。
但我们需要找的是能量和动量的关系,而能量不只包括动能,所以需要把上面式子的等号两边都加上势能。
这样就得到了经典的能量-动量关系。
把求偏导数得到的物质波的能量和动量代入经典的能量-动量关系,就得到了薛定谔方程!
(推导方法不唯一,文章里的推导方法仅供参考。)
怎么办?
不用慌,还记不记得乘一个虚数单位i代表什么?
求导!
这就是使用复指数函数的巧妙之处,这样一来,薛定谔方程的左边也是求了二阶导数,薛定谔方程是波动方程!
(能看懂一维的薛定谔方程的推导过程的话,在这里推导三维的薛定谔方程也就不成问题了。)
上面提到过波的五个要素,我们考虑了其中的四个要素:幅值、相位、频率、波长。对于物质波,频率表示能量、波长表示动量。
那幅值和相位呢?
玻恩参透了幅值秘密:波函数的模平方,是微观粒子出现的概率密度(有向量的基础知识,就知道什么是模、什么是模平方)。
所以说,物质波是一种概率波。既然是概率,就有个归一化条件。名字有些吓人,其实就是说:微观粒子出现在所有位置的概率之和为1。
另外,上面的波函数是基于简谐波写出来的,而任意波形的波都可以由一系列的简谐波叠加而成。所以说,波函数是可以叠加的。
至于波函数的相位,与规范场论有关,过于复杂,本文不谈。
薛定谔方程的建立,意味着波动力学诞生了,而量子力学就是由矩阵力学和波动力学合并而成的(矩阵力学着眼于粒子,而不是波,和波动力学在数学上是等价的),那个时候,才算是有了量子力学。
就像相对论和相对论动力学还差得远一样,量子论和量子力学也还差得远。很多介绍量子力学的教科书和科普作品都把普朗克的量子化假设作为开端,并称普朗克为量子之父。
这种做法确实合情合理,但也让不少人产生了误解:普朗克提出量子化假设以后,量子力学就诞生了,普朗克是量子力学之父。而事实是:普朗克提出量子化假设以后,量子论诞生了,普朗克是量子论之父。
量子论是微观世界的一个总体框架,而量子力学是依据这个框架建立的动力学理论。写出基于量子论的动力学方程,才算是有了量子力学,薛定谔方程就是其中的一个动力学方程。
另外,薛定谔方程可以描述电子,而化学反应不过是原子最外层电子(价电子)的把戏。所以,原则上,可以用薛定谔方程计算一切化学反应的结果。量子化学也因此而生。
其一,上面有个标题是经典的能量-动量关系,薛定谔方程是基于它建立的。也就是说:当微观粒子高速运动时,薛定谔方程就不可靠了。
解决方法:按相对论的能量-动量关系建立波动方程,就可以描述高速运动的微观粒子了。
其二,薛定谔方程没有考虑微观粒子的自旋。而电子、质子、中子、……,这些微观粒子都是有自旋的。
解决方法:引入泡利矩阵。
这两个缺陷最终被狄拉克方程一举解决。