本文较为硬核,请酌情跳过部分内容。
不过,若是你真想了解狄拉克方程,我建议你全看完。(可以忽略公式,只看文字内容。)
狄拉克方程,我想称其为“神来之笔”!它是狭义相对论与量子力学的统一,为了烘托这神来之笔,我需要在前期做足铺垫。
笔者曾写过一篇文章:《深度科普:带你看懂薛定谔方程,量子力学入门》,本文可以算是是那篇文章的后续内容,请读者确保自己已经读过了那篇文章,不然你完全看不懂下面的内容(评论区里会附上链接,也可以进作者主页查看)。
再次提醒,请确保自己已经读过上面的文章,不然你完全看不懂下面的内容。
本文的主要内容有:
从薛定谔方程的缺陷谈起
事情并不简单
“错误”的方程
绝境?
狄拉克的妙计
神来之笔!
写出狄拉克方程!
浑然天成的自旋
狄拉克之海与反物质
狄拉克方程的意义
它有两个缺陷:
只能描述低速运动的电子,当电子接近光速运动时,薛定谔方程就失效了。
无法描述电子的自旋。
虽说薛定谔方程描述的是“微观粒子”这个大的概念,不过在它创立之初,基本上就是在描述电子。狄拉克方程也是如此,通常就是在描述电子。
甚至可以说量子力学就是描述光子和电子的学问,光子已经由麦克斯韦方程组描述了,其它的方程自然是在描述电子。
先看一看薛定谔方程的第一个缺陷,当电子接近光速运动时,薛定谔方程就失效了,此话从何说起?
咱们先捋一捋上篇文章是如何推导薛定谔方程的。从某种角度看,薛定谔方程就是经典的能量动量关系:
m是质量,v是速度。(为了简化问题,本文不考虑电子的势能。)
再乘一个波函数Ψ:
结合一下对波函数求偏导数以后得到的性质:
整理这些性质:
i是虚数单位,h加一横是约化普朗克常数。
这样就可以直接得到薛定谔方程:
(当然,这是一维的薛定谔方程。)
薛定谔方程的动能公式和动量公式都是从经典力学得来的,这就导致薛定谔方程只适用于低速运动的电子。
不过,有件事值得我们注意:
1905年,狭义相对论就被创立了。1926年,薛定谔方程才出现。薛定谔为什么还要使用经典力学的能量和动量,而不是直接创立一个满足狭义相对论的方程?
这么明显的想法,薛定谔会想不出来?
人家当然能想出来啊!
那薛定谔为什么不改进一下自己的方程?
问题在于事情并不简单。
事实很尴尬,薛定谔最初构建物质波的波动方程时,用的就是狭义相对论的能量-动量关系!
但是,他写出的方程求不出氢原子能级公式,这说明那个方程是错的。
被打击以后,薛定谔又按经典的能量-动量关系构建了一个方程。结果竟然算出了氢原子能级公式!
于是,薛定谔把这个歪打正着的方程发表了。
薛定谔方程是这么“上位”的,这导致它在电子接近光速运动时就失效了。
薛定谔最初写下的方程其实是:克莱因-戈登方程。
(现在看来,随便一个学过物理的人都能推导出这个方程。)
这个方程是通往狄拉克方程的一个小插曲,笔者有必要介绍一下它。
上面已经回顾了薛定谔方程的推导过程,依葫芦画瓢,如果想描述高速运动的电子,只需要借鉴一下狭义相对论的能量-动量关系:
再乘一个波函数Ψ:
然后再看一看波函数的性质,找出需要用的公式:
这样就可以得到克莱因-戈登方程:
当然,这是一维的克莱因-戈登方程。依葫芦画瓢,还可以写出三维的克莱因-戈登方程:
这个方程被很多人用很多方法得到过,听起来很高大上,看起来也很高大上,实际上却是个“绣花枕头”。
求解这个方程,算不出氢原子能级公式也就算了,竟然还会出现负的概率和负的能量,一看就知道没戏。
多说几句,克莱因-戈登方程也不是一无是处。虽然它不能描述自旋为半整数的费米子(比如电子),但可以描述自旋为零的粒子,比如希格斯玻色子、介子。
薛定谔方程缺陷严重、克莱因-戈登方程是“绣花枕头”,最终的方程究竟该怎么写?
还是要从狭义相对论的能量-动量关系入手。不过要注意,不能像克莱因-戈登方程那样“玩过了”。
克莱因-戈登方程之所以“玩过了”(出现负的概率和负的能量),是因为:
所以应该使用的能量-动量关系是:
乘以波函数Ψ,可以得到:
但是,根号的出现,让整个方程变得混乱不堪,还不如原本的克莱因-戈登方程。
所以对于相对论的能量-动量关系:
需要消除根号,而且还不能用等号两边平方的方法去消除根号,不然就又回到了克莱因-戈登方程。
此时的物理学家:
走到这一步,真的可以算是“前不着村,后不着店”,物理学家似乎陷入了“死循环”,难道狭义相对论和量子力学不兼容吗?
狄拉克的思路是:
既消除了根号,又没有平方,堪称完美!是不是有一种“从地狱到天堂”的感觉?
但是,别高兴得太早,α和β真的存在吗?什么意思?
狄拉克的想法相当于:
大家可以自己思考一阵子,看看能不能得到满足条件的A和B。
我可以告诉大家,A和B在实数域内找不到解,在复数域内也找不到解。更让人绝望的是,如果你的思路是:
那么A和B根本就没有解!
是不是有一种“从天堂到地狱”的感觉?
狄拉克的妙计似乎并不妙,也只是个“绣花枕头”。这件事放在别人身上或许就不了了之了,不过很可惜,狄拉克终究是狄拉克。
矩阵!
A和B可以是矩阵,说得准确一点,是2x2矩阵!
矩阵就是把一堆数排列在一起,矩阵的乘法通常不满足乘法交换律。
(限于篇幅,正文里就不介绍矩阵的计算方法了,评论区里会附上矩阵的计算方法。)
知道了矩阵的妙用,回到当初的问题:
所以真正的问题是:
它们都是4x4矩阵,被称为狄拉克矩阵:
想知道怎么推导狄拉克矩阵?
这不是强人所难吗,连我这种人都能搞懂的话,还能叫神来之笔吗?
顺便说一句,狄拉克矩阵不止这一组。费米找到了另一组狄拉克矩阵,被称为“标准组”,而狄拉克找到的这一组矩阵被称为“泡利组”。
现在可以写出新的满足狭义相对论的能量-动量关系:
结合波函数的性质:
可以得到:
这就是狄拉克方程!
不过这种形式的方程和网上常见的狄拉克方程相差甚远,所以我有必要说明一下各种形式的狄拉克方程是怎么来的。
首先,把等号右边的一些项移到等号左边:
然后,在等号两边都乘以一个β矩阵(β矩阵乘β矩阵是单位矩阵,在这个方程里可以认为单位矩阵就是1):
上面的方程还可以写成:
把等号右边的项移到等号左边就可以得到:
如果采用自然单位制,就可以得到:
再定义一个算符:
就可以得到:
之前提到过薛定谔方程的两个缺陷:
不能描述高速运动的电子。
不能描述电子的自旋。
第一个缺陷已经被狄拉克方程解决了,那第二个缺陷呢?
也被狄拉克方程解决了!
是不是有疑问,刚刚推导狄拉克方程的时候只是使用了狭义相对论的能量-动量关系啊,没有考虑自旋啊,怎么就描述了电子的自旋?
上篇文章说过,想要描述电子的自旋,就需要引入泡利矩阵:
(至于泡利矩阵怎么就能描述电子的自旋,这涉及到旋量理论和洛伦兹群,笔者就不介绍了。)
而狄拉克矩阵包含了泡利矩阵:
狄拉克矩阵是从哪里来的?
狭义相对论啊!
这说明什么?
说明电子的自旋是狭义相对论的必然要求,电子必然有自旋!
顺便说一句,电子的自旋并不是说电子在绕着一个轴转动(如果真是电子在转动,就违背了狭义相对论),“自旋”仅仅只是为了描述斯特恩-盖拉赫实验中的反常现象:电子具有额外的磁矩。
前面说过,求解克莱因-戈登方程会得到负的概率和负的能量,这让克莱因-戈登方程被人诟病。正因如此,才需要一个新的方程:狄拉克方程。
那求解狄拉克方程的结果如何?
确实不会出现负的概率,但是仍然会出现负的能量。这似乎表明狄拉克方程和克莱因-戈登方程一样,都是“绣花枕头”。
不过,这里的“剧情”有些不一样,狄拉克给负的能量找到了一个“合理”的解释:
负能量对应着“负能级”,真空中到处都是“负能级”,那里早已被电子填满了。所以真空是一片电子组成的海洋(狄拉克之海),只不过我们无法观测到那些待在“负能级”的电子。
听起来是不是有些玄幻?
下面还有更玄幻的:
如果“负能级”中的电子吸收能量,就会跃迁到“正能级”,成为我们可以观察的电子。与此同时,会在“负能级”中形成一个“空穴”,也就是说真空中出现了一个电子,同时也出现了一个“空穴”。
真空的总电荷是零,总能量也是零。
真空中少了一份的负电荷(占据“负能级”的电子),就会表现出一份的正电荷,所以这个“空穴”是带正电的。真空中少了一份的负能量(占据“负能级”的电子),就会表现出一份的正能量,所以这个“空穴”具有正的能量(也就是正的质量,切记)。
把这个过程反过来,电子与“空穴”结合,会释放能量。与此同时,它们回归真空。
这种“空穴”就像一种粒子一样,当时人们知道的带正电的粒子只有质子,狄拉克原本也觉得这种“空穴”就是质子,不过这种想法被批判:
按照能量守恒,“空穴”的质量应该与电子的质量相同,而质子的质量大约是电子的1836倍!
于是狄拉克脑洞大开,认为这是一种新的粒子,它与电子的质量相同、自旋相同,只是带的电荷与电子相反,可以称之为正电子!
1932年,安德森继任赵忠尧先生的工作,在宇宙射线中发现了正电子。
也可以说正电子是电子的反粒子,随后的几十年里,物理学家陆续发现了其它粒子的反粒子,这让人畅想:反物质!
这是狭义相对论和量子力学的统一!
(所谓的相对论和量子力学不相容,说的是广义相对论,而非狭义相对论。)
也是量子场论的开端,导致了二次量子化,促成了量子电动力学的创立。
而且,狄拉克方程不只描述电子,目前看来,一切费米子都可以由狄拉克方程描述。甚至可以说,狄拉克方程是粒子物理标准模型的第二块拼图!
(粒子物理标准模型描述了电磁力、弱核力、强核力,是目前理论物理学的巅峰。)