戴榕菁
1. 引言
之前我们已经知道作为量子力学的基本概念的所谓的相对论动量其实不过是一个物理学家们造出来的不具备任何物理意义的数学表达式而已。随着对于现有量子理论之了解的加深,我们可以发现现有的量子理论之数学框架所存在的问题远超过那个虚构的相对论动量。作为量子力学的最基本的方程之薛定谔方程本身就不是基于对自然的深刻理解从最基本的自然律推导出来,而是一种用类似曲线拟合的手法为了满足实验中观察到一些现象而凑出来的。可以说整个20世纪的量子理论就像是建在沙滩上一个城堡。
通过对薛定谔的诺贝尔获奖文章【[1]】的讨论【[2],[3],[4]】,我们对薛定谔方程已经可以有了过去几十年里流行于世界各地的主流学界文献和官方课本里看不到的更多的认识。
如我在上面提到文章【2,3,4】中指出的,我最开始判断出薛定谔的方程不是按照严格逻辑一步步地推导出的而是凑出来的主要是看到他在文章中提到按照他的推导可以很自然地得到爱因斯坦的光能公式和德布罗意波长公式,但爱因斯坦的光能公式并不适用于他所针对的基本粒子而在没有运用相对论的前提下他是不可能得到德布罗意波长公式的。上述发现让我对他的推导过程进行深入考察,最终还是印证了我最初对于他的方程不是严格推导出来而是凑出来的判断。
另外,与他之后的狄拉克一样,薛定谔在他的文章中努力营造他的波函数方程与经典的哈密尔顿力学有着天然的联系,为了收到这样的效果,他文章【1】从讨论单个粒子在引力场中运动的哈密尔顿力学开始。但实际上,他的那个所谓的哈密尔顿力学表达式根本不符合单个粒子在引力场中的自由落体运动方程。此外他的那番努力还使他得出了可以凑出爱因斯坦的光能公式和德布罗意波长公式的波动相速度公式,这也决定了按照他的那个一般形式的获奖方程(32)求出之解的波动频率会带有不应出现的普朗克-爱因斯坦光能公式及德布罗意波长公式的影子。同时,由于不论是他的波动相速度公式还是他的波动方程的形式都是凑出来的,而不是按照他一开始铺垫的哈密尔顿力学的逻辑思路推导出来的,他的那个一般形式的获奖方程(32)与他之前用作铺垫的哈密尔顿力学毫无关系------ 与之相应地,薛定谔的推导过程中没能自然地赋予那个波函数任何物理意义从而需要再人为地额外定义它的意义。
意识到薛定谔方程原始推导过程存在着各种瑕疵之后,其他20世纪物理学家们就试图通过数学的操作令该方程看似有着严格的逻辑根基。其中具有代表性当属诺贝尔奖获得者狄拉克与费曼。但是,既遗憾又如预期的那样,狄拉克和费曼也不可能在与薛定谔相同的逻辑前提下仅通过数学上的操作就解决物理学基本逻辑上的缺陷,就如薛定谔不可能在不用到相对论的前提下推导出德布罗意波长公式一样。
之所以说薛定谔方程是凑出来的而不是象牛顿定律或热力学定律那样是从实际数据中归纳出来的,如我们将从本文的讨论中看到的那样,其主要的原因为:不论是在薛定谔的推导中还是在其后的其他物理学家们在推导中,他们并非直接从实验或观察数据中归纳出相应的方程,而是针对德布罗意提出的粒子波动概念选择用经典力学中反映波动的最一般的数学公式及方程,并针对当时实验室里发现的所谓的二分之一量子数而专门选择相关参数;更主要的是,作为薛定谔方程的最基本的变量的所谓的波函数的物理意义完全不是在公式推导过程中确定的,而是要在得出公式后再另外人为赋予的。
本文我们将简单地回顾一下之前对薛定谔方程的原始推导的讨论,然后再讨论检验费曼和狄拉克在形塑薛定谔方程之天然合理性上的努力,然后再探讨一下建立在薛定谔方程基础之上的所谓的量子化的操作。
2. 薛定谔方程原始推导回顾
之前讨论薛定谔的诺贝尔获奖文章时,我们提到薛定谔推导其获奖公式的出发点是文中的(3)式:
其中的W由该文的(2)给出:
经过一番操作【2,3,4】之后,借助下面这个在之前上百年的时间里人们已经熟知的简单的波动函数:
对所谓的波函数的周期进行了讨论。通过选用下面这个当时人们早已熟知的波动方程:
并假定波函数仅通过随时间变化,薛定谔得出了随空间变化的方程(16):
将(16)推广为n个自由度的系统,薛定谔得出了他的更一般形式的(26)式:
然后通过前面提到的波函数中的时间因子:
我们可以得出:
将(26)式与(31)式结合,薛定谔得出了随空间和时间变化的一般方程:
而(32)式在一个自由度下就是我们现在所熟悉的薛定谔方程的形式:
其中V为势能,m为粒子质量,等于h/2π。
2.1. 讨论
薛定谔在他的诺贝尔获奖文章中从(1)式到(8)式在表面上对哈密尔顿力学的运用(尽管是带有逻辑错误的运用)主要起到了这样两个作用:1)营造量子力学与经典的哈密尔顿力学之间的天然纽带关系;2)给出了一个计算相速度从而计算频率和波长的公式。
在这个基础之上,用最常见的波动方程,在波函数对时间的依赖只存在于表达简谐振动的指数函数(30)的假设前提下,薛定谔推导出了他诺贝尔得奖方程(32)。严格地说来,薛定谔的直接推导是从他的(15)式开始的。而这过程中不但波函数方程的建立与之前用作铺垫的哈密尔顿力学无关,而且波函数本身的引入也不具有任何实际的物理意义。而这就决定了这样两点:1)因为他的所谓推导本身没有能够直接赋予他的波函数任何物理意义,所以他有必要人为地给他的波函数赋予一个特殊的意义:粒子的电荷强度;2)哥本哈根学派显然看出了薛定谔的这个软肋,因而随即对薛定谔的人为设定的波函数的意义按照他们的心愿进行重新解释,而薛定谔(应该是出于面子问题)对于他们的重新解释进行抗议而设计出的一只(带有逻辑缺陷的)猫却随后促生了涉及冯诺曼在内的一众数学和物理学巨星的被量子力学界认为至今都无解的量子力学的重要研究课题----量子力学测量问题。
3. 薛定谔方程之里程碑意义
回顾量子理论的发展史,薛定谔方程是一个重大的里程碑式的转折点。在薛定谔之前,普朗克,爱因斯坦,和德布罗意基本上都是本着严肃的态度去认真地探索微观世界,而他们的故事通常也是教科书或科普故事中最喜闻乐道的,这也在客观上给普通大众造成了量子理论是一门非常严肃的科学的影响。但是,在量子力学的发展史上薛定谔开启了一个在很大程度上可以说是具有相当程度的随心所欲特点的时代。
3.1. 费曼的评论
量子力学界将薛定谔表现出的随心所欲引以为傲,这一点充分表现在费曼对薛定谔方程的下述评价[[5]]:
【
We do not intend to have you think we have derived the Schrödinger equation but only wish to show you one way of thinking about it. When Schrödinger first wrote it down, he gave a kind of derivation based on some heuristic arguments and some brilliant intuitive guesses. Some of the arguments he used were even false, but that does not matter; the only important thing is that the ultimate equation gives a correct description of nature.
……
Where did we get that from? Now here. It’s not possible to derive it from anything you know. It came out of the mind of Schrödinger, invented in his struggle to find an understanding of the experimental observations of the real world.
中译文:
我们并不想让你认为我们已经推导出了薛定谔方程,只是想向你展示一种思考它的方式。当薛定谔第一次写下这个方程时,他是基于一些启发式的论据和一些非常聪明的直觉猜测得出的。他使用的一些论据甚至是错误的,但这并不重要;唯一重要的是,这个最终方程能够正确地描述自然界。
......
这是从哪儿来的呢?哪儿都不是。从你知道的任何东西里都推导不出来。它是薛定谔从头脑中创造出来的,是他在努力寻找对现实世界实验观察的理解时发明的。
】
听他的口气就好像自然的规律都装在他们的脑袋里所以他们可以随用随取不麻烦借用严格的逻辑依据似的。不过,费曼的话里面有几个严重的问题。
其一,所谓的对世界实验观察的理解是一个人自己的理解而已,薛定谔方程只不过定性地符合了当时发现的基本粒子的所谓的二分之一的量子数以及基本粒子在一些场合下表现出来的波动性而已,而他忽略或者不知道的是薛定谔方程满足的德布罗意波长是错的,而且它满足的爱因斯坦能量公式并不适用于薛定谔方程所代表的一般粒子。
其二,费曼所谓的薛定谔的发明其实不过是针对波动性这一点运用在之前的几百年里已知的的基本波动方程来凑出一个解而已,并不像听上去那么玄乎,而这一点本身也就意味着它的普适性本身很有可能因为它是凑出来的而受到实际的限制。
其三,费曼所谓的“Some of the arguments he used were even false”是避重就轻。实际情况是,薛定谔用了不合他的前提逻辑的数学表达式,使得他的整个推导或整个公式完全脱离了他试图营造的经验基础。换句话说,由于薛定谔在推导公式过程中的逻辑缺陷,他的结果更符合费曼所说的由薛定谔脑袋里制造出的,而不是能令人信服地具备自然之物质基础的。
3.1.1. 薛定谔之推导的实际历史作用
薛定谔方程为物理学界提供了一个可供分析量子动力学的数学工具,而薛定谔所发表的推导过程的一个主要历史作用其实就是营造了一个量子力学是有着来自经典哈密尔顿力学之经验基础的形象,因此具有天然的合理性。此外,薛定谔的另一个作用就是让他的波函数是复数,这一点对于日后其他人修改薛定谔方程的意义及形式都很重要。
3.2. 哥本哈根学派对波函数的重新解释
有关薛定谔方程的(随心所欲的)改编的第一步则是由哥本哈根学派的波恩出来将薛定谔方程的波函数的意义进行修改。当初薛定谔将他的方程中的波函数人为地解释为粒子的电荷强度。从经典力学的角度听起来薛定谔的这种解释还是比较容易接受的,因而也有助于他所要营造的他的方程是有着经典力学的经验基础的形象的。
但是,既然薛定谔对他的方程的推导已经完成了形塑量子力学与经典物理的经验基础的天然关系的任务,也就失去了坚守对薛定谔方程的波函数之电荷强度的人为解释的必要性了。波恩将薛定谔的波函数的模解释为一个粒子出现在某个条件场合的概率密度【[6],[7],[8],[9]】。
继波恩之后,基于波函数的概率解释或者可以说是对于概率波动力学的直接应用,海森堡【[10],[11]】提出了他的著名的测不准原理。
3.3. 费曼对薛定谔方程的推导
推导薛定谔方程是费曼在诺贝尔获奖讲座上炫耀的一个点【[12]】。尽管费曼好像从未发表过他自己的相关推导过程,我查到在网上找到一篇署名为 David Derbes的介绍费曼推导过程的文章【[13]】。作者没有交待他和费曼的关系或从哪里弄到的费曼的推导过程。
Derbes可能对于薛定谔在其诺贝尔获奖文章【1】中由(3)式得出(16)式的步骤感到不满意,又不愿象我一样直接认定薛定谔的(16)及(32)是凑出来的,所以他在上述文章【13】中首先用薛定谔的(3)式帮薛定谔推导了一下他的(16)式。
考虑到我们这里是在挑作为整个量子力学之基础的薛定谔方程的毛病,甚至可以说是在挑战整个20世纪物理学的基础,我们有必要认真如实地对任何可能有效的推导尤其是象费曼这样的重量级人物的推导过程进行认真的检验,既然Derbes也给出了他自己帮助薛定谔推导他的方程的步骤,那么我们也应该顺便将他的推导检验一下。
但另一方面,因为相关推导过程涉及很多数学细节,这对于大多数没有经过物理或力学训练的读者可能比较枯燥。因此,我在接下来的几节的讨论中,将只列出能说明问题的关键步骤,而将详细的步骤放在附录中供感兴趣的读者查证。对Derbes自己帮薛定谔推导他的(16)之过程的详细检验放在附录I,对Derbes给出的费曼推导薛定谔方程的过程的详细检验放在附录II。
接下来包括附录在内的讨论中为了方便直接从原文中摘取数学式子,我将直接采用他们文中的数学符号以及表达式序号。我自己补充的表达式的序号将继续用*表示。
3.3.1. 检验Derbes补推薛定谔的(16)式的步骤
Derbes首先按照我上面提到的薛定谔文中的(9)式的思路,取波函数的形式为
这里的S相当于薛定谔文中的哈密尔顿函数W,a就相当于薛定谔的(9)式中的A。
经过一番操作(详见附录I)之后,他得到
其中U为势能,E为总能量,ψ*为ψ的共轭复数。
然后,他将(3.8)式的左边命名为M,并将它对x进行积分,并将该积分命名为T:
到这一步为止,他的推导应该还算是中规中矩。但是下面这一步就有点不太规矩了。
他将ψ*作为一个广义坐标,从而将(3.9)式看作是拉格朗日方程,并对之运用欧拉-拉格朗日公式,从而得到:
将(3.9)式中的M代入(3.10)式我们便可得到:
这就是薛定谔的(16)式的一维形式。
我之所以说上面这步不规矩,是因为(3.8)式已经限定了M=0,这时他就不能再对(3.9)式运用欧拉-拉格朗日公式了。
此外,Derbes应该也意识到了薛定谔在他自己的文中选了最简单的波动方程(15)式以后的推导与之前所讨论的哈密尔顿力学并没有直接关系,因此想要帮助薛定谔来重塑其著名方程与哈密尔顿力学之间的关系。但是,Derbes他没有意识到的是:
首先,他所用到的薛定谔的(3)本身就不是严格地按照薛文中的(2)式推导出来的(因为按照他的(2)式,薛定谔的(3)连单个粒子的在引力场中的自由落体运动都不满足。。。当然,也正是因为薛定谔的(3)式本身就是凑出来的,Derbes将它稍作修改也就无妨了);
其次,Derbes他自己任意选定(3.3)为波函数的表达式本身与薛定谔选他的(15)式同样属于是凑出结果来,而不是严格地从哈密尔顿力学推出结果来的。相应地,Derbes也就并未能比薛定谔本人赋予薛定谔方程与哈密尔顿力学之间的更紧密的逻辑关联。
3.3.2. 费曼对薛定谔方程的推导
在检验Derbes给出的费曼对薛定谔方程的推导之前,我们有必要注意到这样几点相关背景:
首先,发表Derbes的相关文章的美国物理杂志(Am J. Phys)给该文做了这么一个注:
从这个注中我们基本可以肯定,费曼只是给世人讲了一个他依据狄拉克的一篇文章来推导薛定谔方程的故事,但除了简单地介绍了他的思路之外并未正式发表过他的推导。(Derbers也没有交待他是如何获得费曼的推导的)。
第二,从本文的参考文献中费曼的诺贝尔获奖讲座【12】以及本节讨论的Derbes的文章【13】中你们都可以找到费曼的那个故事。。。。不过,那个故事让我感到一丝凉意。
我在之前文章中曾提到的薛定谔明明是凑出来他那个获奖方程,却还要(可以说是)艺术性地营造出他是严格地从哈密尔顿力学出发并参考了惠更斯与费马的思路推导出来的氛围。。。。而费曼讲述的那个故事让再次感受到了一种用艺术影响读者的逻辑判断的味道。。。。在本节结束时我会指出为什么我会有那样的感觉。
第三,这里有必要特别提醒读者去回味本文前面3.1.节引用的费曼的那两段话。。。。
接下来我们来看Derbes给出的费曼对薛定谔方程的推导。
首先,费曼的出发点不是薛定谔的文章,而是一个据称是来自狄拉克一篇题为“The Lagrangian in Quantum Mechanics”的文章【[14]】的在时间域内的积分变换:
那篇文章里并没有明确地给出上面的(4.1),因此(4.1)式应该是费曼或者费曼的故事里的Jehle教授按照自己对狄拉克的文章的解读列出的。
费曼假设(4.1)中的G(x,y)是如下的形式:
其中的指数与前面(3.3)中的指数一样,S为拉格朗日作用积分。相应地,在很小的一个时间间隔ε里我们有:
其中 拉格朗日函数L = K – U, K是运动粒子的动能,U是运动粒子的是能。因为时间间隔ε很小,我们有:
费曼又令x – y = ξ 以便对小ξ值时的积分进行考察。然后经过一番包括针对ε和ξ的泰勒展开(详见附录II),他得到:
将(4.16)整理一下,我们有:
当ε趋于零时,(4.17)就是前面我们给出的薛定谔方程的(*)式。
上面的整个步骤我都检验了一遍,并没有发现如前面一节中Derbes对M=0运用欧拉-拉格朗日公式那样明显的不规矩之处。
3.3.1. 讨论
在这一部分里,我们将从几个不同的角度来对费曼的推导进行讨论。
1)从上面介绍的推导过程来看,费曼的推导似乎并不存在什么不妥。但实际上,费曼的推导之逻辑缺陷在于作为他的推导的逻辑前提,而他的逻辑前提中的缺陷又集中反映在了他在他的诺贝尔获奖讲座上讲的那个故事里。很显然,费曼完全没有料到他当初的那个原以为可以有效地诱导读者注意力的妙笔生花的故事可以成为泄露他的心机之画蛇添足的一笔。我们先来看费曼的那个故事的内容【12,13】:
【So that didn’t help me very much, but when I was struggling with this problem, I went to a beer party in theNassau Tavern in Princeton. There was a gentleman, newly arrived from Europe (Herbert Jehle) who cameand sat next to me. Europeans are much more serious than we are in America because they think that agood place to discuss intellectual matters is a beer party. So, he sat by me and asked, “what are you doing”and so on, and I said, “I’m drinking beer.” Then I realized that he wanted to know what work I was doingand I told him I was struggling with this problem, and I simply turned to him and said, “listen, do youknow any way of doing quantum mechanics, starting with action – where the action integral comes into thequantum mechanics?” “No”, he said, “but Dirac has a paper in which the Lagrangian, at least, comes intoquantum mechanics. I will show it to you tomorrow.”
……
Professor Jehle showed me this, I read it, he explained it to me, and I said, “what does he mean, they areanalogous; what does that mean, analogous? What is the use of that?” He said, “you Americans! You alwayswant to find a use for everything!” I said, that I thought that Dirac must mean that they were equal. “No”,he explained, “he doesn’t mean they are equal.” “Well”, I said, “let’s see what happens if we make themequal.”So I simply put them equal, taking the simplest example where the Lagrangian is ½Mx – V(x) but soonfound I had to put a constant of proportionality A in, suitably adjusted. When I substituted for K to get
and just calculated things out by Taylor series expansion, out came the Schrödinger equation. So, I turned to Professor Jehle, not really understanding, and said, “well, you see Professor Dirac meant that they were proportional.” Professor Jehle’s eyes were bugging out – he had taken out a little notebook and was rapidly copying it down from the blackboard, and said, “no, no, this is an important discovery. You Americans are always trying to find out how something can be used. That’s a good way to discover things!” So, I thought I was finding out what Dirac meant, but, as a matter of fact, had made the discovery that what Dirac thought was analogous, was, in fact, equal. I had then, at least, the connection between the Lagrangian and quantum mechanics, but still with wave functions and infinitesimal times.】
接下来我们再来看一下费曼所说的狄拉克文章【14】中的analogous到底是不是他所说的“equal”:
【The work of the preceding section now shows that
where L is the Lagrangian. If we take T to differ only infinitely little from t, we get the result
The transformation functions in (8) and (9) are very fundamental things in the quantum theory and it is satisfactory to find that they have their classical analogues, expressible simply in terms of the Lagrangian. We have here the natural extension of the well- known result that the phase of the wave function corresponds to Hamilton's principle function in classical theory. The analogy {9) suggests that we ought to consider the classical Lagrangian, not as a function of the coordinates and velocities, but rather as a function of the coordinates at time t and the coordinates at time t + dt.】
对比费曼和狄拉克的原文,我们可以明显看出费曼完全是混淆了两个不同的概念。对于狄拉克来说,他用analogy的目的是要给他的量子力学理论找到经典力学的天然基因,属于物理机制层面的关联性,而费曼则用“equal”一词将物理上的类比变成了数学上相等的意义了。费曼的这种以强势的口气将物理上的类比改为数学上的相等制造了这样一个人为的逻辑效果:狄拉克所谈论的量子力学与经典力学之间的关联根本是多余的,因为它们就应该一样,不存在人为类比的问题。
三个月前,我在“诡辩与洗脑”【[15]】一文中指出:
【
被用于洗脑的比较典型的一类诡辩就是以肯定的口气把并不能确定为事实的内容作为确定的事实或已知的结论讲出来,然后在这个前提下再展开其它的讨论。
】
当然,对于作为诺贝尔奖获得者的物理学大人物费曼我们不能说他在故意对整个世界的读者进行洗脑,也不能说他是故意诡辩,只能说他自己出现了逻辑上混乱。不过,他的这种逻辑混乱确实已经实实在在地起到了给全世界进行半个来世纪洗脑的作用。
那么,费曼讲那个故事到底纯粹在获得诺贝尔奖之后出于对历史及故人的往事的感慨而一时兴致所至的分享呢,还是他精心设计的呢?这里我们再回顾一下前面3.1.节引用的费曼的那句话:
【We do not intend to have you think we have derived the Schrödinger equation but only wish to show you one way of thinking about it.】
费曼的这句话出现在1965年出版的Gottlieb, M.A.和Pfeiffer, R. 编写的Feynman Lectures中,而费曼正是1965年获得诺贝尔奖的。因此,基本可以肯定费曼上面这句话应该是在费曼讲前面那个故事之前说的。但是,费曼所讲的那个故事肯定发生在上面这句话之前,也就是说,费曼是在他已经将狄拉克所做的物理学类比改为数学相等并在那基础上推导出了薛定谔方程之后讲的上面那句话。这样一来,费曼的上面这句的意义以及他在说完这句话之后又在诺贝尔获奖讲座上讲那个故事的用意就有点耐人寻味了。不过对于费曼这样的大人物我们还是尽量往好了想从而认定他讲那个故事只是为了使讲座更生动活泼一些而已。
2)很显然,费曼所依据的狄拉克的那篇文章的最致命的要害不是狄拉克所构造的数学表达是否合理,而在于他所进行的物理学的类比是否合理。如果那两种物理学过程并不存在他所声称的类比,那么他所进行的数学形式上类比就完全失去合理性。
在本文后面我会谈到薛定谔方程与哥本哈根学派之间的哲学不相容性问题。不过,即便不去考虑哥本哈根学派对于薛定谔方程的诠释,单从目前已知的量子领域存在的诸如量子隧道和量子缠绕这些的现象来看,我们完全没有理由认为这背后的物理机制可以用描述局部连续的单值确定之经典力学问题的哈密尔顿力学来表达。这就决定了狄拉克在他的文章【14】中将量子力学与哈密尔顿力学进行的类比完全不具备物理学(哲学)上的合理性!
3)我对狄拉克的那篇文章【14】的一些具体内容感到困惑,我将我的困惑写在了本文的附录III中,以供读者参考。不过我对狄拉克那篇文章的相关困惑并不重要,重要的是费曼以(4.1)和(4.11)为其推导的出发点(详见附录II)所存在的逻辑上的缺陷。
其实,不论狄拉克的文章【14】中的数学构造是否合理,很显然在过去几百年的经典力学中没有人会把费曼所用的(4.1)作为自然界的普适物理定律。
首先,其中的本身不具有任何实际的物理意义,需要人为地赋予。既然本身不具有任何实际的物理意义,那么(4.1)式就只是一个纯粹的数学表达式。
其次,即便假设(4.1)式是在某个特定条件下求解哈密尔顿方程时得出的一个关于带有某种特殊意义之的解,我们还需要人为地特别假设其中的G(x,y) 为(4.11)所表达的形式。就凭这一点,(4.1)配上(4.11)就不可能是一个普适的自然规律。
4)很显然,由(4.1)出发选择(4.11)为其中的G(x,y)这个做法与薛定谔从他的(15)式出发,假定其中的解对时间的依赖仅表达为的形式是异曲同工的。。。。这就是为什么两者可以得出同样的解的原因。但问题在于这两者都不是如他们所要形塑的那样从经典的哈密尔顿力学的基本原理出发得到的;更遑论如前面提到的,量子现象与哈密尔顿所表达的经典宏观力学现象在物理机制上就没有可类比性。
3.4. 狄拉克的影响
除了费曼用狄拉克的文章【14】推导了薛定谔方程之外,狄拉克自己也用他的那套BraKet的算符数学试图推导薛定谔方程【[16]】。
过去两年里我在不同场合反复指出过:数学污染【[17]】是导致20世纪物理学乱象的一个重要的原因。而狄拉克对量子力学运用他的那套BraKet算符数学的做法在我看来就是物理学中的数学污染的一个典型例子。相应地,对于狄拉克的文献【16】我只是比较粗略地过了一遍与薛定谔方程相关的段落,重点检查他的相关逻辑流程。
不过,我可以肯定的一点是:尽管狄拉克在他的文献【16】中同样只是试图营造他对薛定谔方程的演算是直接来自哈密尔顿力学,但是,他在运用他的算符力学时做了一些人为的假设。例如:
【Let us try to introduce a quantum P.B. which shall be the analogue of the classical one. We assume the quantum P.B. to satisfy all the conditions (2) to (6), it being now necessary that the order of the factors u1 and u2 in the first of equations (5) should be preserved throughout the equation, as in the way we have here written it, and similarly for the v1 and v2 in the second of equations (5). These conditions are already sufficient to determine the form of the quantum P.B. uniquely, as may be seen from the following argument.】
【The strong analogy between the quantum P.B. defined by (7) and the classical P.B. defined by (1) leads us to make the assumption that the quantum P.B.s, or at any rate the simpler ones of them, have the same values as the corresponding classical P.B.s. The simplest P.B.s are those involving the canonical coordinates and momenta themselves and have the following values in the classical theory :
We therefore assume that the corresponding quantum P.B.s also have the values given by (8). By eliminating the quantum P.B.s with the help of (7), we obtain the equations
which are the fundamental quantum conditions.】
等等。
在这样的前提下,即便我们能够退一万步来承认狄拉克的力学与哈密尔顿的经典力学有着逻辑上的天然联系,我们也只能将它作为在狄拉克所做的特殊的假定的前提下可以成立的形式体系。
4.量子化
说起量子化,科普读物呈现给读者的通常是将包括物质以及时间和空间在内的物理世界细分为小于所谓的普朗克常数量级的范围,然后对之运用量子力学的分析。概念听上去挺简单也好像挺合理。但是,在实际进行量子化操做的量子力学里,量子化却有着完全不同的具体涵义。在相关的文献中人们甚至可能根本看不到科普读物中概念化地描述的将宏观世界进行细分的步骤,而只有一些与细分世界并没有什么实际关系的数学操作。
今天文献或科普教材中会提到挂着不同人名的不同的量子化的方法或理论,但究其根源基本上都与前面讨论的薛定谔方程有关,其中比较典型的当属狄拉克获得诺贝尔奖的那篇文章【[18]】。
4.1. 狄拉克著名的量子化文章
在他的诺贝尔获奖文章【18】中,狄拉克的出发点是下面这个所谓相对论化的经典力学哈密尔顿函数:
其中c是光速,W是总能量,e是电荷,m是质量,p是动量,A0是标量势,A是向量势。狄拉克对上式运用下面这个量子化操作(算式序号DLK*是本文为了方便叙述而加的):
并将其中的算符作用在波函数ψ上,结果得到:
这就是量子化的一个奇怪操作。经过这么一番操作,原本所谓的相对论化的经典力学哈密尔顿函数就成为了量子力学的哈密尔顿函数。很显然,(DLK*)给出的只是一种数学形式上的关系,其本身不具备任何直接的物理意义,将一个经典力学的数学关系中的能量和动量用上面的(DLK*)中的关系变成对时间和空间的导数算符,然后再将波函数ψ插入到这些算符后面去,就完成了将经典力学中的数学表达式进行所谓的薛定谔量子化的过程。
4.1.1.讨论
这里我们很容易看出:1)上述所谓的量子化过程用到的(DLK*)逻辑依据就是薛定谔方程。换句话说,如果没有薛定谔方程就不会有狄拉克上面所进行的量子化操作;2)上述的量子化过程已经超出了薛定谔方程本身的应用范围。所谓的量子化过程已经是连接经典力学与量子理论的纽带,是凡要用量子理论对宏观世界里可以观察到的现象之内在的微观世界进行分析研究必有的步骤,哪怕在这些分析研究中人们如狄拉克在他的文章【18】那样并没有直接用到薛定谔方程。
但是,从本文前面的讨论中可知薛定谔方程的建立过程中是存在着逻辑缺陷的,这意味着作为今天整个量子理论之基础的量子化本身就存在着逻辑缺陷的。这样一来,除了之前我们已知的相对论动量是不具有任何物理意义的数学表达式之外,量子化过程本身的逻辑依据也存在着缺陷。
不过另一方面,从前面对于薛定谔方程的推导过程中我们也可以看出,与相对论动量完全仅是一个数学表达式不同,薛定谔方程在一定的程度上确实反映了基本粒子的波动性以及实验中发现量子运动的一些特征。为了方便理解,我们可以将薛定谔方程与物理实验中用到的曲线拟合进行类比。一个用来拟合一组离散点的曲线并一定能正确地预测所有的测量数据,但在很多情况下确实能很好地反映用来进行曲线拟合的那组数据。。
4.2. 狄拉克诺贝尔获奖文章的价值
一年半前我曾对狄拉克的诺贝尔获奖文章【18】进行过讨论【[19],[20],[21]】。不过当时由于刚推翻狭义相对论不久,对于20世纪物理学的整体性了解过于粗浅,所以在讨论中对于狄拉克文中所存在的缺陷缺乏足够的底气来面对。当时只注意到狄拉克所用到的相对论动量不具有任何真实的物理意义,对于他所进行的量子化本身的问题没有丝毫的概念。另外,当时我还没有认识到爱因斯坦的著名的质量能量关系应该被修改为E=mc2/2【[22],[23],[24],[25],[26],[27]】,与之相应地,我当时甚至认为海维赛德(Heaviside)的理论可以帮助相对论解套。经历过去一年半多时间对于相对论的错误的更深入的了解,今天我自然不会再有那样的幼稚看法了。
不过说到20世纪物理学家们的运气狄拉克的运气确实不错。如我在一年半前的分析狄拉克方程的讨论中指出的,虽然所谓的相对论动量与经典的动量之间没有关系因而不符合动量守恒定律,但在狄拉克推导他的那个诺贝尔获奖方程式的过程中并没有真正涉及到动量守恒,这种情况下,他将那个被称为相对论动量的纯数学表达式叫做什么都无所谓了。而他的那篇文章更是使得今天整个量子领域能够感觉良好的一个重要里程碑,因为物理学界声称那篇文章预言了电子正反自旋以及正电子的存在。
但另一方面,既然我们现在知道了狄拉克所采取的量子化的操作所依据的薛定谔方程其实也只是在一定程度上反映了自然,而不是过去大半个世纪里物理学界试图让世人们以为的那样完全真实地反映了自然,那么看来狄拉克的获奖文章的成功的运气就不仅仅是碰巧错过了相对论动量的缺陷那一条了。
人的一生中确实很多时候要凭运气取得成就,但是如果整个物理学界把自己的成功建筑在想象出的运气上的话,就难免会出现20世纪物理学的一地鸡毛的状况【[28],[29],[30],[31]】。
4.2.1. 2013年我对狄拉克获奖文章的讨论
我将我2023年对狄拉克的获奖文章的讨论进行了整理,并将其放在附录IV中,其中就有物理学界所声称的狄拉克预言电子正反自旋以及正电子的存在所出现的形式。
顺便提一下,2023年我讨论狄拉克方程时的一篇重要的参考文献是由名叫Kevin S. Brown建立的著名科普网站mathpages.com上的一篇题为“The Dirac Equation”文章【[32]】,其中他将狄拉克的量子化关系表达为:
(**)
而他的出发方程为: (***)
因为(***)本身就是一个方程而不像上面提到的狄拉克文章【14】中的那个F只是一个被他称为相对论化的哈密尔顿函数的非零的数学表达式而已,所以Brown在他的文章中将(***)因式分解后再用(**)对其进行量子化而得到他的下面这个方程(6)就显得不那么突兀:
当然,那篇文章的作者如狄拉克本人一样,完全不知相对论存在的问题,更不知薛定谔方程有什么缺陷了。他仅是努力将狄拉克的原始推导修改得让一般读者更不觉得别扭而已。
5. 结束语
薛定谔,费曼,和狄拉克三个人对于薛定谔方程的推导的两个个基本的共同特点:其一,他们不但都从经典力学的数学框架出发的而且还都努力营造他们的推导与经典力学有着天然的内在关联;其二,作为他们的方程的基本变量的波函数ψ没有任何实际的物理意义,从而需要人为额外地定义它的物理意义,这就为哥本哈根学派对薛定谔方程最原始的意义进行修改提供了机会。但另一方面,薛定谔,费曼,和狄拉克的思维方式或者说他们之相关学术作为的哲学指导显然与对他们所推导的结果的物理意义进行修改的哥本哈根哲学是格格不入的。这是因为经典力学所依据的经验基础就是连续性的决定论力学,而哥本哈根所倡导的不但不连续而且连决定论都被否定了。非要将这两种几乎是水火不相容的哲学理念形塑为水乳交融的一体本身就是荒唐的,是20世纪物理学的一个典型特征。当然,通过本文前面的讨论我们现在知道薛定谔费曼和狄拉克他们所要营造的来自经典力学的基因本身就缺乏合理的逻辑依据,而哥本哈根的概率波诠释也已经被阿秒实验打了脸【[33],[34],[35],[36]】。但这并不能否定这样一个既定事实:包括费曼狄拉克和哥本哈根学派在内的20世纪物理学主流的精英们居然可以心安理得地让他们努力营造为经典力学的私生子的薛定谔方程和他们对薛定谔方程的波函数进行的概率诠释这两个在哲学逻辑上完全对立的概念相安无事地共处一室大半个世纪,且将它们共同编入中学以上的物理学教科书!20世纪的物理学就是这么样地一地鸡毛。
上面这段讨论是尽量往好了看。如果再悲观一点,我们甚至似乎可以看到这样一幕超现实大戏:两拨物理学家们分工合作,由一拨人用连续性的经典力学为幌子得出一个令人容易接受的貌似天然合理的方程,然后把接力赛的棒子交给下一拨人来借壳上市偷换概念,将连续的确定性的经典物理的方程中的变量诠释为不但不需要连续而且可以随机出现在任意点处的变量。有人把历史描述成可任人打扮的小姑娘,而在20世纪物理学家手中的物理学成了可以任人揉捏的橡皮泥。。。当然,如前所述,这是一种过度悲观的想象。实际上,薛定谔,费曼,狄拉克,以及哥本哈根学派他们只是在客观上形成了这样历史上既成事实的分工合作,但在主观上并不存在任何故意违反科学逻辑的愿望,只不过由于他们的历史局限性而一不小心把20世纪的物理学搞成了一地鸡毛而已。
附录I. Derbes补推薛定谔的(16)式
Derbes先按照我前面提到的薛定谔文中的(9)式的思路,取波函数
这里的S相当于薛定谔文中的哈密尔顿函数W,这里的就等于h/2π,a就相当于薛定谔的(9)式中的A。他只考虑一个自由度(一维)的情况,所以将薛定谔文中的(3)表达为:
其中U为势能,m为质量。由上面的(3.3),我们不难得出文中的(3.5):
接下来他将(3.4)中的平方项改写为,其中是的共轭复数。这一步对原文算是有一点修改,因为在薛定谔的原文中只有波函数ψ是复数,哈密尔顿函数W并不是复数。不过考虑到薛定谔的(3)式本身就不是严格推导出来的,这点修改是没有问题的。
接下来他按照薛定谔文中的(4)式的思路并运用上面修改后的平方项将上面的(3.4)式改写为:
接下来他运用了复数求导的这个知识:(F*)’ = (F’)*, 1/F* = (1/F)*,并运用(3.5)式,由(3.6)式得出文中的(3.7):
然后他将(3.7)整理后得到:
然后,他将(3.8)式的左边命名为M,并将它对x进行积分,并将该积分命名为T:
到这一步为止,他的推导应该还算是中规中矩。但是下面这一步就有点不太规矩了。
他将ψ*作为一个广义坐标,从而将(3.9)式看作是拉格朗日方程,并对之运用欧拉-拉格朗日公式,从而得到:
将(3.9)式中的M代入(3.10)式我们便可得到:
这就是薛定谔的(16)式的一维形式。
我之所以说上面这步不规矩,是因为(3.8)式已经限定了M=0,这时他就不能再对(3.9)式运用欧拉-拉格朗日公式了。
此外,Derbes之所以会替薛定谔补上由薛定谔的(3)到薛定谔的(16)的推导应该是因为他意识到了薛定谔在他自己的文中选了最简单的波动方程(15)式以后的推导与之前所讨论的哈密尔顿力学并没有直接关系,因此想要帮助薛定谔来重塑其著名方程与哈密尔顿力学之间的关系。但是,Derbes他没有意识到的是:
首先,他所用到的薛定谔的(3)本身就不是严格地按照薛文中的(2)式推导出来的(因为按照他的(2)式,薛定谔的(3)连单个粒子的在引力场中的自由落体运动都不满足。。。当然,也正是因为薛定谔的(3)式本身就是凑出来的,Derbes将它稍作修改也就无妨了);
其次,Derbes他自己任意选定(3.3)为波函数的表达式本身与薛定谔选他的(15)式同样属于是凑出结果来,而不是严格地从哈密尔顿力学推出结果来的。相应地,Derbes也就并未能比薛定谔本人赋予薛定谔方程与哈密尔顿力学之间的更紧密的逻辑关联。
附录II. 费曼对薛定谔方程的推导
首先,费曼的出发点不是薛定谔的文章,而是一个据称是来自狄拉克一篇题为“The Lagrangian in Quantum Mechanics”的文章【14】的在时间域内的积分变换:
接下来费曼假设(4.1)中的=,其中等号右边的指数函数与前面(3.3)中的指数函数一样,S为拉格朗日作用积分。相应地,在很小的一个时间间隔ε里我们有:
其中拉格朗日函数L = K – U, K是运动粒子的动能,U是运动粒子的是能。因为时间间隔ε很小,我们有:
将(4.3)代入到上面费曼对G(x,y)的猜测中,我们有:
(4.4)等价于下面的(4.5):
然后,费曼将(4.5)式中的第二个指数函数针对ε进行泰勒展开:
将(4.6)代入到(4.1)中之后我们得到:
考虑到和ε都很小,费曼(合理地)认为(4.7)中的第一个指数函数只有当x – y也很小时才对积分有明显贡献,因此,他令x – y = ξ 以便对小ξ值时的积分进行考察。相应地,(4.7)便被改写为:
然后将(4.8)中的针对小ξ进行泰勒展开,我们可得到:
按照费曼在他的诺贝尔奖获奖讲座上给出的故事,到这一步时他发现按照他最初所做的假设= 有问题,因为(4.8)和(4.9)会导致
(4.10)左右两边是不等的。所以,他知道需要在他最初的假设中引入一个常数。于是他将最初所做的关于G(x,y)的假设做了修正为:
这样就可以解决(4.10)左右两边不等的问题了。然后对(4.8)中的势能U取一个(合理的)近似:,我们可以得到:
其中第一个积分得出的常数系数与费曼新引入的系数A抵消了,的第二个积分为零(读者可以自己验证)。然后用下面这个积分公式(读者可以用各种AI积分软件去验证这个公式,我验证后没问题):
我们可得出(4.13)的最后一项为:
这样费曼就得到了:
将(4.16)整理一下,我们有:
当ε趋于零时,(4.17)就是前面我们给出的薛定谔方程的(*)式。
上面的整个步骤我都检验了一遍,没有发现如前面一节中Derbes对M=0运用欧拉-拉格朗日公式那样明显的不规矩之处。
附录III. 关于狄拉克“The Lagrangian in Quantum Mechanics”一文的困惑
我本人感觉狄拉克的早期文章(如他获得诺贝尔奖的那篇文章)还比较容易读,而他发明了关于所谓的算符(operator)数学的Braket之后,他的文章读起来就很别扭了,他的“The Lagrangian in Quantum Mechanics”【14】这篇文章就是一个很典型的例子(至少对我来说是这样的)。
我在之前分析薛定谔的诺贝尔获奖文章时曾指出,薛定谔该文中的(7)式与(2)式是矛盾的,他是无法严格地由(2)式得出(7)式的,但是,薛定谔愣是用一句“众所周知”作为推导逻辑来直接给出(7)式。在狄拉克的文章【14】中,我又看到了薛定谔用过的那种 “众所周知”逻辑。
比如,按照哈密尔顿-力学,我们有所谓的汉密尔顿运动方程的标准形式:
(III*)
但是,在狄拉克的上述那篇文章中,他用下面这个类似薛定谔的“众所周知”逻辑给出了一组关系(其中的方程序号为狄拉克上述文章【14】中的方程序号):
Let the two sets of variables be pr, qr. and Pr, Qr, (r = 1, 2 ... n) and suppose the q's and
Q's to be all independent, so that any function of the dynamical variables can be expressed in terms of them. It is well known that in the classical theory the transformation equations for this case can be put in the form
where S is some function of the q's and Q's.
乍看起来,狄拉克的(1)与真正众所周知的哈密尔顿方程(III*)似乎很像。但再仔细一看,它们基本不搭嘎。(III*)中的qi和pi是相空间中任意点处的(广义)空间位置和动量,而狄拉克的(1)式中的qr和pr与 Qr和Pr是同一相空间中的两个不同点上的空间坐标和动量。哈密尔顿方程中的任意点i上的H是qi和pi的函数,而狄拉克的(1)式中的S则同时是任意两个独立点的qr和pr与 Qr和Pr的函数,它的意义是在qr和pr与 Qr和Pr之间做变换的函数:
这里让我感到别扭的是:既然你说qr和pr与 Qr和Pr是相互独立的两个点,那么它们应该是可以互换的,在这个前提下它们表达式应该是对称的,但为什么(1)式中的两个式子不具对称性,而是一个有负号一个没有? ---- 这是我在读该文时的一大困惑之处,写出来希望能对其它不熟悉狄拉克文章的读者起到一点提醒作用。
该文中唯一看起来与费曼的(4.1)式联系得上的只有它的(12):
但我还是无法将狄拉克的(12)与费曼的(4.1)直接联系上。所以,将这些问题写在这里,如果有读者对这个问题熟悉,欢迎出来解惑指教。
附录IV. 作者2023年对狄拉克方程推导过程之思路的讨论
首先,狄拉克选了一个哈密尔顿函数:
(IV.1)
其中A0和A是电磁场的势能,e是电荷,p是动量,W是能量。
狄拉克对(IV.1)做了如下的量子化(quantization)的操作:
(IV.2)
并令量子化后的哈密尔顿函数为零从而得到:
(IV.3)
这就是量子化的一个奇怪操作。要知道前面关于F的原始定义本身是不会等于零的,这里之所以能等于零是因为他的所谓的量子化过程引入了复数。经过这么一番操作,原先的相对论化的经典力学哈密尔顿函数就成为了量子力学的哈密尔顿函数
他略去电磁场势能后得到:
(IV.4)
其中的
狄拉克做了一个线性假设,声称相对论要求p0, p1, p2, p3都是对称的,所以哈密尔顿函数必须是线性的,所以(IV.4)可以降阶为:
(IV.5)
其中α1,α2,α3,和β独立于p0, p1, p2, p3。接下来他又做了一个假设:他说由于这里考虑的是粒子在真空中运动,所以哈密尔顿函数不应该含有t, x1, x2, x3,所以α1,α2,α3,和β也独立于t, x1, x2, x3。根据这一点他认为我们应该可以将(IV.5)式扩展为:
(IV.6)
从上面(IV.4)到(IV.6)的操作我们可以看出,狄拉克很奇怪地把原本可以一步进行的因式分解化作两步:先用一个线性假设将(IV.4)降幂为(IV.5),再用一个线性假设将(IV.5)升幂为(IV.6)。
狄拉克在将(IV.4)变为(IV.6)的过程中提出了两个线性假设,它们对于因式分解来说是不需要的,因为将(IV.3)直接进行因式分解其实严格来说并不需要线性假设的,因此狄拉克的这两个线性假设是为他接下来的推导所做的假设而已。
将(IV.6)展开之后与(IV.4)对比,我们可以得到:
(VI.7)
狄拉克进一步将β取值为:
(IV.8)
则上面的关系变为:
(IV.9)
接下来他做了一个逆向逻辑操作,这一操作使得他的推导完全就不是一般的逻辑推导,而是一种构造。而他之所以进行这种构造的原因很显然是因为他事先已经知道了泡利大师的旋转矩阵所具有的特性。他首先选取泡利大师的下面这三个著名的旋转矩阵:
(IV.10)
这三个矩阵满足下式:
(IV.11)
于是狄拉克声称(IV.11)和(IV.9)是一样的。当然,这里他打了马虎眼,因为(IV.9)是单纯数值之间的关系而(IV.11)是矩阵之间的关系。(IV.11)中的1不是数值1,而是单位矩阵。接下来他将泡利矩阵进行扩展:
(IV.12)
并按照上面三个矩阵另造三个:
(VI.13)
他接着又再打马虎眼,令:α1=ρ1σ1, α2=ρ1σ2, α3=ρ1σ3,。这里的马虎眼比较大,因为他将前面用来表示单纯数值的α1, α2, α3转身一变成为了矩阵,而且是4阶矩阵。狄拉克接着指出它们满足和(IV.9)一样的关系:
(IV.14)
然后他将经过改头换面的α1, α2, α3 和β 代入(18)式,便得到:
(IV.15)
其中的σ代表的是(σ1, σ2, σ3)。(IV.15)式就是著名的狄拉克方程的最原始的形式。
到这一步为止,狄拉克既没有涉及到电子的任何特性,甚至也没有涉及到洛伦兹变换或任何狭义相对论的要素,这使得狄拉克感到有必要在得出(IV.15)式之后马上在文章【18】的§ 3. Proof of Invariance under a Transformation.来证明(VI.15)式符合洛伦兹变换。
在证明了(28)式符合洛伦兹变换之后,狄拉克才在文章【18】的§ 4. The Hamiltonian for an Arbitrary Field 中重新引入电磁场势能从而开始讨论与电子有关的议题。在这一节里他得出了电子的他称为“貌似”旋转的力矩表达式。
然后在§ 5. The Angular Momentum Integrals for Motion a Central Field.狄拉克开始讨论环绕中心运动的电子,也就是氢原子轨道上的电子的角动量守恒。在这推导过程中首先他强调只是周期运动,其次这过程中没有涉及到他所谓的动量的导数。在这一节中他得出电子正反自旋(正负)h/2的形式。
在§ 6. The Energy Levels for Motion in a Central Field中狄拉克开始讨论环绕中心力运动的电子的能级问题。
这里我可以看出:所谓的狄拉克方程预言了原子轨道上可以有自旋相反的电子是因为狄拉克人为地在他的方程中引入了泡利大师用来表达旋转的矩阵,而不是直接推导出了的。而他能得出电子的反粒子即正电子存在的结论是因为(IV.6)式中包含了能量值(或质量值)的正负号相反的两个方程。
当然,我们也不能因为上述的方程是构造出来的而且是逆阶构造出来的而否认它是推导出的,毕竟我们可以将(VI.15)拆为16个非矩阵的方程,每个方程又都是和(IV.4)式一样。
这里最随机的一步其实就是他选择那个哈密尔顿函数,其中的所谓相对论动量只是一个被称为动量但实际并非动量的数学表达式,而其中的相对论能量也只在非常有限的范围内真正具有能量的意义。这就决定了狄拉克的哈密尔顿函数肯定不会在一般的情况下满足最小作用原理所苛求的能量守恒。不过,在狄拉克所针对的真空(带有或不带有电磁场)中运动的单一带电粒子来说,他所选的哈密尔顿函数中的能量具有实际意义。当然,狄拉克并不知道真正的质量能量关系不应该是E = mc2,而应该是E = mc2/2。