提到守恒定律大家一定会想到能量守恒和质量守恒,而且或许也会想到当信息产业刚刚开始兴起时常听到的一句话:“信息与能量的最大不同之处在于它是不守恒的。”人们对于信息之不守恒的最大兴趣在于信息可以分享,而这一特点使得信息不但更容易被善意地分享,也更容易被不善意地盗窃。
既然信息之不守恒似乎已经成了定论,我这里怎么又提出一个信息守恒定律呢?这是因为信息确实具有守恒性,只不过与能量和物质相比起来,信息的守恒性表现在更高的层次上,而且具有较大的不确定性。但是,与能量守恒和质量守恒是自然界的一个基本定律,是几百年前帮助近代科学腾飞的一个有效工具类似,对于那些对抽象和发散性的社会问题的理性研究或甚至是量化分析感兴趣的人来说,信息在更高层次上的守恒性也是一个可以提供帮助的基本定律---尽管它不具备能量和质量守恒的那种数学上较严格的确定性。
信息守恒的基本意义是信息量的守恒。比如,我现在写的这篇文章放到网上之后,会有不止一个读者来读这篇文章,也就是说本文的信息被分享了,这就是人们认为信息与具有守恒的不可分享的能量和物质的不同之处,但是不管有多少读者读本文,他们所读到的本文的信息量是确定的,这就是信息守恒的意义。具体地说,不管有多少读者读了本文,本文所说的“信息守恒定律”就只有一个。当然,一篇文章可以含有很多信息,而这里提到的信息量本身也是一个不象一桶牛奶的斤两那样容易确定的量;尽管如此,从理论上来说它仍然是一个具有一定的确定意义的量,就好比尽管英伦岛的边界的长度是一个严格说来无法确定的量,但那并不妨碍英国人去估算他们的海岸线的长度一样。不过,从量的大小来看,一篇文章的信息量或许比起英伦岛的边界长度更确定一些。
如果需要的话,我们也可以象非线性数学家们在分析英伦岛的边界的长度[1]时那样地用分维的概念来估算一篇文章中的信息量(除了分维的概念之外,相信大家也可以从所谓的信息学的文献中查到各种计算信息量的公式[2]----尽管不一定适用于计算一篇文章中的信息量这种高度不确定的量),从而给出一个对于信息的守恒意义的能够让习惯了能量守恒的人们心里感到稍微更踏实一些的数学表达式来。但是,我相信在大多数的日常生活中信息守恒的概念本身将比与之相关的复杂的数学表达式更有实用价值。
如同能量的概念可以用于自然界(即我们所说的能量守恒关系中的能量)也可以用于包括社会能量在内的更为广泛的环境中,信息的概念本身也具有极为广泛的含义。在英文中人们甚至会试图把信息分为“message”和“information”两个不同的概念,另外,信息即可以是抽象的(如一本书里的内容)也可以是直接的物理作用(入你踢球的时候就给了球一个使之产生运动的信息,电磁场中的物体通过交换光子而发生作用也是一种信息的交换)。而本文里所说的信息是最一般意义上的信息。如果你非要象某些人在特定环境中把英文中的“message”和“information”分为两个不同的概念的话,那么我这里所说的信息应该是那个更基本的“message”的意义,但是在本文的内容环境中我这里并不把message与information进行严格的区分,因为在开放性的社会文化环境里,任何信息都可以有它的特殊的功能,而这个功能本身就有特殊的意义。比如,张三说前面着火了,李四也说前面着火了。按照那些把把message和information区分开的人的需要来看,张三和李四给了两个message,却只有一个information。但是,在更一般的开放性的社会文化环境里,两个人说一件事本身就带有比一个人说一件事更多的信息。所以,在本文的环境里,对于英文中的message和information不加质的区分,而是加以层次上的区分,也就是说information本身也可以是message,而字面上相同的message可以因背景不同而具有不同的information。比如,前面举的例子中,在最底的层次中,我们有两个message但是只有一个information,但是在更高的一个层次中,不但两个message合在一起构成了一个具有新的information的message,而且每个message因其背景不同而具有不同意义(比如张三爱说谎而李四诚实)。熟悉信息产业(IT产业)的读者对于这样的处理应该不会陌生,因为在信息产业中只有数据(data)和逻辑(logic)的区分,并没有把message和information做严格的区分-----尽管由于语言表达的需要在一些特定场合下也会把message和information分开来说。
另外,从形而上的角度来看,信息守恒与能量守恒的主要区别是守恒量与载体之间的关系。能量(以及质量,动量)的守恒的意义在于守恒量无法在载体间复制因而当守恒量在载体之间传播时各载体所具有的量的总和不变,而信息守恒的意义在于信息的传播过程中其原始信息量所表现出的守恒性。实际上,与守恒的能量的另一个极大的不同是,信息不但可以分享而且可以衍生出新的信息,这就为任何打算要对信息的守恒进行数学表达的人提出了一个新的挑战。但是,不论是能量(质量,动量)还是信息量在传播过程中守恒特性都可以统一地表达成:
流入系统的量 -流出系统的量 =系统中增加的量 - 系统中产生的量 + 系统中消失的量
实际上这是一个形而上的公式,如果你愿意的话也可称之为哲学公式(尽管听起来可能有些别扭),因为它只是一个基本逻辑的表达,与守恒量的具体计算无关。因为这是一个线性关系,所以唯一的前提条件是公式中的量具有可分辨的确
定的单一性,也就是说具有线性可叠加性。那么信息具有线性可叠加性吗?对 于象电讯中的有线或无线的讯号或者IT业的数据这些特殊的信息子集来说,它们的线性可叠加性是明显的。对于更 一般的信息(比如一篇文章的信息量)来说,就像对于包括社会能量在内的一般能量来说,我们很难说它本身到底是线性还是非线性,但是,对于我们所关心的任何一个局部的信息来说,它们显然 又都具有线性特征。这是因为尽管不同的信息之间可能有复杂的关系,但是当我们认识到它们时,我们是以线性的眼光来理解消化和运用他们的。比如说质能之间可以转换,但是对于我们的认识来说,质量是一个单独的信息,能量是一个单独的信息,光速是一个信息,而质能转换关系又 是一个单独的信息。当我们把这些信息量输入电脑中,尽管我们要计算质能转换时涉及到非线性的光速项,但是每一步计算指令的每一字节又都是线性的。所以尽管信息作为一个抽象的概念本身到底是线性的还是非线性的这一点可能不是一个清楚的问题(甚至可能不是一个有意义的问题),我们所关心和要掌握的信息内容却都是可线性叠加的,所以从原则上来说对信息量运用这里所说的守恒关系是没有问题的。
当上述的形而上的守恒公式被应用于不同的对象时,所不同的只是上述那个量及其产生和消失的机制。对于能量来说,系统中产生的能量一定是发生了某种形式的功能转换(比如,核裂变产生的质能转换)的结果,而系统中消失的能量更确切地说是有用能量的耗散(比如,散热);对于信息来说,系统中产生的新的信息量的机理就比较复杂些,因为它不但与所谓的产生源有关,还与接收者的理解有关(比如读者可以从一篇文章中读出作者没有想到的意思来),而系统中信息的消失的方式也很多,比如说假如此刻一颗陨石砸到我的屋顶上,那么我现在写的这篇文章中的所用信息就随着我一起呜呼哀哉了。
另一方面,即便在自然科学中,尽管对于可计算的能量,质量和动量来运用这里的守恒关系式可以得到的一个漂亮的一般数学表达式(纳威斯多克斯方程式),人们也根本无法直接运用那个方程式,别说解析解,就是数值解也不是完备的,而只是运用对那个一般的方程式进行某些条件下的简化而得到的方程式(如流体力学中的伯努利定律)。虽然与能量(质量,动量)比较起来,信息的概念具有很强的不确定性,但是这也不等于我们就无法运用信息这个难以严格定义的哲学概念来对实际的生活问题进行思考和指导。如同一般性的能量守恒和质量守恒在特定的条件下可以产生简化的形式从而在一定范围内给人们带来一定的实用效果一样,信息守恒律在特定的条件下的简化也同样可以产生特定范围内的实用效果,而所谓的信息工业(也叫做IT产业)和电讯业就是信息守恒律可以得到非常有效的简化应用的很好的实例。比如,电讯传播过程中的信息量就可以被估算得相当地精确,在这种情况下如果想要运用这里提到的形而上的守恒关系的话,当然就可以是象能量,动量和质量守恒一样地相当地精确。
而我的兴趣主要是包括学习,思考,分析,经济,文化等过程在内的开放性的智能和社会人文活动和系统中的信息问题。对于这些问题来说,虽然如前所说,从原则上来说,那个守恒关系是存在的,但是我们可能却很难或无法对所涉及的信息量本身进行计算。但是,这也不等于说我们就不可以运用那个守恒公式所表达的守恒意义来指导我们的生活实践。这就好比我们通常并没有严格地按照固定的模式计算来规范我们的游泳姿势,但是我们仍然可以根据对于游泳的一些基本原理的理解来改进和提高自己的游泳技能一样。而我个人在过去十多年里的切身的实践经验也告诉我这是完全可行的而且会给我们的日常实践带来很大帮助的。
我曾在博客文章中提到过,过去这些年来我在IT工作中最以为得意的强项就是troubleshooting(查错),不知多少次我只花了数天甚至数小时就找出了写系统的人本人花了数星期无法查找的错误,而这种能力在很大程度上就是对于信息的守恒在IT产业中的简化形式:数据守恒(data conservation)的理解和运用。
除了IT业的查错之外,数据守恒(data conservation)律对于学习新的知识和技术也是极有帮助的。若干年前我到华尔街日报的电子版工作,我的第一个任务就是用Cognos(一种数据报告软件)做datawarehouse(数据仓库)的工作。经理知道我从来没有用过Cognos,所以让一位使用Cognos的专家来训练我,并对我说开头两个星期的主要任务就是学好Cognos,但是第二天那位训练我的人就对我说,“你已经是专家了,我不需要再训练你了。”当然,这与我本人对于数据库知识的掌握有关,但是经理是知道我懂数据库的,所以比起他预期来说,我学的算是快的。
就在写本文的两个月前我接到一个小项目,要我用Raphael,一种我从未用过的Javascript的软件来给一个网站做很复杂的界面(UI),我告诉对方说我从未用过该软件,所以对方找了一个人来教我,不过我开始这个任务的第二天他就要去休假,而休假前他还要忙别的事,所以他在休假前唯一能帮我的就是帮助我设置他们的系统环境及交代任务,然后告诉我在他不在的时候我只要在系统中“play around”就行了,等他回来再教我。可是8天后他回来的时候,我不但已经完成了他们预期我要花6个星期才完成的项目,而且那个要教我的人已经不敢再提教我一事了,因为我显然比他更懂Raphael这个软件了。
举这两个例子不是为了自夸,而是因为我之所以能够在年过半百之后仍然比很多年轻人更快地掌握新的知识(短时间内成为专家)的一个重要的原因就是对于信息守恒定律,尤其是作为它的简化形式的数据守恒律的掌握。很显然,今天的主流世界对这一定律缺乏基本的了解,其中一个很典型的普遍现象就是人们在找工作时,雇人的经理们往往会强调对于具体知识和技术细节的了解和掌握而不能根据一个人的实际学习能力来选择候选人,结果能够背书或花大量时间在网上学习面谈问题(Interview questions)的人比实际工作能力强的人更有机会获得工作,而这种社会负选择必然增加社会的消极(我的公平分析[3]对这方面有专门的讨论)。可以不夸张地说,这种负面的社会选择是人类进入21世纪后所出现的各种危机的一个哲学根源。
其实,信息守恒律不但能帮助IT业人士更有效地工作,可以帮助人们在更一般的领域中尽快掌握新的知识,而且也使我的哲学认识与学习受益非浅。去年的这个时候我刚开始比较认真地接触存在主义(尽管之前也曾读过萨特尔的《存在和无》,但是并未认真对待之),而在两个月前我已经开始非常自信地对海德格尔进行比较系统的批判了。如我在批海的文章中指出的那样,对我来说批海与做IT业的troubleshooting(查错)非常相似,其中一个原因就是这两种活动都受益于对于信息守恒律的理解。
其实,我在几年前就在博客文章里提出信息守恒的概念了,只不过从来没有人注意到过而已。近来我又在找工作,所以又一次体会到了人们因为缺乏对于信息守恒律的基本了解而进行的社会负选择的痛苦,所以就把这个概念以更加明确的形式表达出来,真心地希望能够对于人类更加理智地迈向未来有所帮助。。。。。。