本文为原创,引用或转贴请私信。
过去和现在都有过许多语言,有些能够成文字,有些始终存在于口语中。
当我们关注于语言的区别的时候,一些要素是判别的基础。比如:
音素 - 最小的声音单位,例如 “狗” 中 “g”,“ou” , 或者 “d“,”o“,”g“
音节 - 口语中比音素大的单位,例如 “狗”,“猫”, “锅” , 或者”dog“, ”cat“
字 - 一个语义单位,能够表达某种意思。如”鲜花“,”太阳“,或者”water“,”history“
图片 - 要表达的意思的图像。
书写语言 - 当我们提到书写的时候,首先要知道口语和字母表之间的差异。根据不同语言字母表的拼音,同一个意思我们可以写出许多不同的语言。我们可以写英语或法语,或印度语,或西班牙语,或任何语言。也有一些语言可以同时使用两个不同的字母表书写:例如,塞尔维亚语同克罗地亚语是一种语言,其中一个使用拉丁字母(书写),另一个使用西里尔字母(Cyrillic alphabets,俄语也属于西里尔语系)。
因此,如果想要发明一个新的文字系统,就应该包括:
标志或图案的系统 - 你的符号要能够代表单词或单词的一部分。如:象形,就要像它们所代表的东西;你的符号也可以表示一个词的声音;也可以直接抽象表示要表达的东西。
音节系统 - 即音标,用于口语发音的符号,这用来表示这个词的声音。
字母系统 - 目前存在两种类型,一类仅有辅音;而最常见的是同时具有辅音和元音。每个字母符号对应一个音素。
换一个角度再来表达上面的意思:
字母、音节、语标、象形、表意文字、这些要素也可以这样分类:
表音文字 - 每一个符号表示不同的发音,一般包括:
字母 - 比如拉丁语,希腊语,腓尼基语
音节 - 最基本的发音元素是一个音节,可以用一个或者一组符号代表一个音节
与此相反的是:
语素文字是代表一个字的含义,但并不能表明它的发音。现在仍然常用的比如有“¥”、“$”、代表金钱的单位;“%”、代表数学符号
象形是它们最初的表示方式之一,如简化画面?为太阳
表意文字是用一个符号代表一个完整的意思,最常见的交通标志就是一个例子。
此外,还有一种按照一定规律,但是多用于娱乐休闲场合的语素转化:
画谜体 - 又称书迷体、神智体。是利用图画、符号和它们的组合来表达意思或者形象的书写方式。比如:
“CCCSAILINGCCCC” 代表 Sailing in the seven seas
“LIE KING” 代表 Lion King(狮子王)
我国古代文学中也有类似的创意,比如:
桑世昌《回文類聚》卷三:神宗熙寧間,北朝使至,每以能詩自矜,以詰翰林諸儒。上命東坡館伴之。北使以詰東坡,東坡日:「賦詩,亦易事也;觀詩,稍難耳。」遂作《晚眺》詩以示之。北使惶愧莫知所云,自後不復言詩矣。
这首诗读出来是下面的断句:“長亭短景無人畫,老大橫拖瘦竹筇;回首斷雲斜日暮,曲江倒蘸側山峰。”
这里还有一首神智體的民歌,代表的是什么诗句呢?
决定符号 - 这是一种辅助符号,与主要符号组合在一起,辅助解释主要符号的意思或者类别。中文中的部首就是一种决定符号。比如 “她” 中的“女”,“稻”中的“禾”;古埃及圣书体中也有类似的应用,比如:
另外赫梯语中也存在类似的情况,添加如词汇中的某些符号并不代表发音,而是为了确定单词的类别。比如,代表这是一个城市名称;代表这是一个男人名字(类似Mr.)
下面是一些有着悠久历史的书写语言的简单背景。
埃及象形文字 - 由语素文字 + 音节文字 的组合,当然还需要配合发音的音标字符。但古埃及文字音标中没有单独的元音。埃及语言的发明者使用“决定符号”或者更原始的“形意符号”来明确要表达的词的意思。
楔形文字 - 由语素文字 + 音节文字 的组合。最初是纯图形文字,进而经过长时间的不断简化,逐渐形成了成熟的楔形文字。成熟的楔形文字中也应用了一定量的“决定符号”。
汉字 - 基本上是纯粹语素文字,每一个字符都代表特定的意思。古汉字的字符也代表发音(古汉语多用「读若法」或「直注法」为汉字注音)。
为什么现代世界上以字母为主的书写系统占有数量上的绝对主流?是什么把它与其它书写系统区分开来?字母书写系统组成的词汇仅仅表示声音,其中一个个字母符号也同现实世界没有任何关联。而上面提到的语素文字系统中,其中一个符号则代表一个明确的事物或者行为;另外,字母系统也不像前文提到的音节文字系统(注1),需要对语言中每一种不同发音的音节赋予一个特殊的符号,这样往往一门语言就需要几百,甚至几千种符号。字母书写系统仅仅有20、30几个代表不同发音的字母。对于一个事物,如果你知道它怎么读,你就能够写出来。这是不是比其它两种文字系统的准入门槛要低好多?
注1:日语、汉语都大量使用音节文字。日语的平假名与片假名都代表日语中不同的音节;汉语在汉语拼音没有发明之前,可以认为每一个汉字都是一个音节。另外,希腊迈锡尼文明的线型文字B、北美印第安人中的切诺基族、彝族的彝文、湖南女书都是纯粹的音节文字系统。
世界上已知最早的字母文字系统是大概于公元前1700年出现的青铜中期文化字母Proto-Sinaitic,它与古埃及文字中僧侣体近似,学术界有观点认为它们之间有继承关系,但这个看法至今存在争议。基本可以肯定的是,后期的迦南/腓尼基语Canaanite/Phoenician多半源自于这套字母文字系统。很可惜的是,古文字学家普遍认为它是一套仅仅有22个辅音字母的“丑陋”的发明。
字母文字系统的辉煌开始于古希伯来语Hebrew和古希腊语的发明,其它如拉丁语、伊特鲁里亚语Etruscan、古意大利语系都继承自希腊语。尽管上古语言文字间的相互影响关系至今仍然不很明确,但人们普遍认为希腊语是绝大部分字母文字的始祖。这个原因大概与希腊语是第一个引入元音字母的文字有关。尽管如此,我们也要明确认识到希腊语也是受到腓尼基语的直接影响而发明的。
当今最流行的字母文字系统 - 英文是属于古代的拉丁/罗马字母语系,这个语言系统大致产生于公元前6世纪,由伊特鲁里亚语派生出来。
现今也有一些语言属于上古语言系统的“活化石”,比如埃及的科普特Coptic文字系统。他是由仍然生活在埃及的古埃及人的后裔保存的语言。这些人是在阿拉伯穆斯林征服古埃及王国之后,存活的最后一批基督教信徒。他们语言的名字 - 科普特,也是阿拉伯语中“埃及”的含义。科普特语属于古埃及语言文字的简化版,从古埃及世俗体文字(注2)派生出来,由结合了后来希腊征服者的语言特性(它的字母体系由7个古埃及世俗体字母同希腊字母组合而成)。
注2:古埃及世俗体文字是由圣书体与僧侣体派生出来。古埃及文字系统从公元前4000年一直在埃及地区应用到公元11世纪,直到被阿拉伯人征服。
值得提到的一点是,上古的文字系统往往都不具备完善的语法结构。它们给现代人的印象多类似为一种“要点速记”,因为当时的所谓文章,你很难通顺地一句话,接着一句话地读下去。但你也要想到,毕竟上古人类生存在一个以口语为主的社会里,只有极少极少的人才会书写,就更别提“文学素养”了。
最后再提出一个问题:为什么出土的上古时期的石碑中的碑文都使用多种语言重复相同的内容?比如罗塞塔石碑Rosetta Stone 或者 波斯大流士墓碑the tomb of Darius(注3)。难道是为了让后世的考古学家能够更方便地破译语言的秘密吗?
注3:罗塞塔石碑上用希腊文字、圣书体和世俗体雕刻了相同的内容,这样考古学家才能通过对照希腊文字与古埃及文字的关系,打开了破解古埃及文字的大门;波斯大流士墓碑也发挥了类似的作用。
未完待续
附上期答案:
夜長枕橫意心歪,斜月三更門半開。
短命到今無口信,肝腸望斷沒人來。
那么古人最初发明文字的目的是什么?通过观察分析天马行空的史前文字,我们又能读懂什么?
“文如其人”,没错!也让我们通过文字看看史前的古人各自有什么特点。大体来说,在绝大多数史前人类的观念中,文字的起源很神圣。一个古人如果具备书写的能力,会被他人认为具备强大的力量。要想解密史前文字中齐齐怪怪的符号,以下因素是必不可少的条件:
- 精确copy副本
- 一个熟悉的语言作为参照物
- 邻近的、或者相交叉的文化圈内的名人、地名、以及其它专有名词的描述(作为分析的突破点和参照)
- 双语或多语石碑铭文(能找到这种碑文,是考古专家的运气),就像下面这2个例子:
但是,也要警惕这个习惯 - 一旦在石碑上发现不同语言的雕刻,就认为一定会是相同的内容。下面这个石碑上分别用圣书体和世俗体表示了不同的事情(这块碑曾经让某些历史专家闹了大笑话)。
注1:图片取自大英博物馆,详细信息请见http://culturalinstitute.britishmuseum.org/asset-viewer/stela-fragment-of-horiraa/XQHlc68EDsleqA?hl=en
很遗憾的是,玛雅文字的破解是没有任何“先入为主”的资料可供帮助的。
注2:图片取自大英博物馆,详细信息请见http://www.britishmuseum.org/research/collection_online/collection_object_details.aspx?objectId=655434&partId=1
唯一的帮助可能就是错误百出的殖民地教士总结的玛雅文字与西班牙语的字母对照表。
于是,经验丰富的历史,以及文字专家总结出了一个史前文字创造者们普遍采用的创作形式 - Rebus Principle书迷定律。因为象形文字能够很容易表现现实的物体,比如:人、石头、太阳、眼睛等等。但对于抽象的概念,或者人们不太熟悉的事物,象形文字就很难形象地表现出来。于是文字创造者们多借用“标志符号” + “同音字”来解决这个问题。最常见的就是汉语中的许多应用,比如“蜘蛛”这个词,就是借用了“知”“朱”这两个字的发音,同时通过“虫”这个标志符号定义;另外,“雾”,“迷”,“鹦鹉”等等都是应用了这个定律。
同样的例子在古埃及语言也比较常见,让我们用英语发音来做一个近似的解释,如下:
那么稍微具体来说,史前语言的创造者是怎么处理发明过程中的各种问题的呢?
古埃及文字:
开始的时候学者们认为是一系列象形符号组成的帮助记忆的提示,因为这些象形符号大部分形象地表现了各种植物、动物、工具等等;后来经过一系列巧合才发现,绝大部分的象形符号在埃及文字中并非代表图像本身的意思,而是应用上文提到过的“书迷定律”,来借用发音;后来又发现,当古埃及人真的需要使用象形符号图像本身的意思的时候,他们的语法是在符号之后加以“标志符号”(前文以述);因为古埃及语言中没有元音,所以现代人听起来会感觉很奇怪,有一种没有重音,并且很“虚”的味道(注3);另外,在古埃及语中,“标志符号”仅起到“标志”作用,不发音。
注3:古埃及语言的发音示范, “How to read Ancient Egyptian Language” https://www.youtube.com/watch?v=1jEdLNlhhi8
“Learn Ancient Egyptian Hieroglyphs!” https://www.youtube.com/watch?v=8QNcdxgjcBs
接下来,后人还发现了古埃及人对语言符号更复杂的使用方式:
- 发音符号, 包括字母,biliteral和triliteral(注4)
注4:biliteral和triliteral是闪米特语族的特殊语法概念。很遗憾,中国一直对其关注甚少,笔者没有能够找到合适的中文翻译。
对它们大致的解释是这样:在古埃及语中,有一些符号能够代表复数数量的发音组合(包括辅音组合、辅音与元音组合)。如果复数数量为2,这个组合的定义为biliteral;如果复数数量为3,这个组合的定义为triliteral.下面是biliteral和triliteral的例子。
- 表意符号,包括语素文字和标志符号(但是,如果只是单独的一个象形文字符号,除了作者,则很难判断其是哪种符号,表示什么)
- 审美因素,每个古老民族有其审美特点,像玛雅人喜欢使用圆形,埃及人喜欢在自己的文字中使用矩形。同时,他们还在文字设计上尽量避免空白,他们会调整文字内容的大小,方位和细微形状,使其感觉更漂亮。
- 另外,上古时期懂得书写和阅读的人很少,也没有严格意义上的语法结构,所以,下图表示的故事在远古确确实实经常发生。不仅仅在古埃及,在玛雅文明中也是如此。玛雅文明后期的陶器上面的文字多为制作者的胡编乱造,不知所云。
玛雅文字走的是与其它史前文字不一样的套路。最核心的词素符号往往不是这个词的主要意义标识,就是这个词的重音。然后使用上下左右的修饰符号来完善整个单词的发音。由于玛雅文章的阅读顺序是由左至右读两个词,然后接下一行,再读两个字符,周而复始。所以玛雅单词中上下左右的修饰符号也多为最多两个,以维持传统的阅读习惯。
玛雅文字在组成方式上十分灵活,虽然具备一定规律,但书写者不加限定,按照自身偏好组合的玛雅字符往往给阅读者造成不小的困难。比如下面这位帕伦克君王的名字 - 帕卡尔就有6中不同的写法(按照“标志符号”组合、或者按照“发音符号”组合、或者两者结合)
到目前为止,仍然有许多史前文字,因为各种原因我们无法破译。比如下面这些:
已知的古老语言是如何演化的呢?
注1:Athens - 雅典;Thera - 锡拉岛; Crete - 克里特岛; Naxos - 纳克索斯岛; Corcyra - 克基拉岛; Boeotia - 皮奧夏
注2:详见大英博物馆网页 https://blog.britishmuseum.org/2014/11/19/3d-imaging-the-assyrian-reliefs-at-the-british-museum-from-the-1850s-to-today/
文字被古人认为是神圣的,每个民族都记载着自己文字的起源。
曾几何时,书籍是如此尊贵。
下图取自中世纪法国地区的插画,里面写到:
他偷走了这本书
他将在巴黎的绞刑架上晃动
如果他没有被绞死
他会被淹死
如果他没有被淹死
他会被烧死
如果他不被烧死
那么他将会死得更惨
近现代以来,世界人口程几何级数增长。相反的是,随着全球化,世界上的语言种类与数量却越来越少。这里的“语言”指的是自然语言,即在历史之中逐渐成型,依托于某个民族、或者文化群体,并且随着时间演变的语言。19世纪以来,人为设计出来的人工语言开始层出不穷。其中最有名的大概要数“世界语”了,在20 -30年前的中国也曾经流行过。尽管其机构仍然宣称目前有几百万人能够熟练使用世界语,但笔者对这个数字表示怀疑。试问每一位读者的身边,记忆中还能找出懂得世界语的人吗?
以世界语为代表的一系列人工语言的初衷是为了设计出一种语法结构简单、严谨、同时易于学习领会的语言文字,用意是为了人与人交流更方便。但是语言是与民族文化深深凝结在一起的东西,这个思路经过证明没有生存的土壤。现代以来,虽然有更多的语言被创造出来,但其中绝大多数并不以传播作为主要目的,它们或者是语言学者为了证明自己的某个观点的实践;或者是某人的即兴之作;其中影响最大的要数影视与文艺作品中出现的人工语言了,下面详细介绍。
比如电影Avatar中的纳美语的设计目的主要从两个角度出发:第一是发音,导演与语言学家以北美印第安人的发音为蓝本,这是为了在潜意识中影响观众 - 纳美人与印第安人一样“热爱大自然”同时“与白人对抗并处于弱势”;第二是在语言中加入生活元素,比如纳美人相互问候的第一句话是“Oel ngati kameie(我看见了你)”,这是不是像北京人说“吃了吗?”一样有着强烈的地方特色?;由于电影中纳美人是一个注重心灵与自然和谐的种族,导演在纳美语的文化特色上也下了一番功夫。比如纳美语中对于“看见”就有2种说法。普通意义上的视觉“看见”是tse'a。而kame指的是心灵上的“看见”(相通)。对比女主角先后对男主人公说的“我看见了你”,你就会逐渐领会到纳美人文化中独特的哲学内涵;另外,汉语中常用发音的抑扬顿挫来表达情绪,但纳美语中在这个基础上设计了专门的语法项目:比如,同一个单词“打猎”,被加入不同的词缀就变成积极或者消极的含义。t‹ìrm›ar‹ei›on(刚才正在打猎噢!),说话者很兴奋。t‹ay›ar‹äng›on(又要打猎了!),说话者很消极抵触。这一点,笔者一直没有想清楚它的用意是什么,大概只是语言设计者的偏好吧。
系列电影《星际迷航》中的克林贡语也很符合其民族特色。由于克林贡人是一个粗鲁的“战斗的民族”,在他们的语言上也有配合的设计。克林贡语多应用了塞音、颤音和鼻音,在配合有些刺耳的嗓音;同时,克林贡语言使用人类语言中极少见的“宾谓主结构”,直观上就给人以外星语言的感觉;另外在克林贡人的日常对话中,从不说“谢谢”、打招呼的用语是“你想要什么?”、表示相互喜欢的话是“我不恨你”。这些都能帮助整个作品树立出克林贡人的冷血、残酷、实用主义的特点。
《魔戒》中的精灵语的设计中,更多的引入了清音和响亮的元音,这样一段精灵语说下来,会给听者一种舒缓流畅的韵律感,不禁联想到精灵俊美的容貌和艺术气质;而同一部电影中的半兽人语着重使用浊音与摩擦音,在配合粗重的嗓音,立刻会让人感受到魔多统治下的黑暗与强暴。
系列小说《冰与火之歌》中,龙母丈夫的种族 - 多斯拉克人见面的问候方式是“Hash yer dothrae chek asshekh?(你骑得好吗)”。回答的套路是“Anha dothrak chek asshekh.(我骑得很好)”。祝贺生日要说“Asshekhqoyi vezhvena!(祝你拥有美好的血腥的一天)”。感谢要说“San athchomari yeraan!(荣誉归于你)”。这些文字无不反映出多斯拉克人好战、充满荣誉感的游牧民族特性。
同样在这部小说中,无面者见面时相互用高等瓦雷利亚语问候,说的是“Valar Morghulis(是人都有一死)”和“Valar Dohaeris(凡人皆需侍奉)”,神棍气质呼之欲出。
在影视剧中出现的人工语言之外,近些年语言学家和爱好者也设计过许许多多语言文字,不过其中绝大部分都是拼音文字。前文已经提到过,对于拼音文字,设计者在创造出有限的字母之后,简单地说,只要选择性地沿用一系列现有的语法与拼写规则就可以了。而语素文字(比如汉字),发明者要对常见的语素各自设计出独特的符号,这个难度系数与拼音文字不可同日而语。
Reonji语言就是一个有意思的语素文字。
据称它已经有了800多个不同的语素符号。经过这些符号的完美组合,形成了下面源自《联合国世界人权宣言》的一段话。
它的意思是“所有人生而自由,在尊严和权利上平等。 他们有理智和良心,应该本着兄弟情谊的精神相互行动。”
Oakscript虽然是一个字母文字,但它模仿树枝桠的字体以及由上至下的书写方式给人以耳目一新的感觉。
还有应该是国人设计的xliú Σgrén πzwén语言。通过了下面2副字母表,形成了最后一篇《论语:学而时习之》
还有外星生命色彩浓厚的Rng'-Tera文。
古玛雅文字的模仿者Sitelen语言。
看着像是模仿汉字的语素语言,但实际上是字母语言的Trantanese。
但以上所有语言的发音都依托于人类声带发音的基础上,笔者很期待能够出现一种超脱于人类发音基础的语言出现。
文字起源的过程,本文将介绍几个新的观点和推测。
文字是人类经过长期积累,一点一点发展完善的吗?
目前对文字的诞生方式似乎只有一种定论。就是先出现象形符号,然后经历漫长的时间,人们逐渐将象形符号有机地结合起来,用来记录更复杂的信息,于是产生了完善的文字系统。
上述观点的主要依据之一是两河流域的考古成果。古时期,当地的贸易很发达。在货物运输的过程中,人们会在封口嵌入一块泥巴,在上面画上带有自己独特标志的“戳(印章)”。后来出现了专门从事运输工作的商人队伍,于是上面提到的“印章”中就逐渐增加了更多的内容,除了“商标”之外,还会加入有货物统计信息。比如,多少袋麦子、多少罐蜂蜜、多少头牛等等。渐渐地,象形文字就滥觞于这种过程之中。后来,苏美尔出现了大规模的土地私有化。大型土地拥有者,比如神庙或者国王,在管理这些土地的过程中需要记录大量的信息。比如,土地的位置、丈量信息;租赁信息;农具管理;收成、入库和交易信息等等。这些实际需求将原始象形文字推向实用化,同时也诞生了书记员这个职业。
在其它的人类文明起源地,文字很可能是在短时间内就发展成熟的,比如古中国。这个猜测诱发于先秦考古中一个很特殊的现象。安阳殷墟是已知中国最古老的文字 — 甲骨文的出土地。里面大量的龟甲与兽骨上存在着成段落的甲骨文。这些龟甲与兽骨都来源于占卜祭祀,用来记录结果的。
奇怪的是,甲骨文似乎是在殷墟存在的这270多年间一下子产生并成熟起来的。之前的殷商遗址中并没有发现过这种文字早期的形态。这引发了学者针对两个不同可能性的猜测。
第一,如果继续认可文字是长时期逐渐成熟的观点,那么甲骨文发展中缺失的这个环节很可能是在记录媒介的转换上。我们现在考古所能发现的古代文字记录都是存在在能够经久保存的材质上,比如,骨片、泥板、石碑等等。如果当时的古人喜欢使用树皮作为书写媒介,经历了几千年的潮湿气候,这样是很难给后人留下什么书写的证据的。如果说甲骨文属于这种情况,其经过缓慢的发展逐渐成熟,直到在殷墟时期由于大量使用骨片和龟甲用于占卜,才为后人留下了作为文字的证据。
同时,部分史学家也提出了下面的可能,就是中国古代的文字 — 甲骨文是在很短的时间产生的。准确的说,就是像传说中的仓颉造字,甲骨文是由一个或者同一批人发明完善的。这个过程是理论上可行的。无论是表音还是表意文字,在口语语言已经完善的状态下,只要设计出口语所对应的不同书写(词汇或者字母),直接就产生了系统的书写语言。
相反,人类社会口语语言的产生的的确确经历了漫长的岁月。对比人类先祖的喉部发育情况,人类直到晚期智人时期的喉骨结构才允许发出类似于当代人类这么多抑扬顿挫的音节。他们的颅骨底部变得拱起,形成一个盖子形状覆盖在咽部之上,同时把直立人向外探出的面部向里面拉过来,这个时候的人类才逐渐具备了口语语言的生理条件。这个时期是大致在3万年之前。