|
中文信息技术标准:汉字注音?拼音正词法?
《中华人民共和国国家通用语言文字法》第一章第十八条规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音的工具。《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便使用或不能使用的领域。初等教育应当进行汉语拼音教学。”
《汉语拼音方案》不仅是注音的工具,而且也是拼音的工具,要拼音,就必然会涉及到词儿连写的问题。在《汉语拼音方案》中,采用y、w和隔音符号“'”来隔音,就是为了解决词儿连写的问题,而词儿连写的问题,就是汉语拼音正词法的问题。我们在这里讨论汉语拼音证词法,是完全符合《中华人民共和国国家通用语言文字法》第一章第十八条的规定的。最近一段时间,似乎特别强调《汉语拼音方案》给汉字注音的功能,而非常忽视甚至试图削弱《汉语拼音方案》给汉语拼音的功能。因此,我们认为,有必要在这里借鉴国外正词法的研究,来进一步加强《汉语拼音正词法》的研究和改进。
问题的提出
“正词法”在英语里叫Orthography。ortho-是“正确”的意思,-graphy是拼写法的意思,整个Orthography就是“正确的拼写法”的意思。1958年2月11日,国家正式公布了《汉语拼音方案》,用拉丁字母来拼写汉语,这就出现了汉语拼音的正词法问题。
汉字一连串写下来,既不分词又不连写,只有“字”的书写单位,没有“词”的书写单位。汉语普通话中的词有单音节的,有多音节的,多数是双音节的。用汉语拼音来拼写普通话时,应该分词连写,也就是以词作为书写单位,使得语言中的表义单位能够在书面形式上反映出来。这是拼音书写形式与汉字书写形式的根本区别。
比如,“中华人民共和国”不是写成zhong hua ren min gong he guo, 也不是写成 zhonghuarenmingongheguo,
而是写成Zhonghua Renmin Gongheguo。这样的写法反映了词语的实际结构,阅读起来比全分或全连都来得清楚。可见,汉语拼音正词法就是以词为单位来正确地书写汉语普通话的拼写法。
任何拼音文字都应该有自己的正词法。英语、法语、德语等采用拉丁字母作为拼音文字的语言,在长期的历史过程中,发展出适合于本语言特点的正词法。汉语拼音虽然不是拼音文字,但是,在它的实际使用中,特别是在与语言信息处理有关的应用中,也有正词法的问题。为了深入地研究汉语拼音正词法问题,有必要对英语、法语和德语的正词法发展情况进行研究,以便作为我们的借鉴。
英语的正词法
英语分古代英语(公元700年-1100年)、中古英语(公元1100年-1500年)和近代英语(公元1500年至今)。公元9世纪丹麦入侵英国,至11世纪初,丹麦实际上统治了英国,丹麦语和英语同属日耳曼语族,加速了古英语的简化过程。
1066年法国入侵,法语成为官方语言,法语属罗曼语族,与英语不是同一个语族,英语吸收了大量的法语词汇,语法上也受到了法语的影响。在法国入侵之后,英国实际上存在着3种语言:法语是官方语言,拉丁语是宗教语言,英语是社会下层使用的语言。
后来由于政治上的历史变动,英语逐渐成为官方语言,学校开始教英语,英语成为了英国的全民共同语。在英语上升为官方语言的过程中,吸收了大量的法语借词,公元1250年-1400年的150年内,约有10000个法语词汇进入了英语,75%至今还在使用。
由于基督教会的影响,拉丁语词汇也大量进入英语,使得英语的同义词大量增加。例如,同是表示“火” 的三个词,fire来自英语,flame来自法语,conflagration来自拉丁语;同是表示“问”的三个词,ask
来自古英语,inquire来自法语,interrogation来自拉丁语。
文艺复兴时期对古希腊、罗马文化的研究,大量的拉丁语、希腊语词汇涌入英语。例如,arithmetic(算术),grammar(语法),logic(逻辑)来自希腊语,
arbitrator(仲裁人), executer(执行者), item(条款)来自拉丁语。
这些情况,使得在现代英语中,借词占了 80%的比重,这些来自不同语言的大量借词,减少了同形词和同音词产生的机会。大量吸收外来词 -- 这是英语正词法得以形成和巩固的一个重要因素。
英语正词法中比较严重的问题是如何解决英语的书面拼写形式和读音之间的矛盾问题。
由于文艺复兴时期印刷术的推广和教育的普及,英语的书面拼写形式逐渐统一,形成了规范的形式,而这些规范的形式又通过印刷的方式进一步固定下来。
与此同时,英语的语音发生了很大的变化。例如,gnash(咬牙)和 gnat(小昆虫)中,g不发音,knight (骑士)和 know (知道)中,k不发音,而在中古英语中,这几个字母全都要发音。又如,辅音字母前的
r (如 arm)和词尾的 r (如 father)不发音,词尾的 e (如 live)不发音,而在中古英语中,它们都是要发音的。
这种情况,使得规范的书面形式与实际的发音之间出现了很大的矛盾。在英语正词法中,基本上保持历史上原来的词形,从而减少了同形词和同音词产生的可能性。
18世纪开始,英国强调语言的规范化,要求语言准确有力。1755年,约翰逊(Samuel Johnson) 编写了第一部英语词典,把英语词的拼写形式固定了下来。这样,英语的正词法就能够以词典作为规范的根据。
尊重历史,保留词形的原有形式,这是英语正词法得以形成的另一个重要因素。
书面拼写形式与实际的发音不一致,当然也会给英语的学习和使用带来一些困难,为了统一读音,英国从维多利亚时代就开始推行标准语,著名语音学家琼斯
(Daniel Johns) 编写的《英语发音词典》 (English Pronunciation Dictionary) 成了人们必须遵守的发音规范。
我们可以看到,英语的正词法主要是遵从历史原则,同时也适当考虑语音原则。
法语的正词法
法语属罗曼语族,它的祖先是拉丁语。拉丁语的使用早在罗马帝国时代就一分为二了:书面的拉丁语古文有严格的语法规则,专为贵族和僧侣使用,口头拉丁语俗体是人民大众使用的活语言,又称民间拉丁语。民间拉丁语随着罗马帝国版图的扩大,由军队和商人传到了法国南部的高卢人那里,并逐渐取代了高卢语,同时又受了高卢语的影响。公元7-8世纪,原来的民间拉丁语变成了一种新的语言
-- 这就是古代法语。
12世纪末,以巴黎为中心的方言逐渐成为了法语的全民语言,17世纪以来,由于发展商品经济的需要,法国一直十分注意语言文字的标准化和规范化,主张清除法语中的不纯洁成分。
在长期的历史发展过程中,法语的语音有了很大的变化,而书面的拼音形式却已经基本固定下来,语音的演变并没有反映在书面的形式上,因此,法语与英语一样,也存在着书面的拼写形式与实际读音之间的巨大差异。这一方面固然给学习法语带来了一定的困难,但另一方面却为区分同形词和同音词提供有力的手段。
为了解决书面拼写法和实际读音的矛盾,法语的正词法提出了许多行之有效的规则。
例如,法语词末的辅音 -ds, -s, -x 等,大多数是古音在书面形式上的遗迹,在现代的口语中已不发音。利用这些形式不同而实际上已经不发音的词末辅音,就可以区分同形词和同音词。 poids(重量),pois
(豌豆 ),poix(松香)3 个词,发音都是 [pwa], 是同音词,由于词末辅音 -ds, -s, -x 不发音,利用这些形式各不相同的词末辅音,就可以把这
3 个同音词在书面形式上区别开来。
可见,法语正词法主要是遵从历史原则,并把这个原则作为区别同音词的重要手段。
德语的正词法
德国人在使用拉丁字母之前,是使用鲁纳字母(Rune)的。这种字母的形式很像拉丁字母和希腊字母。德国人在接受了基督教之后,就放弃了鲁纳字母而改用拉丁字母。公元
2 世纪,拉丁字母的地位在德国进一步巩固。到了公元 7 世纪,拉丁字母成了西欧各国大部分民族文字的基础。但是,德国使用的拉丁字母是歌德体的字母,与西欧各国并不完全一样。在使用拉丁字母来拼写德语的过程中,德语的正词法逐渐形成。1596年,语言学家魏歇勒
(Wecherer) 建议,名词的第一个字母大写,这种办法有利于辨识名词,大大地方便了阅读,但也由此而引起了关于字母的大写和小写的一系列正词法问题的争论。
1876年,德国召开了正词法会议,会上建议取消字母组合th, Thal 写为Tal(山谷),并研究了[s]和长元音的书写规则。
1901年,德国召开了第二次正词法会议,通过了第一次正词法会议所提出的各项建议,并采用了著名语言学家格里木(Grimm) 的建议,放弃了歌德字体,提倡使用西欧各国普遍使用的拉丁字母。
著名词典编纂专家杜登 (Konrad Duden,1829-1911)编写了德语正词法词典,为德语正词法的研究立下了功劳。
德语正词法主要根据下列原则:
1. 语音原则:这个原则要求词中字母的发音应与该字母的表音一致。例如,p, t, k, f 等字母在词中的任何位置或与任何字母相结合,均依次读为[p],[t],[k],[f]。这个正词法原则还要求单词的发音与其拼写法尽量保持一致。例如,kalt(冷)读为[kalt],oft
(经常)读为[oft]等等。在德语中,70%-80% 的词和字母是符合语音原则的。
由于坚持了语音原则,使得德语的字母和单词易学易记,给学习和使用带来了极大的方便。
2. 形态原则:这个原则要求词根和词干的写法,在由它们派生出来的词中保持不变。也就是说,在合成词中,在名词的变格形式中,在动词的变位形式中,在形容词的比较级和最高级形式中,尽量保持词根和词干的原有形式,必要时采用变音
(Umlaut)。
3. 识别原则:这个原则要求把声音相同而意义不同的几个词在写法上加以区别,以便在书面形式上区分同音词。例如, Lid
(眼皮)与 Lied (歌曲)都读为 [lid], 根据识别原则,把 Lied 中的 [i] 写为 'ie'; malen(画图)和 mahlen(磨碎)都读为[maln],根据识别原则,把
mahlen 中的 [a] 写为 'ah'.
4. 历史原则:这个原则要求保持历史上的某些传统写法。例如,ziehen(拉)一词中的字母 'h' 是没有什么作用的,因为词根里 'i'
的长音已经写为 'ie', 完全没有必要在加上一个 'h' 来表示长音,但由于这个'h' 在历史?上曾经表示过一种特殊的而现在已经不复存在的辅音,根据历史原则,可以把这个
'h' 保留在 ziehen 的词形中。
在这四条原则中,“语音原则”是德语正词法的最基本的原则,这个原则使得德语的书面形式比英语和法语易读,易写,易记。
然而,德语有19个元音,23个辅音,共42个音位 (phoneme),而拉丁字母只有26个,这就不可能处处都遵循语音原则。为了弥补字母之不足,同一个字母可以表示不同的音位,同一个音位可以表示不同的字母,也可以采用字母组合来表示一些单字母不能表示的音位。为了补充语音原则的不足,德语正词法还规定了如下的字母拼写规则:
1. 同一个音位可以用不同的字母或字母组合来表示。
2. 同一个字母可以表示两个音位的组合。
3. 用不同的字母组合方式表示长元音,并使之成为区别同音词的手段。表示长元音的手段主要有:①在元音后加哑音 h来表示长元音; ② 用重叠元音字母的方式来表示长元音。
采用不同的方法,一些同音词就可以区别开来了。例如, Aale (鳗鱼) -- Ahle (锥子) Moor (沼泽地) -- Mohr (黑种人)
由此可以看到,德语正词法十分注意语音原则,但也考虑到了形态原则,识别原则和历史原则,以区别同音词,减少拼音文字使用中的同形现象。
英语、法语和德语的正词法都考虑到了历史原则,德语正词法还考虑到了识别原则。这些语言的正词法原则可以给汉语拼音的正词法提供宝贵的经验。
|