学者新论:中文信息技术标准:汉字注音?拼音正词法?
教育部语言文字应用研究所研究员、博士生导师 冯志伟
代 前 言

  冯志伟教授是教育部语言文字应用研究所研究员、博士生导师。2002年10月中旬,在河南省开封市召开了“中国语文现代化学会第五次学术会议”。这篇文章,是根据冯教授的报告摘编的。
冯志伟教授的文章,提出了语音、历史和识别的三个正词法原则结合的方法来施行和完善现代汉语拼音正词法,从而使全国文化教育工作和中文信息技术发展有更严格规范的和统一的语言文字根据。冯教授的主张,对国内和国际的规范标准的实行与建设都很有现实意义。

  现代汉语拼音正词法是1988年中国政府颁布的,是具有法律意义的国家标准规范,而且,也是联合国等国际组织使用的国际标准规范。这个标准规范的主要内容,是中文书写中的“词”和“词界”的确立。

  1989年,“汉字优越”论和“汉字文化”论开始泛滥,鼓吹者的目标之一,是否认中文有“词”和“词界”、进而否定现代汉语拼音正词法,恢复半个世纪以前逐渐淘汰的“汉字注音”法。在报刊媒体的鼓动宣传和某些部门人士的支持下,“汉字优越”论终于成了气候,现代汉语拼音正词法和相关的规范标准的建设受到极大干扰和破坏,而被淘汰的汉字注音法大有回笼之势。

  中文信息技术不光是输入输出汉字,更还有句子和段落的处理、还有排序等数据结构管理和中文算法语言等等,这些,都需要明确的词界。为了发展中文文献管理和翻译自动化,中国已经投入了三十年左右的时间、上亿元的资金和数不胜数的人力,可是,许多基本问题依然处于一筹莫展或停滞不前的状况,究其技术原因,主要问题就是词界模糊、单个汉字连成一片。

  以前,中文书写没有标点符号,需要很大的“句读”工夫才能避免歧义和正确阅读。“句读”,通俗说,就是分句和确定“句界”。引进拼音文字的标点符号方法,句界清晰,为避免歧义和正确阅读提供了极大的方便,而中文还是中文,并没有因为使用拼音文字的标点符号而不再是中文了。试想,如果取消标点符号,所有的中文文献都是一个个汉字连成一片,那么,现在的人工阅读和计算机文献处理,会是个什么样子?多数人会同意,那将是一场灾难性的技术和文化的倒退。

  同样,如果没有现代汉语拼音正词法确定词界的方法,那么,许多中文文献工作、中文数据管理自动化和翻译自动化等等工作,就会面临巨大的困难。跟使用标点符号一样,确定词界不是取消汉字、也不是用英文等西方文字代替中文书写,而是在使用标点符号的基础上,进一步避免歧义和保证正确阅读,为中文数据管理和自动翻译等提供基本的文字方法依据,使计算机操作、人工操作、说话和书写等等,有统一的标准规范。

  汉字注音是一个个汉字连成一片的方法;现代汉语拼音正词法是确定词界的方法。恢复汉字注音、还是坚持现代汉语拼音正词法?这不但是全国基础教育和文献管理的大事,而且是中文信息技术标准依据的大事,也是中国政府提交给联合国的国家标准和国际标准是否有效的大事。

  吕叔湘、王均和周有光等老前辈科学家,一开始就看到了“汉字优越”论的危害,认为那是主张文化倒退。他们主张继续执行和完善现代汉语拼音正词法,一步步搞好中文现代化建设。然而,他们坚持科学真理的声音被一浪高过一浪的媒体炒作淹没了,直到前几年网络热掩盖了“汉字优越”论的热浪。网络热冷却后,“汉字优越”论又开始抬头,跟尊儒复古思潮结合,继续试图否定现代汉语拼音正词法和恢复汉字注音。令人注意的是,随着“汉字优越”论和“汉字文化”论的泛滥,已经有人试图把文字方式作为搞文化分裂和国家分裂的政治工具。

  主持国际通用字符库标准的联码(Unicode)组织,每年都召开国际学术会议,讨论各种语言文字的数据管理文字方式和字符标准规范等问题。随着中文信息技术市场的发展,近些年来,联码会议也越来越多地提出了中文文字方式的“词界”问题。中文书写的“词界”和现代汉语拼音正词法,已经超越国家行政和文化地理的范围,成为国际科研学术界十分关注的一个重要问题。

  在这个时候,看到冯志伟教授的《英德法语的正词法与汉语拼音正词法》,深受启发,特别向人民网做了推荐。承蒙人民网编辑部的要求,特做此介绍,且当作前言,奉献给读者。(米阿仑)



华林教苑Copyright(c)2001-2002 联系信箱:linhr@peolemail.com.cn