从中英文存贮量比较谈汉语拼音方案之简化(修改稿)


     -江毅-

  同一篇文章用不同文字表达,其字节存储量是不同的。比如德文因其单词较长,存储量一般会比英文的大些。这里我们关心的是中英文在这方面的比较。

  有人作过比较:在联合国文件中,存入电脑后英文文件大体上要比同内容的中文文件大1.4倍。拿本中英对照小说做样本,算一算同一章节内中英文各自的字符数,大致上也可得出类似的比率。也即是说,中文的存储效率大致上比英文的好很多。

  从文字输入角度看,因英文每字母敲一键,由上述比率可知,中文输入要和英文同等效率,输每个汉字的键数须大致在2.8左右。

  以此为参照点可粗略判断常见汉字输入法的优劣。

  五笔字型(单字)是四键一字,大于2.8。其它的形码若按单字输也好不到哪去,不是每字键数多就是每字键数虽少但常需选字于是平均键数也上去了。

  现在来看拼音类输入法的情况。首先需知,单字拼音的动态平均长度是3.127。这样,整句输入法的每字键数至少是3.127;若再把输错返回修改的情形考虑进去,估计接近3.5。全拼词组输入的情形差不多。双拼的情形好些,其单字拼音平均长度为2;考虑到选词键数(词组输入)或返回修改的键数,会稍大于2。但是双拼不可能成为拼音使用的主流。

  使用只敲首字母或首笔划一类的简拼,虽可达到快速输入目的,但因其在书写时较多地干扰思维过程,故一直未能成为主流。

  最普遍被使用的方法莫过于全拼类(词组或整句)。这也是本文主要关心的一类。

  由上面讨论可知,很遗憾,从统计意义上讲,这类被成亿人每天使用的方法的每字键数(取动态平均)大于等于汉语拼音的动态均长3.127。

  能否把这种情形改善一点呢?这就是本文主要想谈的:汉语拼音方案之简化。

  首先,拼音方案中,拼音尾部的ng组合实际上代表一个发类似“eng”音的音素,记为η。

  这个简化的想法很简单:把所有的“ng”组合可简输为"g",规定拼音尾部出现的g均发η音。例如 fang->fag, liang->liag, kuang->kuag. 这样输入汉字时拼音的动态均长减为2.872,相当接近上述2.8,可省敲不少键.

  顺便指出,经ng简化改造后,汉语拼音的静态均长从3.24改进到3.045。

  从口腔声学的角度讲,这个“n”其实是无必要的。比如体会一下ang发音的口腔变化,从a到η中间并不经过n的口腔状态。

  n是后鼻音,其发音时口腔声学特点是舌贴上颌前端,口腔不发音,鼻腔发音。n为拼音首字母或尾字母时均表现为其上述发音特征;但其和g组合成ng时则并无上述发音特征。“ng”组合实质上是用双字母表达一个特殊的音素η。但η在西键盘无法表示。如果规定g为尾字母时g就代表这个特殊的音素η,理论上应该也是可以的。

  拼音是从西文来的。西文中一个音节尾部的g可以发类似“哥”的音,也可以发类似“eng”的音(如果是ng组合的话)。但中文拼音完全没有这个多重性的问题;一个字的拼音尾部的g不可能发“哥”音,只可能是ng组合的“eng”音。因此,也就没有必要保留西文的这种ng组合。

  从输入法的角度讲,这样简化后对多字连拼的识别并没有增加任何的困难。

  汉字系统不是不能简化。繁体到简体就是一个简化。拼音非汉字主要承载体,动一动牵扯较少。

  负面的问题是减少了与西文发音的相似性。比如“方明强”,西人不知道“fag mig qiag”如何读音。不过这并非新问题,西人原来也不知“xu,xiang”等有x的拼音该发何音。自己的使用效率毕竟是首要问题。

  总之,这就是本文提出的对《汉语拼音方案》的简化建议:将所有的拼音形式中的“ng”简化为"g"。这有利于拼音方案的简洁性以及增强其实用性。即使《汉语拼音方案》短期内不好动,至少在拼音输入领域,有关部门应推荐这一简化方案。



2006/6
作者为《汉王简拼音》作者,www.hanwj.com

参考文献:
-《汉语拼音方案》是最佳方案——吕叔湘 《文字改革》1983年2月号
-常用汉字字频统计表:http://www.hanwj.com/hanzi_zipin_biao.gb.txt