国家民委中国民族语言文字应用研究院

让盲人充分共享汉字文化

发布时间:2023-12-11 作者:叶昌元 分类:学术动态

拼音文字,必然有大量同音字

我国的盲文发展到现在,是比较成熟的文字。

但是,作为拼音文字,必然受到有限音节数量的限制,换一种说法,就是必然有大量重码——同音字。所谓普通话,有21个声母、35个韵母,理论上会组成21×35=735个音节。但实际上并不是任意两个声母和韵母都能成为搭档,比如:没有biang这种组合。据粗略统计,实际音节只有443个。再把四声考虑进去,也只有1000多一点,远小于4×443=1772。因为您从未见过dáng、káo、fòu这些拼音。假如您掌握5000个汉字,用这1000多来除5000,平均每四个字都是同一个音。

在汉字文化圈里,日文、韩文、越南语等都是拼音文字。作为拼音文字,日文不得不常常蹦出汉字。韩国人的身份证上,人名也要标注汉字。越南人在放弃汉字、使用拼音以后,经常发生这样的情况,一个公司往往有好几个重名的,都姓阮,叫Nguyen Linh,难以区分,只好叫他们阮小二、阮小五、阮小七。

这些都反映了拼音文字的局限性。


韩国人的身份证,韩文后面加了汉字。

盲人共享汉字文化的障碍

让盲人充分共享丰富多彩的汉字文化,是我国特殊教育机构的一大宏愿。而实现起来显然比明眼人的教育难得多。

前辈们在如何降低盲文的重码率上做出了很多探索。比如提倡多用词——词比字重码率低得多,探索分词连写等。这些措施,再加上盲人朋友根据上下文以及语境的推测,在一般情况下,基本上能避免重码,或者说能识别同音字、词的不同含义。


11月25日,北京联合大学特殊教育学院举办“融媒体背景下国家通用盲文全息电子词库建设研讨会”。

对于有志于在文字上深造的盲人朋友来说,就必然会遇到许多常用字、词以外的单字,包括生僻字、文言用字等。而盲人查阅字典、词典,应该比明眼人困难得多。比如《现代汉语词典》里收录的读yì的字有93个,再考虑到很多字一字多义,估计读yì的字义多达二三百条。当盲人阅读(触摸)到这个音节时,怎么才能让他们从中抽出那条其所需要的那条字义呢?

何况,词也有不少同音的。比如说,盲人朋友想用盲文查阅“姓氏”这个词条,电子词典里可能会蹦出“幸事”“性事”的解释。

另外,汉语里常用的谐音哏和双关语等语言乐趣,盲人也可能享受不到。

让盲人充分共享汉字文化,说 说容易,作起来不易。

从汉字构成规律出发,发掘每个字的特征

对于明眼人来说,汉字的三要素是形、声、义。但对于盲人来说,汉字的要素只有声和义。关键是把每个字声、义之间的联系呈现给他们,才能让他们在同音字里区分彼此。以下是我解决这个问题的设想。


研讨会后的合影。前排中为北京联合大学特教学院副院长徐娟;前排左五为北京师范大学特教学院书记、副院长张悦歆;右五为北京联合大学特教学院资源中心首席专家钟经华;右四为笔者。

1.形声字特征的描述

形声字是汉字里占比最大的。顾名思义,形声字的部件里一部分是表形的,一部分是表音的。对于盲人朋友来说:鲫(jì)=鱼(yú,表形)+即(jì,表音)。对鲫这个字的描述,足以让盲人朋友将其区别于其他众多读jì的字。有人可能会说:用鱼(yú)、jì是否就能充分表达鲫这个字呢?还不够。这可能会导出另外一个字:鲚(jì)。还不排除有其他读jì,而部首是于、余、予、俞等的字。

汉字的表音部件非常广泛,很多单字都可能成为表音部件。举一组例子。

霭←谒←曷←←勹、亾(亡)。

匃,还有匄、丐两个异体字。

其中,谒是霭的表音部件;曷是谒的表音部件;匃是曷的表音部件。在上面这个链条里,左边的字均以其表音、其右边的与其读音无关。

让盲人朋友掌握那么多表音的字,没有必要。但我们可以寻求终极表音部件——在一个字里最终以谁表音,谁就是终极表音部件。霭、谒、曷的终极表音部件都是

霭、蔼;

谒、竭、揭、碣、渴、偈、喝、䦪、蝎;

曷、钙、麫(这是个错字。应为麪)。

它们都是形声字,分别以雨、艹、立、扌、石、氵、亻、門、虫、曰、钅表形(表义),都以匃(丐)表音。

含匃(丐) 的部分字的特征


部分简化字用的就是这种办法:

達,简化为达,直接以大表音。達以羍表音,而羍还是以大表音。

嶺,简化为岭,直接以令表音。嶺以领表音,而领还是以令表音。

趕,简化为赶,直接以干表音。趕以旱表音,而旱还是以干表音。

噸,简化为吨。

懇,简化为恳。

墾,简化为垦。其中,貇同啃。

猩,也写作狌(古已有之)。


盲文书籍都特别厚重。建立电子词库大势所趋。即便如此,让盲人共享汉字文化的同时,还应为盲书减厚、减重。

终极表音部件有多少呢?我对《在线新华字典》里的21,000个字做了梳理,整理出1550来个终极表音部件。

2.会意字特征的描述

会意字由几个部件凑在一起,共同表义。其读音往往与组字部件的读音无关。因此,会意字特征的描述,需要将所有部件的音、义都要展示出来。

匃:勹+亾,会意为流亡者向他人乞求帮助。

盗(盜):㳄(同涎,流口水)+皿,会意为垂涎他人的器物而占为己有。

占:卜+口,会意为对卜出来的卦象作出解释。

还有屈指可数的指事字,可以归入会意字。

刃=刀+相应符号。

本=木+相应符号。

像“爨”这样复杂的会意字是极端情形。它指烧火做饭。有三层、共七个部件:双手持炊具,双手执木柴,火。取其中三个部件标注:炊具、木(柴)、火,足矣。


出自睡虎地秦简的爨。上部象鬲,两旁有双手。比起现行的爨,双木之下少了双手。

3.象形字特征的描述

作为狭义的象形字,它们是组成所有汉字的终极部件,一共300来个。对它们的描述是最简单的,只需要逐个注名其音、义。

组成所有汉字的终极部件里,其中极少数是符号,如⺌、丷、乚、彡等,其来源不同,往往没有固定的音、义。可以忽略。

如果用以上方法对所有汉字进行标注,盲人朋友需要记住1550来个终级表音部件和300来个终极表义部件。1550来个终级表音部件涵盖了300来个终极表义部件中的绝大部分(除了上述极少数符号)。

这种描述方法会不会出现重码、信息丢失?

会有极少量的重码。比如:对蔼、葛的描述都是艹 + 匃。因为汉字里这种情形极少——将某个字里面的部分部件抠掉(不包括抠掉偏旁部首),就变成另一个字。

理论上,其容量足够大。表音部件数为1550;组字部件为300,其中,作为部首的有200(据《现代汉语词典》)。理论上,其容量为1550×200=310,000,可以装下31万字。当然,汉字不可能均匀地分布其中,像蔼、葛这样摞在一起,就是重码。

至于信息的丢失,也会发生,但丢掉的是枝节信息,而不是主要信息。比如说:揭、碣,与竭有字义上的关联,因此都有举着、立的意思。没有了竭这个字,相应的信息就损失了——只知道碣是石碑,但是不知道是乌龟驮着的石碑。

曷,丝毫没有负、举的意思。这三个字为什么会有这种音、义上的关联?这就牵涉《说文解字》中的一种体例“从某省”。举例:砝,从去,但它的读音和字义均跟“去”无关,显然来自“法”。

砝=石+法—氵

砝,即“从法省”。

但是这种细微的信息丢失,是可以接受的。

在汉字教学里,盲人面对的许多问题可能是明眼人也需要面对的问题,需要大家共同努力。下面附上含匃且以其表音的字。大家能掌握它们的读音和字义吗?如果您记不住,咱们可以与盲人朋友共同面对这个问题。

含匃且以其表音的字

gai 匃、匄、丐、钙

ga 噶

ge 葛、轕、騔、獦、

he 曷、喝、褐、鞨

hai 猲

ke 渴、嶱、嵑

jie 竭、揭、偈、碣、羯、楬、鍻

ji 偈

jia 擖

qie 朅

qia 擖

qi 愒、藒

kai 愒

xie 歇、蝎、獦

ye 谒、暍、擖

ai 蔼、霭、餲


版权所有© 国家民委中国民族语言文字应用研究院