2014年02月11日02:25 来源:北京日报
上边“未”“成”、下边“人”组成的(音:载)字,左边“亻”、右边“西”“域”“哲”摞起来组成的(音:佛)字,“口”中一个“兔”组成的(音:月)字……这些生僻字,普通人见都没见过,更别说在电脑上敲出来了。正是因为难以输入,这些字所承载的丰富文化内涵,正在加速流失。
眼下,西城区的一家文化创意企业,发明了“汉字结构对称输入法”“数码键对称结构汉字输入法”并申请专利。不论多麻烦的字,仅靠键盘上的数字键,三下五除二就能敲出来。
门外汉抄字典发明输入法
智能ABC、五笔字型、郑码输入法……对于常用汉字,国内外的输入法已达数千种;然而,当这些输入法面对生僻汉字时就捉襟见肘了。
如何让生僻字从不见天日的故纸堆里,走进计算机?王子善依靠着不足20人的团队潜心研究,开发出了70195个超大字符集对称码输入法软件,破解了这个难题。
开发出对称码输入法软件的王子善,原先成天跟英文打交道,对于汉字输入这门学问是门外汉。24年前,他第一次接触到计算机,开始记忆大量的汉字字根,学习在计算机上输入汉字。也就是从那时起,他开始琢磨不记字根能否输入汉字?
为了寻找汉字的规律,他将厚厚的第四版《现代汉语词典》手抄了三遍,终于总结出汉字字形的特点,并首先在国内提出汉字字形的对称性和非对称性的理论,同时经过申报获得两项国家发明专利,并首次提出《数字键汉字结构编码规范》技术标准,于2011年11月获得了国家新闻出版总署的正式批准。
王子善介绍,对称码输入法其实是优化了的拼音和笔画输入法,由一个分类键加拼音或笔画组成。分类的方法,即根据汉字的对称或不对称的结构特点将汉字分为以下几类:独体、包围、上对称、下对称、上下非对称、左对称、右对称、左右对称、左右非对称。敲击一个分类键,就意味着撇开了字库中90%的字,而只从10%的字库中挑字,其速度自然要比起从整个字库中挑一个字快得多。
比如左边“亻”、右边“西”“域”“哲”摞起来组成的(音:佛)字,意思是古人眼里,“佛”就是西域来的哲人。其对称类型为“右对称”,输入“右对称”对应的数字键,然后再根据笔画顺序,分别敲击撇、竖、横等对应的数字键,29笔画的生僻字,仅敲5个键,这个生僻字就出来了。
6000万人将不再为“名”所累
资料显示,目前全国13亿人口中,名字中有生僻字的超过6000万人。这些人在办理证照、银行开户、医院就医、民航购票、购买保险及办理其他业务时,经常会因为字库系统打不出生僻字而办不了业务,甚至被迫改名。
王子善告诉记者,生冷僻字在计算机中无法输入主要有两个原因:一是由于计算机内置汉字字库执行的是GB18030-2000字符集标准(字库含汉字20902个或是27484个),很多生冷僻字没有被纳入字库;二是即使一些计算机执行了GB18030-2005字符集标准(含汉字70195个),虽然字库中纳入了生冷僻字,但由于没有相匹配的汉字输入法,同样不能直接输入。
迄今为止,在与汉字信息有关的出版、公安、外交、卫生、金融等系统中,都无法方便、快速、简明地对生冷僻汉字输入与检索,严重影响和制约了这些系统的中文信息数字化的实施与发展。“对称码汉字输入法”软件的问世,将很好地解决这些领域的难题。
让“睡”在古籍里的字活起来
把生僻字搬进电脑,还有一个重要的作用,那就是让古籍文献上网,让更多的人了解传统文化。
中国是世界上唯一有持续不间断文献记载的文明古国,因而古籍存储数量也是最多最大。然而,古籍“上网”的过程中,依然遇到了同样的问题,古籍汉字无法在计算机中输入……
王子善说:“目前全国各大图书馆收藏的古籍图书数千万册。这些古籍图书在收藏中,极易受到气候变化、氧化、腐蚀、虫蚀等带来的破坏,如不及时将这些保存了上千年的文化宝藏,通过计算机存储起来,那将是人类的一大损失。因此,我想通过对称码输入法的推广,让古籍汉字能够畅行网络,让中国文化能够更好地传播和传承。”
(来源:北京日报)
微信“扫一扫”添加“学习微平台”