汉字主笔画技术初探
徐伟建
一、打开汉字之门
1、伟大的文字
汉字,是记录汉语的书写符号系统。
《说文解字》序说:黄帝之史仓颉,见鸟兽蹄爪之迹,知今之可相别异也,构造书契。《平阳府志》记载:上古仓颉为黄帝古史,生而四目有德,见灵龟负图,书丹甲青文,遂穷天地之变,仰视奎星圆曲之变,俯察龟文、鸟羽、山川,指掌而创文字,文字既成,天为雨粟,鬼为夜哭,龙为潜藏。
甲骨文是中国已发现的古代文字中时代最早、体系较为完整的文字。又称为“殷墟文字”、“殷契”,是中国商代后期王室用于占卜记事而刻在龟甲和兽骨上的文字。19世纪末在殷代都城遗址(今河南安阳小屯)被发现。
汉字是现在仍在使用的历史最悠久的文字。与它同时期的古巴比仑的楔形文字、古埃及的象形文字、古印度的印章文字,都先后湮灭在历史的长河中。只有汉字,历尽沧桑却久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。
2、汉字的困惑
与西方字母文字不同,汉字是属于表意文字的词素音节文字。在形体上表现为由众多笔画构成的方块形符号,一般也叫“方块字”。
汉字这种特点带来的一个突出问题就是字形难记、难写,近代以后,这个问题更加明显。为此,建国后,大陆推行了汉字简化,而原属汉字文化圈的韩、越等国则推出了自己的拼音文字。
简体字有效降低了汉字学习难度,但字形难记问题仍然存在,这在现代幼儿汉字教学和对外汉语教学中尤其突出。现行的解决办法是初期记音不记形,只读不写,虽然降低了学习难度,但也造成了学习内容的缺失,未能从根本上解决问题。
现代信息技术迅速发展带来的另一大难题是汉字输入。突出表现是现在人们一般只能借助拼音间接输入汉字,虽然应用很广,但长期使用,很容易导致提笔忘字,造成整个社会的汉字水平持续下降。
因此,平静的表面下,汉字其实是很尴尬和无奈的。
随着中国国力的强势崛起,中华文化正在大踏步走向世界,作为文明的载体,汉字肩负着文化传播的重任。汉字眼下的这种状况,也阻碍着它所担负使命的顺利实现。
3、解决的途径
理论上,解决这个问题,有两个办法:
一是汉字的废止,重新转换成另一种文字,就如原属汉字文化圈的韩、越等国所做的那样。
但这一是意味着汉字传承的断绝,更重要的是,这在现实上是完全行不通的。且不说有没有强大的国家意志、民意基础,光从经济上说,代价要多大?全社会重新学习的代价,又是多大?而且,谁又能保证,替代的会是一个完美无缺的文字体系,不会出新的问题,就像现在韩、越等国已经出现的那样?
再一个方法,就是尊重现实,在不改动现有汉字形体的基础上,通过汉字理论的进步,解决汉字现有的应用问题。
从历史上看,这种方法是客观存在着的。
a、六书概念的出现,形成了一个自觉的汉字创制体系。
b、笔画概念的出现,使汉字由图画变化为今天的形态,成了古今文字的分水岭。
c、部首概念的出现,便利了人们的检字、识字。
d、以王码五笔为代表的字根概念的提出,解决了当时最急迫的汉字快速输入问题。
诸如此类,是有很多的。
所以问题真正的关键,就是我们现在能不能有新的汉字技术,解决眼下的汉字应用难题。这是问题的真谛,其它的,都是假象,假命题。
4、汉字的钥匙
汉字为什么难记、难写?曰:字形复杂。
为什么复杂?曰:
偏旁数目太多,《说文解字》作为部首的偏旁就有540个,《现代汉语词典》作为部首的偏旁有201个。
b、汉字笔画太多,独体字笔画普遍在三四个以上,合体字笔画普遍在七八画以上,多的可能达四五十个,如“龘”字。
那么,怎么办呢?
最好就是,“化繁为简”“化多为少”:数百的偏旁给压缩,最好变成几十个;每个汉字七八个甚至四五十个的笔画也给压缩,最好变成寥寥几个。
但同时,汉字的形态是不能变化的,所含笔画的数目是不能增减的,所以这种“压缩”又只能是内在的,是偏旁自身意义上的归类,是笔画自身意义上的简化。
这种“内在”必不是人为的创造,而是汉字本身就有的。也绝不是简单的某种标准的归类,而应是直观的、理所当然的契合。
二、主笔画
研究发现,一个偏旁不论笔画有多少,其中最核心、最有决定性、最有代表性、最有区别性的,一定是它的折笔画。如“飞、之、而”等。
也就是说,在几个偏旁里,可能都有着横竖撇点几个笔画,但它们的折笔画一般是不同的。折笔画起着最重要的区分偏旁的作用,是这个偏旁的核心,是最主要的笔画,我把它称为主笔画。其它的笔画相对只起了辅助作用,称为副笔画。
这就形成了一个猜想:是不是所有的偏旁,都是有主笔画和副笔画之分呢?
统计了gbk大字库21003个字的偏旁,约66974个,其中,含折笔画的偏旁,有42199个,占了三分之二。
就是说,与折笔画紧密相关的汉字偏旁的主副笔画属性特征,在绝大多数汉字偏旁里,都是成立的。
那么,就可以下这个结论了:
a、构成汉字偏旁的笔