发布信息

深入探讨五笔字型86版与98版差异及优缺点分析

作者:软荐小编      2024-12-23 09:07:19     141

《海阔天空》网站注:这是几年前网上出现的一篇文章。这是一篇非常优秀的文章。作者非常认真细致地深入探讨了五笔字体两个版本的差异,指出了86版本的一些不足,肯定了98版本的进步。这里所说的“五笔字体”俗称王码五笔86版或86王码。由于汉字的形状复杂,给图文码的输入带来了很多困难,很难编写出完全科学合理的查码软件。 98版确实在某些方面比86版更合理,但也是相对的。也有很多不合理的地方。因此,王码公司一度想推出“统一”版本。即使实现了“统一”,也未必是完美的。在科学发展的道路上,永远只有更好,没有最好。

如果要问输入汉字最“飞”的输入法是什么,那么大多数人都会说“五笔字体”。虽然很难说最快的汉字输入法是什么(笔者曾亲眼目睹过专业正码高手的精彩表演),但有一点是肯定的,五笔字库作为一种专业级的快速输入法,是非常受欢迎的。 。的。

据说,全国五笔汉字输入冠军每分钟可打256个汉字。经测试,相同内容的文章中英文字符数约为中文字符数的5倍。使用五笔输入法,平均1.5-2.5次按键即可输入一个汉字。应该说,随着五笔字体的出现,汉字的输入速度已经超过了西文字符的输入速度。

五笔字体是王永民于1986年发明的,已经流行了十几年。到1998年,王永民“一键耕耘十年”,推出五冲程兄弟“98王码”。

笔者原本从未学过五笔字体。由于工作原因,我需要写很多文章。我很想学习一种快速的汉字输入法,所以我很自然地想到了五笔字体。但一次偶然的机会,我买回了一个“98王码”软件,我也有幸成为98王码的第一批用户之一。我学习使用98王码已经一年多了,那么“王码”和“王码”“五笔字体”有什么区别呢? “王妈”有什么好呢?有了“五笔字体”,为什么还要推出“98王码”呢?经过笔者的使用体会和重新学习“五笔字体”,我可以和大家分享一下我在这方面的想法。

首先,王码可以输入繁体字。中国汉字有数万个,《康熙字典》收录汉字47000多个。连文字学家也说不清汉字到底有多少个,但凡事都不能没有“基”,所以必须人为地确定一个“基”。 ,所以流行的字符集有几种,最标准的GB国标简体字一共有6763个字符。在我国大陆的现代生活中,这6763个字就足够了。汉字专家通过统计7075篇现代文章中的2162万个汉字,总共只找到了6300个汉字。 (引用)。我们现在使用的各种输入法大多只能输入这6763个字符。当然,86版五笔字库只能输入这些字符。

然而,事情有时并不那么简单。有一些单词你可能每天都会遇到但无法输入。这多是由一些人的名字造成的,比如《朱镕基》中的“镕”,《冯哲》中的“喆”。还有“冤”、“冤”等,因为这些字符都是GB国标以外的汉字。目前流行的大多数输入法都对它们无能为力(全拼和标准郑码等除外)。作为专业输入领域的佼佼者,五笔字体是在国家标准简体汉字的基础上发明的。字根的设定并没有考虑到当时的繁体字。五笔字体的新兄弟“98王码”,在五笔字体的基础上,只需稍作修改,就可以对这些字符进行简单的处理。它甚至可以处理CJK大字符集中的21003个汉字(该字符集中包含古文字和一些来自韩国、日本等国家的汉字),所以即使你是一个看不懂简体字的同胞,你也可以轻松地处理CJK大字符集中的21003个汉字。通过王码输入繁体字。

二是码元设置更加科学。五笔字形输入的基本原理是通过部首的“组合”形成汉字。 98王码中,部首称为码元,其含义相同。为了便于记忆,五笔字库将汉字笔分为五大类(故称五笔字库),并将笔画相同或相近的根字排列在这五大类中。但你会发现“力”、“九”等词根排列在“竖”区,不太科学,而王妈则排列在“撇”区,合理得多; “×”((十字)是一个使用频率很高的词根,但五笔字体将其排列在“Q”键上,所以用五笔字体打字时,会频繁使用左手小指,不成一直线同时,也造成了一些重复的码字,同样,“乃”、“周帝”、“臼”、“黄帝”等字根也被改为合理和。容易记住职位。

另外,王妈删除了少量不太有用的部首。例如,五笔字体中有一个“戋”字根,干、贤、简等汉字都是由它组成的。但“戋”可以简单地由“一”和“个”两个现成的词根组成,所以这个词根在王妈中被去掉了。

同时,王码增加了大量有用的部首,比如“福”,使得干、福、年、支等字特别容易打;有了“福”,就使得溥、溥、卜、福等字变得非常容易打;加上“干”、“秋”、“未”、“母”、“圆周”、“五”……不用看,有了这些词根,很多单词就变得容易了理解。 ,并且可以更清楚地看到人物的根源。五笔字体共有130个字根,而王码有245个。更可贵的是,仔细研究后,你会发现这些字根都是繁体字的重要组成部分,可以让王码轻松处理繁体字。另外,这些有用的部首的出现,也减少了重复码字的数量。例如,五笔字库中重复频率最高的码字是YNKY,它有“赢、赢、赢、雷”四个字符,而在98王码中,这四个字符的每个字符都没有重复编码。 98王字体比五笔字体的重复字符少。

(作者新注:版主说98王码重码字比86版本多,笔者并不完全同意这一点,从作者的经验来看,98版本只是重码字少一些。)

第三,人物的“组合”方式更加合理,更多地考虑到人物的第一直觉。作为笔式输入法,对字符进行“分组”的方式有很多种。例如,对于“养”这个字,作者可以使用七种方法来拆分它。每一种都有意义,但只有一种是正确的,所以五笔字体规定了自己的分割字符的规则和习惯。但由于五笔字体发明较早,因此在汉字的分割上存在很多不科学的地方。

“离”、“闹”等字符从技术上讲是“亠”和“×”的组合,不是“文”字,但五笔字体将其解释为“文”,严格来说是不科学的。

比如,学习五笔字“一”的人就会在这个字上“走弯路”。很少有人能“看出”这是“日”与“匕”的组合,而在98王码中,“拖”的组合方法科学得多。

“宇”是一个常用字,可以组成很多字,但它下面不是“禾”字,而是“一”和“木”的组合。

“曰”是一个常用字,但理解为“图”、“之”、“右架”、“丿”总是有点别扭。

“鉴”字应该理解为“仪狄”,没有一定的“水平”是看不到的。而“丑”的底层也不是“土”。你看不出“宇”下面有一个“卩”底。

“颜”字是一个几乎每个人都容易写错的字。五笔字体将其解释为“丿”和“停”,这是完全错误的。作为小学生,一​​定要注意这个字不要写错。

“向”和“向”这两个常用汉字,中间都有一个“日”字。这本身是可以理解的。可以这样理解。发明家就能拥有这样的“力量”。但“闲”、“兔”、“邑”等同类型字,中间有“口”码。刚接触五笔字体的人在这里会犯错误。

让我们看一些细节。两个版本之间“Qiu”的代码选择不同。 98版选择“一”、“水”、“点”,86版选择“十”、“四点”。 、“点”,从发明者的角度来看,任何一个都可以,但是五笔字体有一个规则,那就是当第一位和第二位数字有多个选择时,往往是“小两个大” 。例如,“生”的第二个数字不是“earth”而是“qingtou”; “来”选择“米”而不是选择“木”;第二个代码“否”也是选择“小”...,所以从常规角度来看,98版本更科学。

在代码提取的一致性方面,86版本也存在问题。 “万”字有三个重码字。如果你认为这个代码提取是正确的,那么理解“AO”这样的单词就会有一定的困难。获取代码的思路与“一万”不同,初学者会走弯路。

98王码的一些简化带来了很大的便利。五笔字体高手最常犯的错误是“几”、“退”、“几”等字,因为这些字分别是“VC”或“VE”。 ”,但盲打一旦速度快了,就很容易出错。98王码将两种类型合而为一,绝对不会出错。

五笔字库的代码获取甚至出现“错误”。就像“靥”字一样,毫无疑问,这个字的下面是一个“面”字。在五笔字体中,“面”字的编码被规定为“厂”、“冂”、“丨丨”、“三”。如果这样获取代码,“靥”字的最后一个代码应该是“三”,但是你会发现“靥”字与键名中的汉字“大”的代码相同。由于键名中的汉字不能有重码,所以五笔字库只好规定“靥”的最后一个码是“囗”(L)。

“寇”字也常用。我的一位同事的名字里就有这个词。但不知道是为了避免与“万”字重复编码,还是避免与“劳”字重复编码。五笔字体还人为地将最后一个“囗”编码固定在“囗”(L)上。诚然,这种方式重复字符较少,但这种人为规定影响了五笔字体的科学性和一致性。如果你有兴趣研究一下所有的五笔字形编码词典,不少都额外标注了这些字的正确编码,包括王永民自己编的《王码词典》,其中“靥”和“坥”是也分别标注了。就是“DDDD”和“APFC”,但是如果你这样输入的话,你将无法输入这两个单词。

事实上,五笔字体中的代码“囗”(L)有特殊的含义。笔者研究过五笔字体的多个版本。在早期的版本中,比如2.2版本,为了避免重码,很多常用的字符都是用“囗”码来区分的,比如“风和刚”、“曲、支和韵”、“人和” 《诗》、《太和章》、《半河豆》等;后来王永民采用了“默认第一个字符,空格键取第二个”“字”的方法来区分,像4.0版本和4.5版本。但还有一些东西没有改变,那就是“靥”和“寗”。就连非常流行的《五笔教材》也没有指出“囗”的特殊含义以及这些特殊字符的拼写。更重要的是,没有给出任何解释。当然,话又说回来,即使王永民错了,他也得“犯错而已”。你所要做的就是记住,因为你将无法用正确的代码获取方法来输入这些单词。 (作者新注:从作者今天的感受来看,这一段有点偏颇)

还有“乐”、“武”、“云”、“戍”、“昏”、“鸟”、“行”、“卜”、“书”、“”、“段”、“追”等。 “”、“凸”等字,这些字在五笔字库中对字符的“分组”方法要么不是很准确,要么难以理解,但这些在98王码中都得到了很好的修正,使其更加完整且科学,并考虑到对汉字的直观理解(作者新注:作者在这里对原文进行了简化)

更难能可贵的是,王妈特别注重笔顺。对于成年人来说,强调汉字的笔顺似乎没有必要,但对于中小学生来说,养成良好的笔顺习惯非常重要。中考必须有笔顺测试。对于这道题,没有正确的笔顺是无法查阅工具书的。由于五笔字体发明较早,为了形成文字,将字根“拼凑”在一起,从而产生了一些倒笔画。因此,五笔字体不太适合小学生学习。

例如“飞”的笔画顺序应该是“丨”、“三”、“丨”、“三”。五笔字体中为“三”、“丨丨”、“三”。

例如“桃”正确的笔画顺序是“木”、“儿”、“四点”,但五笔字体是按照“从左到右”的原则,所以变成了“木” ”、“四点”、“”、“儿”的写法相反。

像“瓦”字一样,最后一笔应该是“丶”。但在五笔字体中,它是“Y”。

另外,五笔字体本身的编码顺序也不一致。例如,“蜀”是“亠”、“纺”、“四点”、“十”的组合。中间的“纺”先取,但“颜”是“操”、“二点”、“口”、“四点”的组合,先取旁边的“二点”。取码顺序不一致,没有一致的统一标准。 98王码纠正了早期五笔字体以“铜”字根造成的不必要的倒笔画。因此,98王码“开创了汉字输入法大规模纳入中小学教学的新局面,标志着我国汉字输入的发展”。科技进入了新的历史阶段”(王永民原话)。

四是让“补码”更加完善。 “补码”是五笔字体的精髓。这是减少重码、加快汉字盲打速度的最明智的方法。应该说是王永民智慧的结晶。 《补码》根据汉字的“上下”、“左右”、“组合”三种结构,规定了四码以下汉字的一些取码方法。

不过,应该说,1986年王永民发明五笔字体时,补码获取的原理还不是很完整。 “君”、“穿”等“上下”结构无论怎么看,都比“合”结构更合适。同时,“jun”和“qun”避免重复代码。

“毇”字是常用字,没有补语就不能打。五笔字体认为它是“三式”字,但作为一个“组合”结构的“三式”字,总显得有点难以理解。

例如,“我”字的最后一笔在五笔字体中是“丿”。不过,“福”的最后一笔是“丶”,而不是“一”。这是因为五笔字形规定了“丿”。 “格”、“承”、“吾”、“戋”等最后一笔是“丿”,但其他结构字没有这样的规定。

同时,五笔字体还规定“道”、“九”、“匕”、“气”、“力”、“乃”等字符的最后一笔是“Y”。但如果真的这么理解的话,同形字“边”的最后一笔是“丶”。因此,很多初学者对于补码非常头疼。连教五笔的老师都认为补码是最不清楚的。甚至可以说,连王永民本人都无法“自圆其说”。

这里我再仔细分析一下:比如“亍”字没有补语就打不出来,五笔字形中“亍”的补语指定为“三类”,但同类型的字“亓”,没有补码就无法打出,但在五笔字体中,“亓”字被指定为“Type 2”。当然,这是因为“三式”是常用的“井”字,这可能是王永民为了避免重码而做出的规定。那为什么重复的代码“君”和“群”不以同样的规定分开(而98王码很巧妙地解决了这两个问题)?如果你有兴趣研究一下王永民亲笔撰写的“最权威”的五笔字体专着《王码词典》,关于补码的章节,除了少数特殊规定外,其余的都非常“模糊”。这让初学者甚至高手无所适从,“无依无靠”。因此,有的五笔字体教材甚至说:“对于五笔字体的代码获取,你不用想为什么,只需要花时间去背就可以了……”

但这一切,在王永民的《98王码》中,一句话就轻松解决了:“欲得补码,取此字最后一笔”。多么简单啊!可见,王永民对于五笔字体这十年来的成功与不足非常清楚。但五笔字体的市场占有率太高。有很多大师已经不被允许进行调整和修改了。这一切的一切问题都只能在《98王码》中得到解决。

第五,对短代码的考虑更加完善。五笔字、王码有25个一级简码字,即“的”、“一”、“中”、“国”、“主”、“成”、“不”、“”等字。为”、“工作”等只需点击键盘即可输入。同时还有大量的二级简码字,这意味着只需按两次键盘就可以打出该字。对于打字高手来说,充分掌握一级、二级短码是提高速度的主要手段。

在86版五笔字体中,王永民以初学者为中心,所以有些简码设计得并不完美。例如,在“U”键上,第一级短码是“product”,但“UT”的第二级短码仍然是“product”。这就使得“道”这样的高频词的二级短码被别人“生产”了。 “占”,而“道”的三级缩写码是“第一”,所以“道”字需要四个键才能打出。

“吉”字是高频词,但五笔字库打出需要四笔盲打的软件,因为在“N”键上,“一”字占两笔,而在98王码中,“吉”字占两笔。 “只需要两笔。只要击中即可。

按一下“S”键和按两下“SV”键都是“尧”字,所以另一个高频字“根”需要敲三笔。

第一次点击“P”键和两次点击“YP”键都是“这个”,所以“光”字的位置被占用了。

“I”键上是最常用的字符之一“bu”(五笔字体和98王码中“bu”的编码也不同),但它的二级缩写码“GI”仍然是“bu”,这样的处理使得常用的“欢”字需要三个按键来敲击(98王码在这些地方设计得巧妙得多),这可以说是一种资源的浪费。

98王码在短码处理上的一些细微改进也相当巧妙。举个例子:“关”和“头”的前两个编码都是UD。作为二级短码,是否应该选择“关”?还是选择“头”?应该说,很难说这两个词哪个出现的频率更高,但与“关”组成的词就像“钥匙”、“器官”、“关门”、“初级”、“照顾”、“都可以直接用“连续词”打出来,但能由“头”字组成的“连续词”却很少,只有“心”、“心头”等少数。等等。这里86版五笔字体的二级缩写码是“冠”,而98版的王码是“头”。虽然仅一字之差,但味道可鉴。王永民在98王代码中对简单码字的“资源”的运用已经达到了细致的程度。

由于86版五笔字体的简码字已经被别人“研究透了”,王永民已经到了“骑虎难下”的地步,无法修改简码86版五笔字体的字符。 《98王码》终于给了王永民纠正这一切的机会。 86版本二级简码字约570个,98版本二级简码字约620个,三级简码字更多。 ,以便合理利用短码资源。

当然,从高标准来看,应该说98王码的简码字符的一些改动并不好。例如,原来的二级简码“曾”现在改为“查”; “张”现改为“向”,“进”在98版中为“健”。从作者使用频率来看,“曾”、“张”、“进”比“查”更重要好在,类似的变化也很少,比如高频词“烈”只有两个笔画。 86版的,但是98版的“万”取代了,所以我必须打三笔。

第六,连续打字更符合时代感。提高五笔字体打字速度的另一个非常重要的因素是连续打字单词的使用。短如“我们”、“邓小平”等;只要“中国人民广播电台”、“北大西洋公约组织”等,只需四个键就可以输入。五笔字体本身已经为你“排列”了一些相连的单词(约15000个)。随着时代的发展,其中一些排列连词已不再常用,如“克格勃”、“斯大林”、“姚依林”、“高级干部”、“政治评论”、“左倾”、“右倾”等。靠”、“探亲假”、“党的十一届三中全会”等,98王妈去掉了这些不常用的词语,同时还增加了一些带a的词语。时代感,如“再婚”、“调解”、“工作”、“签约”、“媒体”、“社区”、“休闲”、“超市”、“投资公司”、“技术监督局”等等,让打字的文字更加现代。与此同时,“螳螂捕蝉黄雀在后”、“联产承包责任制”、“党和国家领导人”等多词短语大量增加。 “北大西洋公约组织”、“科学技术委员会”,包括最长的十四个字——“香港特别行政区行政长官董建华”。用四笔打字,如果你有兴趣比较一下“五笔字体4.5版”和“98王码”中的“多”字,你会发现“98王码”比“五笔字体4.5版”更好。多字连词(指四个字以上的词组)大约增加了六七倍,大大加快了汉字的输入速度。如果你的王码可以造字,这个问题就不是很突出,因为你可以自己造字,但是你用的是捆绑的五笔字体。如果你不能自己创造它,那么你将会非常痛苦。当然,98王妈里也有一些词,比如“再见”。这或许就是王永民的用意。如果不是正版,不能造字,那就不行。你必须找到办法。

最后我们应该看到,五笔字体已经流行了十几年,而98王码问世也才一年多的时间。 98王码的社会使用率在一段时间内不太可能超过五笔字体。而且,学习五笔字体的人数还在大量增加,更多的人仍然不明白五笔字体和王码的区别。因此,笔者建议想要学习五笔字库但又不会五笔字库输入法的人一定要以98王码为主;小学生只能学98王码;认识五笔字体但学得不好的人,如果你觉得五笔字体有点难掌握,你应该尽快学习98。王妈;而五笔字库输入水平高的,甚至是高手,也不需要改成王妈,因为五笔字库水平高的人都了解字根、分字规则、连字规则。 。你必须重新学习所有的安排。完成此操作大约需要一周时间。为了适应,方法是把汉字的关键625个字符,甚至GB6763字符全部用98个金码打出来。笔者用这种方法掌握了两种“不同的五笔字体”,但在改变之初你仍然会感到不方便,改变之后盲打的软件,很长一段时间都不可能像以前那样打字。我用先学的98王码每分钟可以打90个字,但用后来学的五笔字体每分钟只能打40多个字。大约一个月后,就可以达到90字的水平了。 98版和86版王码在常用字符的选码上有较大差异,如“卜”、“欢”、“万”、“夫”、“齐”等;几个关键代码元素发生了变化。高手适应起来并不容易,比如“光”、“极”、“乃”、“玖”等,要成为“双枪将军”,就必须具备适应这些方面的能力。

同时,笔者也希望目前生产的各种掌上型电脑笔记本,如“文曲星”、“名人”、“好易通”等,尽快在输入法中加入98王码输入法,因为《认识98王码》不认识五笔字体的人会越来越多。谁先攻下98王码,谁就能进一步领先市场。

最后,对于98Kingma本身来说,还有进一步发展的空间,比如可以链接一个分类词库。无论是“98王码”还是“86五笔字体”词库主要是针对政治文章的,这意味着你在打字报纸文章时特别舒服,但在打字专业文章时,大量的单词无法使用。有些人可能永远打不出“新华社香港分社”这个词,但“鼠标”这样简单的字我却打不出来;有些人可能一辈子都打不出“王永民”这个名字,但想打出“鲁迅”这个名字却无能为力。 98王码虽然可以自己“造字”,但也会造成大量重复代码,给自己带来麻烦。如果你能设计一个“王码”,让你自由选择连接金融、化工、计算机、经济、法律、艺术等分类词库,你不仅可以屏蔽你不使用的词,避免重码影响速度,同时也满足各类人群的需求,各取所需,大家“异口同声”地说话,大大加快了汉字的输入速度,消除了频繁“乱码”之苦。造词”。那该是多么“美丽”啊!

相关内容 查看全部