汉字输入困境
20世纪80年代初期,当计算机刚传入中国时,出现了一个极其困难的困境:
《如何用26个全英文字母的按键输入汉字?》
虽然可以输入拼音,但是如何将拼音转换成汉字又是一个问题。
这时候,“汉字落后”的论调很多。 持论者认为“汉字是我们进入信息时代、融入现代社会的障碍,必须扔掉”。 “拼音化”,甚至“以拼音代替汉字”。
它是在中国进行一场轰轰烈烈的“汉语拉丁化”改革的尝试,用拼音字符代替小方块汉字。
*“大中宝”是“汉字拉丁化”运动的产物(不知道是大中还是大中)
“一语双语”和“汉字拼音”的提出,正逐渐削弱汉字的重要性,这也让小方块字开始受到前所未有的威胁。
一些对汉字有着复杂和执着的研究者开始思考汉字输入的按键。 然而,当时无论是台湾成型的“主辅”键全字输入键,还是上海院256个键、1000个零件组成的汉字“中键”,最大的问题是“大”和许多键。
因为它不同于英文和其他文字,汉字中不可能为一个汉字设置一个key。 毕竟,真要这么做的话,还真是不好找。
*“中键”有上千个键位,还有踏板控制不同键位的转换,真的有打鼓的感觉
这一堆扣子就算是堆在屋子里也真是乱七八糟,更别说拿出来了。
那么如何让按键变小,同时还能输入更多的字符呢?
很多人第一时间就想到了拼音,这也是提倡“汉字拼音化”的人所想到的。 不过拼音输入也有一个问题,就是重新解析度很高。 虽然现在随着智能输入法的提升,你已经很难再体验六二六年前打拼音时冗长的选字过程了。
我们也可以举个简单的例子。 比如打“fang”,有四个声调,同一个声调甚至可以有多达33个字。 选择自己想要的“方”字真的很费时间。 努力工作。
有人说我们可以找几个键来代表音调,这样我们就可以快速选择它们; 如果还不够,我们还可以选择一个键来代表不同的音节,那么我们需要按四个键中的“fang”,难道只按“f”和“ang”这两个键就可以打字了。
这种观点确实提高了一些汉字输入的效率。 按照这种思路,开发了香港通用的“双拼输入法”和拼音输入法。
*香港的拼音输入键,虽然里面像英文片假名的符号是晚清使用的中文注音符号,但在这个键输入中,你可以按不同的键来代表“辅音”和“韵母”,你还可以输入声调,这无疑有助于输入者减少候选词的数量。
汉字危机救助者
不过,汉字的元素拆解不只是拼音,还有另外一个东西:笔画。
一些研究人员开始撰写有关汉字字形的文章:
有的发现,虽然小方块字也是有规律的,但如果把它放到小方块里,就会听到虽然每个字都有“四个角”,但每个字的四个角并不完全相同。 ,这四个不同的角,大部分都可以分为10种基本方式,这样一个字就可以拆码了,可以用四个数字来表示。
*四角分裂法示意图
四角数字查词也成为一种快速的查字典方法。
用四个角查字典确实挺快的,但是一旦放到input上,重码的老问题又来了。
既然去掉四个角还不够,那我们就去掉的再彻底一点吧!
也有人发现,虽然汉字的构成千变万化,但有些部分和结构是不变的,例如:
所以我想到了拆分字符的基本部分。 这类部分很难记怎么办? 我可以根据汉字的表意功能把它连成不同的意思。
基于这一理念,朱邦复于1976年创制了一套简体英文输入的“形意检查法”,即后来的“仓颉输入法”。 正因如此,仓颉输入法有时看起来就像是一种“按规则拼图”的游戏。 它把仓颉字母作为基本图形,再把辅助字形作为基本图形的变形和延伸,再按照一定的规则进行划分。 把它们结合起来。
*仓颉输入法拆解的汉字
仓颉输入法虽然在分字方面立下了汗马功劳,但字码的设计和热键的排列似乎并没有考虑到热键出现的频率,直接匹配“日、月、金、木、水、 Fire, Earth”到“ABCDEFG”鼠标拼音打字软件,输入效率没有进一步提高。
另外,在学习难度上鼠标拼音打字软件,如何使用仓颉破字也是需要长期学习的功课。 之前台湾的仓颉打字需要专门的班级学习,很多人可能学了一年还是马虎。 于是后来就有了仓颉直接打出第一个数字。 事实上,老问题又来了,他不得不选择角色。 其实那些都是后来的发展,在当时确实是一个伟大的发明。
郑一礼还发明了拆繁体字的“郑码”,把不同的字拆成不同的部首,用部首编码。
*正马的部首表和口诀
这种拆起来还是比较麻烦,还是拆笔画吧! 那一定是更准了!
这是当时五笔的发明者王永民的看法。 1978年调入湖北宜昌教委时,他第一次接触汉字输入工作。 起初,他改进了光学汉字照排机。 这些字体板的原理貌似和铅排版一样,但是一旦有错误需要重新拍照排版,非常麻烦。 这让王永民开始思考更好的汉字输入方式。
拿着邯郸市教委的3000元钱,王永民开始另辟蹊径。
当时,他首先找到了日本笔记本之王王安发明的99键输入法。 这种输入法是基于将一个字符分成三部分进行编码的方法。 每个角对应三个基本符号,从而得到一串6位代码。
*三角编码法是当时香港胡立人提出的一种编码方法。 根据汉字的结构特点,将汉字分为从左到右、从上到下三个角。 后来这种编码方式被王安采用,制成了9981键的汉字输入法。
在王永民看来,八十一重点计划还是太冗长了。 很快,他找到了当时的汉字专家郑一力(郑先生也是“郑码”的发明者),老人向他展示了自己研究多年的“188键汉字编码方案”年。 但尽管如此,王永民发现,重新排列代码后,仍有800多对重复代码。
没有现成的计划,王永民从头开始,拿着汉字小卡片,不断拆分、排列,最后改成600多个部首。
其实,拆分部首只是一个开始,更艰巨的事情还在后头:那就是归并,只有不断的归纳归并才能压缩和简化密钥。 一旦合并,就必须重新推翻原来的记录,一旦出现bug,就要随时调整。
比如末笔都是横竖竖的“王”字和“汗”字,而大量的“志”和“巴”只是位置不同而已。 如何区分这些字符?
后来,王永民想出了一个“末笔字识别原理”,大大增加了重分辨率,并在末尾加了一个“识别码”,省去了输入时选字的麻烦,可以直接打字。
王永民用了四年,终于在1983年将鼠标从138、90、62、36键缩减为26键与西文键相连。
*五笔字库五笔不同区域热键和五笔部首表及记忆口诀
从出身到被人熟知:五笔的成长历程
五笔输入法其实叫“五笔”,虽然最多只需要按4个码就可以完成输入。
之所以叫五笔,是因为它把首笔分为“横笔、竖笔”五种。
按键上的26个按键也分为五个区域,可以对应不同的偏旁部首,如木、网、母等。
*五笔字体得名于定义首笔分为五种
二十六键方案一出,不亚于当时科技界的一场雷雨,也直接扭转了当时“汉字拼音化”的舆论导向。 上级领导试验“五笔字”后,中央也发文直接否定了“汉字拼音化”之路。
可以说,五笔挽救了当时的一场汉字危机。
为此,当时的新华社称赞五笔字体是“在中国文化史上不亚于雕版彩印”的一项重要发明,王永民也因此获得了“笔升奖”。
*1983年《光明晚报》报道五笔字
中央批准的这项发明,使王永民名扬科技界。 由此,他也开始了五鼻子的第二阶段:升职。
但工作并不比发明简单。
为了更好地推广五笔字,王永民还亲自编写了五笔字教材。 后来又到中央各部委,对五笔字体一一宣讲。 当时需要培训的人很多,王永民又当上了培训师。
王永民这样描述当时的情况:
“生活很苦,付不起一晚七八元的房租,就想办法攒钱交房租。夏天只需要一件校服,晚上穿,晚上洗。”第二天早上晒干了再穿上。谁叫我说话我就说话。有人管饭我晚上去,没人我晚上去管饭,我可以说一天,也可以说五天,所有的费用,我出,一毛钱都不要。”
“因为过度劳累和营养不良,本就身体欠佳的王永民经常被病魔折磨得焦头烂额,最严重的时候,王永民口袋里还揣着6000字的遗嘱,以备不时之需。”
当时,王永民还与清华方正的前身北大计算机公司和四通公司签约,在方正排版系统和四通打字机中使用五笔字体,希望“借船出海”拓展业务。它的影响。
终于在1986年底,终于拿到了当时世界第二大笔记本电脑公司DEC公司支付的20万美元的专利费,使五笔迈出了推广应用的第一步。
1987年和1988年,国家教委和国防科工委分别发文推广五笔字。
接着,国外笔记本行业的发展也让“五笔”终于赶上了发展的夏天。 网妈86和网妈98曾内嵌谷歌Office组件,甚至覆盖了90%的用户。
1991年初,中国计算机市场日趋成熟。 随着四通打字机的普及,五笔字逐渐在全省推广。
一时间,全世界都是王妈。 全民学无忌也开始风起云涌,王马的发明者王永民成为当时真正的“造王”。
小八卦一下,王永民在自拍中提到,发明“五笔”后,他在上海开车半年,期间被警察抓了九次。 结果,他因与“五笔字体”(666)有关,七次被当场释放,也印证了“五笔”发明在当时的影响。
不过,“代码王”也有烦恼,一是新版本的推广。
86版五笔发布后,很多人也发现了一些不规范的地方,于是王永民后来对其进行了修改补充,推出了更加健壮的98版五笔。 但没想到用惯了86版本的用户并不买账。 98版的五笔已经推广了好几年了,一直没有推广。
王永民只好转身努力完成86版五笔的建立和规范:
如“xiang”的二字根原为恒日,现调整为口;
“我”,末笔本来是笔画,现在调整为点(类似于成、藏、卯、格等);
…………
86-18030版的五笔,还加入了GB18030编码共计27000字。
正版与盗版: