与五笔等图文码相比,拼音作为声码的门槛较低。 更可怕的是,拼音背后是一整套九年义务教育体系。
01五笔是怎么来的?
1978年12月,全国汉字编码学术交流会在青岛召开。
本次“青岛会议”汇聚了来自中科院和各地高校的众多学者。 他们讨论的问题在今天是难以想象的:
如何在电脑中输入汉字?
在当今搜狗、科大讯飞风靡全球、年轻人点击文字速度如此之快的时代,很难想象在20世纪70年代、80年代的中国,中文输入成为一项“卡壳”技术。
原因也很简单,汉字太多了。
1980年发布的国家标准GB2312字符集收录了6763个汉字,而2005年发布的国家标准GB18030-2005字符集收录了多达70244个汉字。
国家标准GB18030字符集
而且与西方字母不同,汉字没有类似“ABCD”的排序方法。
如何将纷繁杂乱的汉字与键盘上的按键相匹配,当时还没有现成的解决方案。 这也使得汉字在信息处理尤其是信息输入方面远远落后于西方国家。
1984年洛杉矶奥运会期间,当法新社记者看到中国记者还在手写新闻稿时,他们非常愤怒:7000名记者中,只有中国人还在手写!
当时学术界有不少认为“汉字落后”的声音。 一些极端学者甚至认为,在计算机时代,汉语拼音字将取代方块字,成为汉语的出路。
“汉字拼音化”、“拼音代替汉字”甚至“双语化”的说法不绝于耳。 有些地方的学校甚至推出了“完整汉语拼音”教学。
在计算机技术腾飞的前夜,汉字输入问题必须得到解决。
会上多位专家教授提出了不同意见。 主流观点是:开发专门用于汉字输入的键盘。
当时汉字专用键盘的解决方案有3种。 其中一个是一个带有完整字符的大键盘。
也就是说,把几千个汉字,按照部首划分,放在一张桌子那么大的键盘上,哪里需要就用,so easy!
如果一个键盘不够用,还可以放置第二个或第三个键盘。
该方案优点突出,没有学习成本,而且非常简单。 缺点也非常突出。 除了简单直接之外,都是缺点:不能触摸触摸式,速度极慢,限制是每分钟输入10个汉字的限制。 而且键盘要几千块钱,设备大,成本高,不实用。
第二种选择是模仿日本设计的“主辅键键盘”。
该解决方案由主键盘和辅助键盘组成。 辅助键盘负责定义分区,主键盘可以通过按下相应的按键来输入分区中的特定汉字。
可以看出,该方案是对上述方案的改进。 它缩小了设备的尺寸,允许双手打字,而且速度更快。
但这造成了一个巨大的错误:打字员需要记住每个汉字位于哪个分区以及它的排序位置。
即使只有几千个汉字,也是巨大的学习成本。 这种方案基本上没有流行的可能。
第三种方案是汉字激光排字之父王选院士提出的256键“中型键盘”方案。
王选
该解决方案将所有汉字分解为 1,000 多个笔画和部首,并将它们放置在 256 个键上。 只要将这些“零件”按照结构组合起来,就可以像拼乐高一样拼出想要的汉字。
中文键盘首次采用了“分字”方式,即汉字编码类型中的“形码”。
后来的五笔、郑码,以及朱邦甫1976年创制的仓颉输入法,都采用了“形码”。
仓颉输入法
与前两个系统相比,中置键盘的解决方案显然先进得多,但还远远不够完美。
毕竟英文QWERTY键盘只有26个字母键,按键少,足够轻,而且已经在国际上使用。 如果可以的话,谁不想直接使用现成的东西呢? 不过最好的五笔打字练习软件,汉字确实太特殊了。
青岛会议召开的同一年,河南省南阳市科委王永民也加入了汉字输入法的开发。
王永民
与当时的主流思维类似,他最初希望打造一款专门针对汉字的键盘。
为了实现这一目标,王永民将《现代汉语词典》中的12000多个汉字一一分解,进行分类统计,归纳出600多个字组,王永民将其命名为部首。 并根据出现频率,选择了 125 个最常用的。
在他的努力下,他将中文专用键盘的键数从256个减少到188个,再减少到62个。到1982年,王永民开发出了36键的解决方案。
而这一切都是在没有计算机和纯手工统计的情况下开发的。
此时,他面前有两条路。
一是推进36项重点计划。 这个解决方案于1982年成功投入使用,作为当时最先进的解决方案,它实际上具有普及的潜力。
另一种办法就是回去继续研究,压缩键位,压缩到能完全适应26键QWERTY键盘为止。
要知道,按键压缩得越少,重复码,即一组按键对应的不同字符就会越多。 而且选词会极大地影响效率。 此时,已经很难再进一步压缩了。
但王永民却选择了一条更为艰难的道路。
为了减少重复编码,王永民经过近一年的研究,发明了“末笔识别码”,对每个字符的最后一笔进行编码,将重复编码率降低了一个数量级。
1983年8月28日,王永民发明的“五笔字体”公布。
五笔的伟大之处首先在于它的“速度”。
由于引入了“横、竖、横”五种笔画划分,用户最多只需按键5次即可锁定一个唯一的汉字。
没有重复的代码,这意味着用户不再需要选择他们想要的单词。 通过练习,甚至可以实现双盲输入,即不看键盘、也不看屏幕进行打字。
而且,与大键盘和中键盘相比,五笔的按键较少,学习成本较低。
很多80后的人可能还记得“五笔公式”,比如“身边王少有五一,土生子担十寸雨”之类的。 熟练的五笔用户甚至不需要这些,而是依靠肌肉记忆来输入。
其次,五笔完美兼容QWERTY键盘,不需要开发新的硬件。
五笔刚发布时,由于不需要专用键盘,甚至被学术界认为是“崇洋媚外”、“不顾过去”。 然而,市场和用户用脚投票。
1984年,国家科委、国防科工委下发“红头文件”,向全国全军推广五笔字体。
1986年,五笔字体通过外交部进入联合国。 同年,其使用权以数十万美元出售给美国DEC公司,成为中国第一个出口到美国的计算机专利技术。
此后,IBM、微软、苹果相继购买了专利权。
在马来西亚、新加坡等东南亚国家,五笔仍被广泛使用。
在中国,五笔也成为一代中国人接触和学习的第一个汉字输入法。
在电脑尚未普及的20世纪90年代,使用电脑被认为是一种职业技能。 中国有大量的培训课程,五笔是这些培训课程中最重要的教学内容。
当时很多国产电脑的键盘上不仅有英文字母,还标注了五笔部首,以方便学习。
但为何这样的“当代活字印刷技术”却败给了拼音输入法,成为“少数民族”和时代泪水的代名词呢?
02为什么五笔输给拼音
1995年,智能ABC输入法诞生。
这是一个经典的拼音输入法。 用过Smart ABC的应该都是和我一样的老网民了。
但经典就是经典。 说实话,与现在的拼音输入法相比,当年的智能ABC已经和智能无关了。
它的存在就是为了提供一个庞大的词库,让用户找到拼音对应的词和词。
而它的词库其实也缺乏实用性,因为那个时代的词库主要是通过官方媒体和各类报纸杂志的报道中的高频词统计得到的,所以这样的词库其实很不符合普通人的理解。 语言需要,而且没有办法在线更新词汇。
现在拼音输入法所必需的联想输入、模糊发音、常用词汇记忆等功能,在当时甚至是天方夜谭。
作为一名聪明的ABC Level 10玩家,我通过长期的使用养成了一种记忆力:我会记住那些经常使用的单词所在的页面。
而且因为词库不更新,有时候你还得想一些笨办法来提高打字效率。 例如,当我想输入“hitea”时,最快的方法是分别输入“like”和“tea”,然后删除多余的单词。
总之,当时的拼音输入法在效率上远远无法与五笔相比。
为什么拼音输入效率低?
有一点是,正如我们前面提到的,拼音的重复率非常高。 不分声调的组合只有400多个,而这些组合对应了数千个汉字。
这意味着拼音不仅需要打字,还需要选字,而选字往往是容易打字却很难找的。
特别地,某些发音对应于大量的多音字符,例如“zhi”、“chi”和“shi”。
如果你的名字中有一个“一”字,恰好是生僻字,而你只能使用拼音输入法,那么恭喜你,在国标GB18030字符集中,有“一”音的字符有407个独自的。 我打字了一会儿,寻找“火葬场”这个词,感觉棒极了。
王永民提出的图形代码设计三原则中,第一原则是“兼容原则”。 也就是说,重复率要低,才能保证编码的唯一性。 最好达到2%以内。 拼音中存在大量同音多音字,效率显然不理想。
为了提高效率,后来又引入了双拼输入。 不过,只要是基于拼音的,重码就是一个无法解决的问题。
另外,五笔字体在按钮排列方面也进行了设计。
从上图可以看出,它也是基于QWERTY键盘的。 双手五笔打字的负荷率基本均衡。
但输入拼音时,右手忙,左手休假。 而如果你用标准的打字方法,你会发现左手最有力的食指似乎没什么事可做,而最无力的小指却负荷重重。
简单来说,拼音打字从人体工程学角度来看并不是很科学。
当然,这个问题还是得抛给QWERTY键盘。 这款键盘的按键设计本质上是不合理的。 我稍后会谈到这一点。
因此,从效率和科学性来看,五笔输入法远远超过了拼音输入法。
真正改变拼音输入法的尴尬局面的是依赖记忆和互联网。
拼音输入法作为一种严重依赖词库的输入法,需要大量的存储空间来存储词库。 在20世纪80年代,当计算机内存以K为单位、存储空间以MB为单位时,不可能存储足够大的字库。
直到20世纪90年代,主流计算机的硬盘容量达到了GB级别,内存达到了几十MB的级别,随后出现了日益庞大的拼音字库。
词汇量越大,可以匹配的单词就越多,效率就越高。
互联网带来了更大的变化。
2006年,搜狗输入法诞生。 从基本原理上来说,它与智能ABC、紫光拼音没有太大区别。 唯一不同的是,它通过搜狗的搜索引擎大大扩展了词汇量。
用户输入的拼音不再对应本地词库,而是匹配整个中文互联网的内容。
此外,搜狗还包括全句输入和联想输入功能。 要知道,输入整个句子比逐字输入要高效得多。 而且很多时候你不需要打完整的拼音,系统会帮你补全。
另外,它还会记录你经常使用的高频词,随着你的使用,它会变得越来越方便。
这些功能的加入使得拼音输入法更加高效。 搜狗输入法一年内就占领了90%的市场份额。 尽管后来腾讯、百度、谷歌加入战局,搜狗的市场份额也没有跌破70%。
但客观地说,这些输入法本质上并没有让拼音成为更准确、重码率更低的输入法。 它只是利用大数据、大词汇量和联网功能来强行提高匹配效率。
这就像我听到的一个关于程序员的笑话:
产品性能不够,怎么办? 程序员有两种选择。 一是努力工作六个月,写出一个非常复杂的程序,以提高系统的性能。 另一种是请假半年,在家睡觉。 一觉醒来,更多NB硬件降价了。 只需更换硬件即可解决问题。
拼音相对于五笔的真正优势在于它是一种门槛较低的输入法。
汉字是字形、字音、字义三位一体的。 这三者中,我们往往先了解字音、字意,即先学听、听,再读、写。
而且,我们的思维往往是以言语的形式进行的。 当我们思考事情的时候,我们的脑海里就会有一个声音。
与五笔这样的形码相比,拼音作为声码的门槛更低,更符合我们的本能。
更可怕的是,拼音背后是一整套九年义务教育体系。
并不是拼音输入法没有学习要求,只是很少有人需要专门学习拼音。
我们从小学一年级第一节语文课开始就开始学习aoeiuü。 直到高考,拼音从来没有离开过语文学习。
目前中国九年义务教育巩固率超过90%,拼音几乎成了这一代中国年轻人的工厂设置。
有趣的是,五笔的用户群中包括许多 20 世纪 60 年代出生的人。 他们没有接受过完整的拼音教育,但他们会读写。 这群中老年人可以更顺利地使用五笔。
然而,面对中国日益完善的教育体系和庞大的拼音用户群体,五笔毫无胜算。
互联网企业为何愿意大力发展拼音输入法,是因为用户基数大,有商业想象空间,所以巨头们愿意在输入法等边缘市场投入人力物力。
移动互联网时代,拼音真正占据了主导地位。
03 九宫格 vs 全键盘
还记得上学的时候,无论男生还是女生都喜欢买大一号的校服,而且袖子至少要能遮住手。 一半是上课时藏起耳机听音乐,一半是上课时把手机放进袖子里互相发短信。
只有我一个人,没有女生给我发短信,我只是在上课时玩手机看NBA文字直播。
虽然那个时代还没有大屏智能手机,但几乎每个学生都精通盲打技能,因为手机都有九个方格的物理按钮。
随着智能手机的普及最好的五笔打字练习软件,我们这些习惯使用九方格的人又开始使用全键盘。
手机输入法的历史始于20世纪90年代。
1993年,诺基亚发布了第一款支持短信的GSM手机。
从此,手机不再是纯粹的手机,进入了文字时代。
但手机真正成为了高效的文字通讯工具,这要归功于一种名为T9的输入技术。
事实上,在西方国家,电话号码曾经包含数字和字母,因此固定电话上的数字键也标有字母。 不仅用于打字,还可以让用户记住电话号码。
这款键盘被称为E.161键盘,有趣的是,Q和Z已经很长时间没有出现在这款键盘上了。
1995年,美国软件公司Tegic Communications成立。 该公司专门开发小型电子设备的技术。 后来被美国在线收购。 这是开发T9输入法的公司。
T9比搜狗更早使用了预测文本技术,也就是我们前面提到的常见的词联想输入功能,而且它不仅支持拼音,还支持笔画输入。
这项技术让手机打字有了质的飞跃。
20世纪90年代末,T9输入法开始被三星、诺基亚等手机厂商广泛使用。 这就是我们俗称的“九宫格”。
记得九宫格最流行的时候,有很多相关的代码,比如962464代表“我爱你”,647449633代表“你是我的”。
也许这就是属于80、90后的接地气的爱情故事。
全键盘和手机的结合直到1996年才出现。
那一年,诺基亚发布了一款名为9000的手机,这也是世界上第一款全键盘手机。
它具有类似笔记本电脑的设计。 从外观上看,它就像一部普通的手机。 打开顶盖,你会发现里面有一个大屏幕和一个QWERTY键盘。
作为一款定位于商务人士的掌上电脑级产品,诺基亚9000不仅支持收发电子邮件,还具有浏览器功能,支持上网。
在1996年,这简直就是一项黑科技。
全键盘长期以来被认为是商务手机的标配功能。
后来黑莓、Palm、诺基亚的E系列主打商务属性,大量机型也配备了全键盘。 另外,侧滑全键盘也流行了一段时间,比如诺基亚的N97。
直到2007年iPhone的发布,这种情况才得到改变。
长期以来,苹果一直痴迷于虚拟全键盘。 直到2013年的iOS7,苹果才开始支持九宫格,而在次年的iOS8中,苹果又开放了第三方输入法。
然而,由于长期以来,主流智能手机厂商都将全键盘输入设置为默认输入方式,这导致全键盘输入最终成为移动互联网时代的主流。
这也引起了一场旷日持久的争论,九方格还是全键盘,哪个效率更高?
以下内容是我的个人财产,请大家随意收听。
我看过很多意见,双方都有粉丝。 使用九宫格的人表示,九宫格单手操作比较方便,误触率较低,所以更容易盲打。
使用全键盘的人会说,现在手机屏幕足够大,不容易误触。 使用全键盘进行双手打字显然更准确,当然也更高效。
这时候,使用双咒的人就会说,如果你练习并习惯了双咒,双咒是最快的。
五笔长老都说他们都是渣渣,速度还不如五笔。
但我发现大多数人追求的根本不是效率。
我比较喜欢用九宫格,只是因为我是90后。 在智能手机出现之前,我就已经在诺基亚上将九宫格运用得淋漓尽致。
对于刚接触手机、使用全键盘的人来说,这种与电脑键盘更加一致的输入法显然更加自然。 为什么要费力去学九宫格呢?
至于我父亲,在他那个时代,连九年义务教育都没有。 很多人拼音都学不好。 他第一次接触打字是五笔。 他不可能改用拼音打字。
事实上,输入法的效率确实存在差异。 但这种微小的差异在日常聊天和写作中完全可以忽略不计。
我们追求的根本不是效率,我们只是在维持我们自己的习惯和我们成长的时代。
很多时候,当我想与某人就某件事争论时,我突然发现,支持我在互联网上疯狂搜索论点的并不是我对正确的痴迷,而是我对自己立场的痴迷。
输入法只是沟通和输出的工具。 正如我们从不通过说话的速度来判断一种语言的价值一样,“我们写什么”比“我们写多快”更重要。
这种对“效率”的虚无主义追求往往会变成低效率。
这让我想起了曾经沉迷于使用“效率”工具的时候,经常在朋友圈推荐一些我认为不错的软件。
学习了Luhmann的卡片笔记法,尝试了Notion,并使用Flomo、Obsidian、Craft等构建知识结构。 我支付了 Curtain 和 XMind 的费用。 在编写软件时,我使用了 ulysses、Metion 和 Bear。 、iawriter、typora等等等等,只是为了提高一点点“效率”。
直到有一天我看到一个帖子。 笔者作为一名效率软件的资深用户,详细对比了各个软件的优缺点,并提供了自己的使用心得。
帖子的结尾是:现在我开始使用笔和纸。
忽然我感觉自己置身于剑墓之中,只见独孤秋白说道:“四十岁之后,就不再为物所困,一草一木、竹石皆可作剑,从此以后。”接下来,我刻苦练习,渐渐达到了无剑胜于剑的地步。” 的一种感觉。
这他妈就是所谓的境界。