漫步风雨路输入知我心

  中文电脑“手谈”录   下围棋的时候,双方默不作声,   只能靠手不断地放置棋子来决斗,称之为“手谈”。   其实这个词用在人和电脑的交流上更加贴切,   在语音等新式输入没有普及之前,   我们只能靠键盘、鼠标与电脑“手谈”。   而关于中文输入法的发展,还颇有些曲折呢。   全键盘之梦   电脑是外国人发明的,所以键盘的设计不会照顾汉字系统。只有26个英文字母,怎样才能输入数以万计的汉字呢?Google日本曾经发布过一个愚人节玩笑,表示制作出涵盖所有日文假名、汉字、颜文字的“日文键盘”,这套如同古代活字印刷的排字盘的输入系统令人生畏,却也道出了包括汉字在内所有表形文字输入的困境(图1)。   其实全键盘输入汉字,确实是开始时的解决方案之一。上世纪80年代曾经流行过的“整字大键盘”输入法,在输入界面可从两千多个常用的汉字中直接选择要输入的字。这一方案虽然直观,但输入效率较低(图2)。   还有一种方案,通过“主-辅”键盘的设计,对上述的全键盘有所改进。将全键盘缩小为200多个主键,每个主键上整合9到16个汉字,这样整体字数与全键盘相近。输入时按一次主键,再通过辅助键盘(相应的有9到16个键)选择这个主键上的具体汉字。这一方法有所优化,但仍然很不方便(图3、图4)。   最早的汉字输入法   改造键盘之路被证明很难行得通,于是国人另辟蹊径,充分利用英文键盘,通过对每个汉字进行编码(比如“汉”字的五笔字型码是英文“ic”),从而将所有汉字容纳于26个字母之中。其实这一思路可以上溯到1880年,当时开始流行电报,为了能够发送中文电码,于是为每个汉字编制了一个4位数的数字编码,可以从0001到9999表达一万个汉字。   当然,电报码根本无法记忆,直接作为输入法是行不通的,于是有人开始设计便于记忆的汉字编码。真正意义上有实用价值的汉字输入法,应该是1976年由朱邦复在台湾省发明的仓颉输入法,而不是大家一直认为的王永明五笔输入法。仓颉输入法采用的是拆字输入方式,依据形码规则,重码率极低,而且在掌握一套口诀后,也很好记忆,大大提高了汉字输入的效率。不过仓颉输入法主要针对的是繁体字,简体汉字最早的形码输入法,那就要数大名鼎鼎的五笔字型了(图5、图6)。   五笔字型逞英雄   也许现在已经很少有人知道,因为计算机的普及,汉字曾经经历过一场很大的危机。上世纪七十、八十年代,当时要向电脑中输入汉字还需要配置专用的“汉字键盘”,导致输入效率极为低下。那时就曾有部分专家学者建议取消汉字,全民改用汉语拼音。   正是王永民在1978至1983年的五年间研发出的五笔字型,彻底解决了汉字输入的困境,当时在世界上五笔字型首破汉字输入每分钟百字大关,引起轰动。   五笔字型将汉字笔划分成横(同提)、竖、撇、捺(同点)、折五个区,再按照一定的规律将字根或者码元分布到标准键盘的25个英文字母键上(没有Z)。因为字根对中国人来说非常熟悉,再加上编码很短(最长的四码,最短的只有一码),所以记忆起来很方便,经过一段时间训练,几乎每个人都可以快速输入(图7)。   拼音输入法的崛起   按常理来说,拼音输入法不需要额外的记忆,拼音与英文字母也能一一对应,应该是最理想的输入法,但它一开始的发展却非常不顺利,在与五笔输入法的大战中更是溃不成军。究其原因,重码是主要的祸首,因为汉字的同音字太多了,往往同一个拼音会显示十几个甚至更多的同音字来,选择的过程导致输入速度下降,也影响到盲打。   为了扭转这一局势,拼音输入法一直在改进。1993年的中文之星绝对是当时输入法中的一颗明星,它能边输入拼音边显示汉字,在当时是一个很强的设计。之后,黑马神拼之类的输入法实现汉字整句输入功能,让拼音输入法有了一个质的飞跃,到2000年的智能狂拼的出炉,更是让整句输入如日中天。   其实早在上世纪80年代末,哈工大博士王晓龙申请863课题的关于汉语分词的研究,就已经奠定拼音整句输入的理论基础。而微软也在Windows 95中文版内置的微软拼音输入法中,开始支持整句输入,只是效果不是很好。   直到近两年的云端技术的兴起,拼音输入法终于扬眉吐气,压下了五笔字型的势头。云输入法的优势就在于,它有巨型的语料库技术支持,我们只需要输入简单的几个拼音,它就可以通过智能算法,从语料库中快速匹配出精确的答案。至此,五笔字形在速度上已无优势,没有人下功夫去学它也就情有可原了。   迄今为止,输入法可谓“万码奔腾”,而许多新的输入方法,比如语音输入、扫描输入等技术也是层出不穷,我们与电脑的交流更加顺畅了。欢迎大家继续关注本期大话题中其他与输入相关的内容。   三人行   厂商大战 “殃及”网民?   刚刚过去的2013年,对输入法相关的厂商很不平静,   搜狗最终花落腾讯,360空手失望而归。   而到了2014年,几大厂商的博弈依旧暗潮汹涌。   输入法为何引发诸多大厂商的关注?   这一现象对普通网民是利是弊?   CFan:采访记者。 吴言:某大型软件公司测试部经理,应要求隐去真名。 莫明:某大型软件公司运营部经理,应要求隐去真名。   得平台者得天下   CFan:输入法本来是个边缘产品,为什么现在几大厂商都开始在这一领域争夺?   莫明:网上曝光过据说是马化腾的一封内部邮件,关于收购搜狗的,其中有句话“新的搜狗公司,将明显强化输入法在PC和无线端的市场地位,和腾讯的核心产品深度整合,致力成为一个网民更加喜爱、更有活力的平台。”注意他强调的是“平台”。输入法不再是之前的小软件,而是网民上网的一个入口,一个平台,所以才会成为网络厂商的必争之地。   无言:另外,无论我们在网上搜索、发微博、聊天,所有数据都要经过输入法,这一数据对厂商也有巨大的吸引力。通过分析用户数据,就可以了解用户的喜好,分析用户趋势,这对自身的产品发展,甚至对广告投放,都会大有益处。   输入法对用户的利弊   CFan:一个是平台入口,一个是数据采集,这些对用户来说,究竟是福音还是恶梦?   莫明:厂商的竞争必然带来服务的优化,对用户来说肯定是好事。作为网络入口让上网更方便,充分的数据分析让输入法更贴近个人习惯,这些都是好事。   吴言:不过任何事情都有两面性。从去年某知名输入法带来的大面积用户隐私泄露事件,可以看出它在安全方面的隐患。   CFan:输入的任何隐私内容,都会被上传到云服务器上,确实是件很可怕的事。可是用户又能如何呢?   莫明:从长久来说,一是通过立法来解决隐私保护,一是能开发出一些中立的输入法。最近网上风传某软件厂商要开发安全输入法,值得期待。   吴言:立法的目标太过遥远,不现实,而中立的厂商基本不可能存在,他声明是安全的,又如何验证安全?明知道有风险,但不得不用,尤其是用习惯了某种输入法之后,离开了反而不习惯,这就是一种现状。除了顺从这样的大环境,我们也只能在细节上尽可能做些改变。比如,当输入银行账号等敏感数据的时候,可以不用第三方输入法,而是切换到系统输入法中,或是这些应用自身所带的专有输入。   厂商竞争收紧用户选择   CFan:观察各厂商开发的输入法,会发现一个现象,大家主要开发的是拼音输入法,对五笔字型很不重视,甚至没有。为什么?   吴言:拼音输入法没有什么版权纠纷,而且它的输入速度越来越快,五笔已经没有什么优势可言了,没落是必然的。谁会花好几个月的时间学习一个没有任何优势的软件呢。   CFan:不过厂商“厚拼音簿五笔”,是否变相限制用户在输入法上的选择呢?有人曾发文说拼音输入是“汉字文化的掘墓机”,为什么不给五笔一个机会?   吴言:这说法有一定道理,现在不少人手写时提笔忘字的现象很严重。   莫明:理由很牵强,就算用五笔也会提笔忘字,五笔对记忆文字的帮助不会太大。反之,如果用五笔不会读这个字,这不更是“汉字文化的掘墓机”?

  中文电脑“手谈”录   下围棋的时候,双方默不作声,   只能靠手不断地放置棋子来决斗,称之为“手谈”。   其实这个词用在人和电脑的交流上更加贴切,   在语音等新式输入没有普及之前,   我们只能靠键盘、鼠标与电脑“手谈”。   而关于中文输入法的发展,还颇有些曲折呢。   全键盘之梦   电脑是外国人发明的,所以键盘的设计不会照顾汉字系统。只有26个英文字母,怎样才能输入数以万计的汉字呢?Google日本曾经发布过一个愚人节玩笑,表示制作出涵盖所有日文假名、汉字、颜文字的“日文键盘”,这套如同古代活字印刷的排字盘的输入系统令人生畏,却也道出了包括汉字在内所有表形文字输入的困境(图1)。   其实全键盘输入汉字,确实是开始时的解决方案之一。上世纪80年代曾经流行过的“整字大键盘”输入法,在输入界面可从两千多个常用的汉字中直接选择要输入的字。这一方案虽然直观,但输入效率较低(图2)。   还有一种方案,通过“主-辅”键盘的设计,对上述的全键盘有所改进。将全键盘缩小为200多个主键,每个主键上整合9到16个汉字,这样整体字数与全键盘相近。输入时按一次主键,再通过辅助键盘(相应的有9到16个键)选择这个主键上的具体汉字。这一方法有所优化,但仍然很不方便(图3、图4)。   最早的汉字输入法   改造键盘之路被证明很难行得通,于是国人另辟蹊径,充分利用英文键盘,通过对每个汉字进行编码(比如“汉”字的五笔字型码是英文“ic”),从而将所有汉字容纳于26个字母之中。其实这一思路可以上溯到1880年,当时开始流行电报,为了能够发送中文电码,于是为每个汉字编制了一个4位数的数字编码,可以从0001到9999表达一万个汉字。   当然,电报码根本无法记忆,直接作为输入法是行不通的,于是有人开始设计便于记忆的汉字编码。真正意义上有实用价值的汉字输入法,应该是1976年由朱邦复在台湾省发明的仓颉输入法,而不是大家一直认为的王永明五笔输入法。仓颉输入法采用的是拆字输入方式,依据形码规则,重码率极低,而且在掌握一套口诀后,也很好记忆,大大提高了汉字输入的效率。不过仓颉输入法主要针对的是繁体字,简体汉字最早的形码输入法,那就要数大名鼎鼎的五笔字型了(图5、图6)。   五笔字型逞英雄   也许现在已经很少有人知道,因为计算机的普及,汉字曾经经历过一场很大的危机。上世纪七十、八十年代,当时要向电脑中输入汉字还需要配置专用的“汉字键盘”,导致输入效率极为低下。那时就曾有部分专家学者建议取消汉字,全民改用汉语拼音。   正是王永民在1978至1983年的五年间研发出的五笔字型,彻底解决了汉字输入的困境,当时在世界上五笔字型首破汉字输入每分钟百字大关,引起轰动。   五笔字型将汉字笔划分成横(同提)、竖、撇、捺(同点)、折五个区,再按照一定的规律将字根或者码元分布到标准键盘的25个英文字母键上(没有Z)。因为字根对中国人来说非常熟悉,再加上编码很短(最长的四码,最短的只有一码),所以记忆起来很方便,经过一段时间训练,几乎每个人都可以快速输入(图7)。   拼音输入法的崛起   按常理来说,拼音输入法不需要额外的记忆,拼音与英文字母也能一一对应,应该是最理想的输入法,但它一开始的发展却非常不顺利,在与五笔输入法的大战中更是溃不成军。究其原因,重码是主要的祸首,因为汉字的同音字太多了,往往同一个拼音会显示十几个甚至更多的同音字来,选择的过程导致输入速度下降,也影响到盲打。   为了扭转这一局势,拼音输入法一直在改进。1993年的中文之星绝对是当时输入法中的一颗明星,它能边输入拼音边显示汉字,在当时是一个很强的设计。之后,黑马神拼之类的输入法实现汉字整句输入功能,让拼音输入法有了一个质的飞跃,到2000年的智能狂拼的出炉,更是让整句输入如日中天。   其实早在上世纪80年代末,哈工大博士王晓龙申请863课题的关于汉语分词的研究,就已经奠定拼音整句输入的理论基础。而微软也在Windows 95中文版内置的微软拼音输入法中,开始支持整句输入,只是效果不是很好。   直到近两年的云端技术的兴起,拼音输入法终于扬眉吐气,压下了五笔字型的势头。云输入法的优势就在于,它有巨型的语料库技术支持,我们只需要输入简单的几个拼音,它就可以通过智能算法,从语料库中快速匹配出精确的答案。至此,五笔字形在速度上已无优势,没有人下功夫去学它也就情有可原了。   迄今为止,输入法可谓“万码奔腾”,而许多新的输入方法,比如语音输入、扫描输入等技术也是层出不穷,我们与电脑的交流更加顺畅了。欢迎大家继续关注本期大话题中其他与输入相关的内容。   三人行   厂商大战 “殃及”网民?   刚刚过去的2013年,对输入法相关的厂商很不平静,   搜狗最终花落腾讯,360空手失望而归。   而到了2014年,几大厂商的博弈依旧暗潮汹涌。   输入法为何引发诸多大厂商的关注?   这一现象对普通网民是利是弊?   CFan:采访记者。 吴言:某大型软件公司测试部经理,应要求隐去真名。 莫明:某大型软件公司运营部经理,应要求隐去真名。   得平台者得天下   CFan:输入法本来是个边缘产品,为什么现在几大厂商都开始在这一领域争夺?   莫明:网上曝光过据说是马化腾的一封内部邮件,关于收购搜狗的,其中有句话“新的搜狗公司,将明显强化输入法在PC和无线端的市场地位,和腾讯的核心产品深度整合,致力成为一个网民更加喜爱、更有活力的平台。”注意他强调的是“平台”。输入法不再是之前的小软件,而是网民上网的一个入口,一个平台,所以才会成为网络厂商的必争之地。   无言:另外,无论我们在网上搜索、发微博、聊天,所有数据都要经过输入法,这一数据对厂商也有巨大的吸引力。通过分析用户数据,就可以了解用户的喜好,分析用户趋势,这对自身的产品发展,甚至对广告投放,都会大有益处。   输入法对用户的利弊   CFan:一个是平台入口,一个是数据采集,这些对用户来说,究竟是福音还是恶梦?   莫明:厂商的竞争必然带来服务的优化,对用户来说肯定是好事。作为网络入口让上网更方便,充分的数据分析让输入法更贴近个人习惯,这些都是好事。   吴言:不过任何事情都有两面性。从去年某知名输入法带来的大面积用户隐私泄露事件,可以看出它在安全方面的隐患。   CFan:输入的任何隐私内容,都会被上传到云服务器上,确实是件很可怕的事。可是用户又能如何呢?   莫明:从长久来说,一是通过立法来解决隐私保护,一是能开发出一些中立的输入法。最近网上风传某软件厂商要开发安全输入法,值得期待。   吴言:立法的目标太过遥远,不现实,而中立的厂商基本不可能存在,他声明是安全的,又如何验证安全?明知道有风险,但不得不用,尤其是用习惯了某种输入法之后,离开了反而不习惯,这就是一种现状。除了顺从这样的大环境,我们也只能在细节上尽可能做些改变。比如,当输入银行账号等敏感数据的时候,可以不用第三方输入法,而是切换到系统输入法中,或是这些应用自身所带的专有输入。   厂商竞争收紧用户选择   CFan:观察各厂商开发的输入法,会发现一个现象,大家主要开发的是拼音输入法,对五笔字型很不重视,甚至没有。为什么?   吴言:拼音输入法没有什么版权纠纷,而且它的输入速度越来越快,五笔已经没有什么优势可言了,没落是必然的。谁会花好几个月的时间学习一个没有任何优势的软件呢。   CFan:不过厂商“厚拼音簿五笔”,是否变相限制用户在输入法上的选择呢?有人曾发文说拼音输入是“汉字文化的掘墓机”,为什么不给五笔一个机会?   吴言:这说法有一定道理,现在不少人手写时提笔忘字的现象很严重。   莫明:理由很牵强,就算用五笔也会提笔忘字,五笔对记忆文字的帮助不会太大。反之,如果用五笔不会读这个字,这不更是“汉字文化的掘墓机”?


相关文章

  • 祖国在我心中演讲稿:祖国在我心中演讲稿
  • 祖国在我心中演讲稿每当看到冉冉升起的五星红旗,每当听到响亮的<义勇军进行曲>,我总是热血沸腾,心中顿时燃起自豪的火焰:我是中国人,我是龙的传人. 看!万里长城像一条巨龙,卧在连绵起伏的崇山峻岭之间;听!滔滔黄河水一浪接一浪,拍打 ...查看


  • 祖国在我心中演讲稿:我是龙的传人
  • 每当看到冉冉升起的五星红旗,每当听到响亮的<义勇军进行曲>,我总是热血沸腾,心中顿时燃起自豪的火焰:我是中国人,我是龙的传人. 看!万里长城像一条巨龙,卧在连绵起伏的崇山峻岭之间;听!滔滔黄河水一浪接一浪,拍打着岸边的岩石.望! ...查看


  • 祖国在我心中演讲稿:我们是祖国的建设者
  • 尊敬的领导,评委,亲爱的朋友们: 大家上午好! 每当看到冉冉升起的五星红旗,每当听到响亮的<义勇军进行曲>,我总是热血沸腾,心中顿时燃起自豪的火焰:我是中国人,我是龙的传人. 看!万里长城像一条巨龙,卧在连绵起伏的崇山峻岭之间; ...查看


  • 庆教师节给老师的贺卡贺词
  • [导语]三尺讲台,染苍苍白发,桃李满园,露美美笑厣.赞美您,敬爱的老师,祝福您,敬爱的老师!三尺讲台,染苍苍白发,桃李满园,露美美笑颜.赞美您,敬爱的老师,祝福您,敬爱的老师!欢迎来到本站,本文是为您特别搜集的<庆教师节给老师的贺卡贺 ...查看


  • 情侣关于爱情的祝福语
  • [导语]美丽的鲜花比不过你开心的笑颜,莺声燕语比不过与你开心的交谈,日月星辰比不上你在我心中明亮的光芒.你是我的女神,我愿一生陪伴在你的身旁.这篇关于<情侣关于爱情的祝福语>文章是本站为您搜集的,希望对大家有所帮助! [篇一] ...查看


  • 风雨中我触动了生命的芬芳
  • 风雨中我触动了生命的芬芳 风雨中,生命的故事在不断的上演,它的芬芳随着风,随着雨不断的冲击我的心灵,给我生命的感悟. 雨雾·荷绿点点连 我漫步在夏雨所浇淋的公园,世间万物仿佛都沉醉在雨雾的笼罩之中,一切喧嚣化为平淡,留下的只是大自然的喘息声 ...查看


  • 爱心献血宣传口号大全
  • 无偿献血宣传标语口号大全 1.爱我中华,捐我热血. 2.人间自有真情在,献出鲜血播下爱. 3.献血无损健康,救人功德无量. 4.无偿献血,血浓情更浓. 5.献出的血有限,献出的爱无限. 6.你血输在我身,你情深入我心. 7.献血献髓救人,生 ...查看


  • 十七岁的晴朗
  • 阳光洒满了青石小巷,你轻唱着一首歌谣走过.一朵云,又一朵云,在下一个巷口相遇.每一朵云里,都闪耀着青春的悸动.繁花是你燃烧的笑颜,那一低头的娇羞,惊艳了一段斑驳的时光. 从这个花季走到下一个花季,下起雨来,又从这场雨中,走进另一场雨里.不变 ...查看


  • 清秋漫步人间,洗去了谁的浮世尘埃?
  • 清秋的恬然跃然于人的心里,所有关于秋的文字又都跃然于纸上,在所有的感觉和视觉里,清秋已经翩然的向我们走来许久了.清秋漫步人间,给人心灵最深的洗涤.那么,洗去了谁的浮世尘埃呢? --题记 清秋给人的味道就是淡淡的味道,能把人生命中的所有气息得 ...查看


热门内容