衡量输入法是否优秀的指标

优秀的输入法应具有的特点:

   易学性和输入速度是优秀输入法应该具有的特点。具有这两个特点的输入法才有生命力。
如何判断某一输入法这两个特点是否具备,目前并没有一套完整的考核方法。下面将如何考核
的某输入法,提出的一些考核指标以作探讨。

一、易学性
    汉字的输入方法最好能在30分钟到一天的时间完全学会输入法的内容。
内容包括字根的记忆、字根对应的键盘的记忆、字的折分规则的记忆等。

衡量易学性的指标有:(编码体系规范的性。)

    1、汉字编码所有的键盘数量不宜过多,最好只用26个英文字母键,不多占其他键。也不
浪费宝贵的键盘编码空间。

    2、每一键所对应的字根是否具有强烈的共同特征。
不能将没有共同特征的字根免强归类到一起。具同特征可以是形声意上面的相同特征。
这种共同特征越明显,越容易记忆,越不容易搞错。

    3、尽量避免歧义
歧义包括取码的顺序把歧义和字根之间的歧义。
取码顺序的歧义是指字的拆分字根的先后顺序的不是很明显,存在几种可能。
字根之间的歧义就是指存在两键以上所对应的字根中存在的相似的特征。
由于歧义存在,所以输入者在折分汉字的过程中就会容易出现误拆分的问题,增加了学习的困难。
如五笔字型的容错码就是为解决歧义导致误拆分问题而提出的一种解决方法。五笔字型容错码的
提出恰恰说明五笔字型的编码方案本身存在着歧义较严重的问题。这也从另一个方面
说明五笔字型是不够规范的。

    4、高频字(一级简码字)尽量安排在该字第一码所对应的键盘上,不能随意安排,否则增加用户额外
的记忆,另一方面又和以词组输入时发生冲突。五笔字型将多个高频字随意安排是极不可取的。

    5、易记性。
包括字根记忆和字根对应键盘的记忆。
字根记忆:字根数量不宜过多,尽量选取40个左右的字根为基础字根,将其他字根以这些字根为基础进行归并。
所以基础字根应选取那些最常用的,人们最熟悉、最有意义的字根。
字根对应键盘的记忆:这是易学性关键指标之一。如能做到用户无需花时间去专门记忆就能记住所有字根对应
于键盘的编码安排是最好的。最容易记忆的方法是采用象形(如表形码)或字根的声母对应键盘(各种形声码),
或形声意混合记忆等方法。 


二、输入速度快
是指达到熟练的程度后单位时间所能输入汉字的数量。熟练的程度是指用户拆字无需时间,相当于将汉字对应的
键盘编码直接进行输入所能输入的汉字数。(这是最理想的情况,但实际上用户很难达到这一程度,编码越易学,
人拆字花费的时间越少,相反越多)。这里以户拆字无需时间的为假设的前提下,以什么指标来衡量各种输入法速度的快慢。
   1、重码率
    包括字的重码率和考虑字使用频率的重码率,因为虽然存在重码字,但另一重码字很少使用,输入过程中无须进行选择,
相当到没有重码。由于一般输入法第四码极少使用,所以只考虑三码范围内的字的重码率是比较科学的。
由于在实际的中每种输入法的重码率较难确定,所以选择另两个容易获得的指标来考核各种输入法的重码率的高低。
这两个指标分别是:二级简码字和三级简码字的数量。这两个指标是体现键盘编码分布是否均衡的重要指标,数量越多,越均衡,
重码率相对来说越低。
上述两个指标是对于选用相同数目的键盘编码的输入法之间来比较的,例如都为26键的输入法进行比较。
   

   2、左右手键盘编码分布均衡
左右手交替输入速度才快,如果输入集中于某一只手,则会使输入速度受到影响。均衡不单包括字数的均衡还包括指字频的均衡

   3、高频键尽量安排在灵活的中指和食指。

三、流行两码具有无与伦比的性能
易学性:

    1、26键40个左右的字根,字根是一些非常有意义的,与人们的活动密切相关的字根,将所有的字根归纳为三句话,
极易记忆;
  

    2、声形意的字根键盘对应方法,记忆极其容易;

  
    3、将相近的字根合并到同一键盘,字根之间的极少出现歧义,形码只取首尾两码,且按字的位置分别取码,
所以不存在取码顺序的歧义;

    4、高频字的第一码就是对应于该字所在的键盘编码;


速度快:

1、二级字简码字有674个,比理想情况下的26×26=676个只差两个字,非常均衡;

2、三级字简码字有4820个;

3、三码内可能无重码的情况输入26+674+4820=5520个字。这5520个字基本上包含了所有的常用字。

3、左边15键(QWERTASDFGZXCVB)对应的字频总和约占全部汉字汉字字频的54%,右边15键(YUIOPHJKLMN)对应的字频总和
约占全部汉字汉字字频的46%,再加上约10%把标点符号(假设一般情况下每输入10个汉字会有一个标点符号),
左右两边基本均衡。