高效拼音输入键位
均衡性
可以由按键熵
, 手指熵
与手掌熵
三个指标的加权和表示:
\(B = A_k \cdot B_k \cdot W_k + A_f \cdot B_f \cdot W_f + A_h \cdot B_h \cdot W_h\)
均衡性
按键熵
, 使用各按键实际敲击频率
的熵表示, 衡量按键均匀敲击的程度
手指熵
, 使用各手指实际敲击频率
的熵表示, 衡量手指均匀敲击的程度
手掌熵
, 使用各手掌实际使用频率
的熵表示, 衡量手掌均匀敲击的程度
按键频率熵归一化系数
, 值为按键频率熵
最大熵的倒数 $log_2{26}$手指频率熵归一化系数
, 值为手指频率熵
最大熵的倒数 $log_2{8}$手掌频率熵归一化系数
, 值为手掌频率熵
最大熵的倒数 $log_2{2}$按键均匀性权重
手指均匀性权重
手掌均匀性权重
熵
:
\(H(p) := -\sum_i{p(i) \log_2{p(i)}}\)
交叉熵
:
\(H(p \parallel q) := - \sum_i{p(i) \log_2{q(i)}}\)
输入效率
可分别由平均单字击键数量
与平均单字消耗时间
表征
平均单字击键数
样本文章击键总数
样本文章总字数
(不含标点符号)平均单字耗时
手指修正参数
, 表征不同手指敲击所用时间差异(食指 < 中指 < 无名指 < 小指)键位修正参数(行)
, 表征不同行键位敲击所用时间差异(第2行 < 第1行 < 第3行)键位修正参数(列)
, 表征不同列键位敲击所用时间差异(其他 < TGB
= YHN
)手掌修正参数
, 两手交替击键与单手顺次击键所用时间差异(前后两次击键使用不同手 < 前后两次击键使用相同手)单键敲击基本耗时
样本文章击键总数
样本文章总字数
(不含标点符号)Step 2
中制定的标准,尝试在全拼基础上改进打字编码方案,使得输入该文章时字母键的使用更加均衡、输入更加高效,展示改进的结果并分析。对比全拼按键频率分布直方图
, 声母 & (y,w)频率分布直方图
与 韵母 & 介母频率分布直方图
, 可以看出相对于全拼与声母, 韵母数量更多且更加集中(例如i和e)
根据使用平均单字消耗时间
作为输入效率量化方案, 可以计算出各按键的权重(如下表所示
), 其中第一行中的E, R, T, Y, U, I, 第二行中的S, D, F, G, H, J, E, K, L, 第三行中的V, M等键均具有较好的输入效率
行号 | 第1列 | 第2列 | 第3列 | 第4列 | 第5列 | 第6列 | 第7列 | 第8列 | 第9列 | 第10列 |
---|---|---|---|---|---|---|---|---|---|---|
第1行 | Q 1.68750 | W 1.40625 | E 1.26562 | R 1.12500 | T 1.26562 | Y 1.26562 | U 1.12500 | I 1.26562 | O 1.40625 | P 1.68750 |
第2行 | A 1.50000 | S 1.25000 | D 1.12500 | F 1.00000 | G 1.12500 | H 1.12500 | J 1.00000 | K 1.12500 | L 1.25000 | |
第3行 | Z 1.87500 | X 1.56250 | C 1.40625 | V 1.25000 | B 1.40625 | N 1.40625 | M 1.25000 |
小鹤双拼
为例)
üe
& ue
o
& uo
ong
& iong
ing
& uai
iang
& uang
ia
& ua
ü
& ui
a
: A Aai
: A Ian
: A Nang
: A Hao
: A Oe
: E Eei
: E Ien
: E Ner
: E Reng
: E Go
: O Oou
: O U由以上分析结果, 针对全拼与双拼, 先提出两种改进方案
全拼改进方案
: 综合全拼按键频率分布直方图
与按键输入效率权重表
, 将高频字母映射至输入效率较高的按键, 以期在保持按键熵
$B_k$ 不变的条件下提高手指熵
$B_f$, 进而提高其均衡性
$B$, 同时提高其使用平均单字耗时
$\bar{T}$ 表征的输入效率
双拼改进方案
: 综合声母 & (y,w)频率分布直方图
, 韵母 & 介母频率分布直方图
与小鹤双拼布局与击键热度图
, 在保证不发生按键冲突的前提下, 将高频声母与韵母映射至输入效率较高的按键, 以期同时提高均衡性
$B$, 平均单字击键数
$\bar{N}$ 与 平均单字耗时
$\bar{T}$方案 | 均衡性 | 按键熵 | 手指熵 | 手掌熵 | 平均单字击键数 | 击键总数 | 样本字数 | 平均单字耗时 | 总耗时 |
---|---|---|---|---|---|---|---|---|---|
全拼改进前 | 0.897946 | 4.067694 | 2.597974 | 0.995023 | 2.952491 | 53508 | 18123 | 3.263177 | 59138.558594 |
全拼改进后 | 0.877743 | 4.067694 | 2.361951 | 0.992884 | 2.952491 | 53508 | 18123 | 3.000504 | 54378.140625 |
双拼改进前 | 0.944259 | 4.420238 | 2.694713 | 0.998021 | 2.000000 | 36246 | 18123 | 2.240133 | 40597.937500 |
双拼改进后 | 0.932026 | 4.420238 | 2.584392 | 0.985862 | 2.000000 | 36246 | 18123 | 2.108291 | 38208.562500 |
平均单字耗时
衡量的输入效率具有一定的提升, 但是不影响平均单字击键数
按键熵
无影响, 对手掌熵
影响有限, 而手指熵
会显著降低, 进而导致均衡性
也随之降低, 针对对同一种方案改进前后, 均衡性
与输入效率
可能存在一定的负相关, 即按键击键越均衡输入效率反而会下降均衡性
与输入效率
[Keyboard Heatmap | Realtime heatmap visualization of text character distribution](https://www.patrick-wied.at/projects/heatmap-keyboard/) |