Kodama's home / tips.

"the quick brown fox..." って何よ? 文字の出現頻度を調べる.

"the quick brown fox jumped over the lazy dog"
英文の印字サンプルとして見掛けるこれですが, 短い文の中にアルファベットのほとんどの文字を含むことで, 印字例やタイピング例に使われているようです.
含まれていない文字は "s". 普通の文書では比較的出現率が高いはずなのですが, この文には出ていません. 残念.

調査例:

通常の文書では "e" の出現率が高い.
$ cat SLIB.FAQ | gawk '{s=tolower($0);for(i=0;i < length(s);i++){e[substr(s,i,1)]++}} END{for(c in e){print e[c]" "c}}'|sort -n
...略
439 n
454 r
465 s
466 o
483 a
564 t
661 i
784 e

"the quick..." では "o" が4回で最大.

$ echo "the quick brown fox jumped over the lazy dog"|gawk '{s=tolower($0);for(i=0;i < length(s);i++){e[substr(s,i,1)]++}} END{for(c in e){print e[c]" "c}}'|sort -n
.... 略 (出現1回の文字)
2 d
2 h
2 r
2 u
3 t
4 e
4 o


Kodama's home / tips.