Kodama's home / tips.
前回は ディレクトリ下のディスク使用量を観察し, フラクタル的に分布することを確かめた.
今回は, ディスク使用量がフラクタル的では __ない__ 例を見る.
いくつかのグラフを作成するが, その意味の詳細については省略する. データ列を分析する手法としては, フラクタル解析や時系列解析などのテキストを読むと良い.
$ du -sk /usr/share/* | sort -nr | gnuplot gplot.txt > disk-use.png
以下で, gnuplot に与えるコマンドファイル gplot.txt を変えて様々なグラフを作る.
set terminal png plot "< cat" using ($0+1):($1) # linear-linear注. $0 が行番号. $1 は 第1フィールド.
set terminal png set logscale y; plot "< cat" using ($0+1):($1) # y=a b^x # exponent
set terminal png set logscale xy; plot "< cat" using ($0+1):($1) # log-log
前回 は, ディスク使用量がフラクタル的に巾分布する例をみた. また, この例でも, 上位 10 個程度については, 巾分布に近いようにも見える. しかし, 無条件でフラクタル的に分布すると考えるのは無理がある事がわかる.
ファイルサイズの観察 ( part1, part2 ) を参考にすると, 凝集が起こっているとフラクタル的な巾分布に近付き, 素のままに近いと指数分布になるという傾向があると考えても良いと思われる. これが, この例での上位の部分と下位の部分の傾向に現れている可能性がある.
Kodama's home / tips.