分布と評価基準値
画像配信効率のばらつきにはどのような特性が見られるか
Webパフォーマンスに関する指標(ページ読み込み時間、ファイルサイズなど)は、対数正規分布に従うことが多く知られています。ここでは画像配信効率(KB/Mpx)にも同様の傾向が見られるという仮説を立て、対数正規分布によるフィッティングと統計的な検証を行います。
分布の特性を明らかにすることで、「平均的なECサイト」の水準と、自社サイトの相対的な位置づけを客観的に評価するための基準値を導出します。
対数正規分布フィッティング
画像配信効率(KB/Mpx)のヒストグラムを描くと以下のようになります。 対数正規分布に従うという仮説のもとフィッティングを行い、理論曲線(赤線)を重ねています。
対数正規分布パラメータ: μ = 5.2830, σ = 0.7381
累積分布関数 (CDF) による適合度評価
累積分布関数(CDF)を用いて、経験分布と理論対数正規分布の適合度をより厳密に評価します。 Kolmogorov-Smirnov(KS)検定統計量 D は、経験CDFと理論CDFの最大乖離を表します。 D の値が小さいほど、理論分布が実測データをよく説明できていることを意味します。
Kolmogorov-Smirnov 統計量: D = 0.0250 (x = 24 KB/Mpx)
KS検定による適合度の判定
Kolmogorov-Smirnov検定は、実測データがある理論分布に従うかどうかを統計的に判定する手法です。 帰無仮説 H₀ を「データは対数正規分布に従う」とし、有意水準 α = 0.05 で検定を行います。
KS検定統計量 D は、経験CDFと理論CDFの最大乖離(縦方向の最大差)です。 この値が臨界値 Dα = 1.36 / √n を超えた場合、帰無仮説は棄却されます(データが理論分布に従わないと判断)。 超えなかった場合、帰無仮説は棄却できず、理論分布による近似が統計的に支持されます。
本データでは D = 0.0250 であり、臨界値 0.0363(α = 0.05, n = 1404)を下回っています。 したがって帰無仮説は棄却されず、画像配信効率の分布は対数正規分布によく適合していると結論できます。
5分位による配信効率の基準値
画像配信効率の分布が対数正規分布に従うとの想定に基づき、サイト単位の画像配信効率を5分位で区分すると以下の表のようになります。
| 評価↕ | 開始(KB/Mpx)↕ | 終了(KB/Mpx)↕ | ページ数↕ |
|---|---|---|---|
| とても軽い | 0 | 111 | 285 |
| やや軽い | 111 | 166 | 281 |
| ふつう | 166 | 236 | 278 |
| やや重い | 236 | 372 | 282 |
| とても重い | 372 | ∞ | 278 |