パレート分布

世界の8割の富は、2割の人によって独占されているという。パレートは、所得の研究を通してこの原理に着目し、所得がどのような分布に従うかを研究した。所得が従う確率密度関数は次のような概形になるという。

このようなパレート分布の確率密度関数は、パラメーター\(\alpha\)及び\(\beta\)を用いて次のように表される。なお、冪\(\beta\)をパレート指数と呼ぶ。

\[ f(x) = \frac{\beta\alpha^\beta}{x^{\beta + 1}}\\ x>\alpha,\ \alpha>0,\ \beta>0 \]

ほかにパレート分布に従う確率変数として、

・チェーン店の売り上げ順位(一握りの店舗がすべての売り上げのほとんどを占める)

・月のクレーターの直径(大きいものは少ない)

・全体の2割のクレーマーに8割の時間を割く

・他サイトからの被リンクが多いサイトは、全体の一部である

などが挙げられる。

パレート分布の概形

赤色から橙色\(\alpha\)、赤色から紫色で\(\beta\)の変化を表現している。パラメーターの組み合わせによっては、\(f(x)>1\)となる。確率は1を超えないので、おかしいと感じるかもしれないが、間違いではない。連続型確率変数の場合、確率は確率密度関数の不定積分によってのみ定義される(1点では面積が0になってしまい確率を定義できない)ためである。確率の総和が1になることは自明ではないため、次で証明する。

確率分布であることの証明

確率分布であるには

\(x\)がどのような値でも、\(f(x)\)は0より大きい(\(\forall{}x\in{}X, f(x)\geq0\))。

・全ての\(f(x)\)を足すと、合計1になる(\(\sum_{x\in{}X} = 1\))。

1番目は確率密度関数から自明であるため、2番目を示す。

\[\begin{eqnarray} \int_\alpha^\infty{}f(x)dx &=& \int_\alpha^\infty{}\frac{\beta\alpha^\beta}{x^{\beta + 1}}dx\\ &=& \alpha^\beta\int_\alpha^\infty{}\frac{\beta}{x^{\beta + 1}}dx\\ &=& \alpha^\beta \left[ -\frac{1}{x^\beta} \right]_\alpha^\infty\\ &=& 1 \end{eqnarray}\]

より題意は示された。

パレート分布を着想する

Vilfredo Paretoは如何にしてパレート分布を考え付いたのか。参考文献をあたったが、それらしい記述は見つけられなかった。そのため、本節ではパレート分布の着想について考察していく。

まず、あるコミュニティに属する人の所得モデルを仮定する。この社会ではある程度の格差があるものとする。この条件で、パレート分布における累積確率密度関数\(F(x)\)を考える。縦軸を所得の総和とし、横軸\(x\)\(x=\alpha=2\)の点から右に、所得が多い順に総和するグラフを想定すると、次のようなグラフになる。

このコミュニティに属する人数が50人だとすると、所得が多い順に10人の資産でこの社会全体の富をほとんど(\(x=10\)\(F(y)=0.992\)となるので、ほぼ99%)占めることになる。

対照的に、全く格差がない(すべての人の所得が同じ金額)場合、グラフの概形は大きく異なり

このように線形になる。

さて、格差が大きい社会とは、関数の形において\(x=\alpha\)付近において急な傾きを有する所得構造を持つことが分かる。ここで、\(F(a)\)とは順位\(a\)番以内の人たちの所得合計である。一方、\(1-F(a)\)は、順位\(a\)番以下の人たちの収入合計である。\(1-F(x)\)\(\alpha\)付近で急激に逓減する関数を考えると、冪乗則\(x^{-n},\ n\in\mathbb{R}^+\)が思い当たる。\(F\)が累積確率関数たり得るよう、\(F(\alpha)=0,\ \lim_{x\rightarrow\infty}F(x)=1\)を要請すると、任意のパラメーター\(\alpha\)及び\(\beta\)を用いて\(1-F(x) = (\dfrac{\alpha}{x})^\beta\)である。冪乗則は重力やクーロン力など(逆二乗の法則)自然界でも見られる形である。

\(F(x)\)について整理し、微分することで前述した確率密度関数と同様の式を導くことができる。

パレート分布と指数分布の関係性

パレート分布に従う確率変数\(X\)において、\(Y=\log{x}\)なる 変数変換 を施すと、\(Y\) 指数分布 に従うことが知られている。

\(Y\)の確率密度関数\(f_Y\)は累積確率関数の導関数として導かれる。また、\(x>\alpha\)なので\(Y\)の下限は\(\log{\alpha}\)となることに留意して

\[ f_{Y}(y) = \frac{d}{dy}P(\log{\alpha}\leq{}Y\leq{}y) \]

となる。ここで、\(\log{\alpha}\leq{}Y\leq{}y\)ならば\(\alpha\leq{}X\leq{}e^y\)となることから

\[\begin{eqnarray} f_{Y}(y) &=& \frac{d}{dy}P(\alpha\leq{}X\leq{}e^y)\\ &=& \frac{d}{dy}\int_\alpha^{e^y}f_X(x)dx\\ &=& \frac{d}{dy}\int_\alpha^{e^y} \frac{\beta\alpha^\beta}{x^{\beta + 1}}dx\\ &=& \frac{de^y}{dy}\frac{d}{de^y}\int_\alpha^{e^y} \frac{\beta\alpha^\beta}{x^{\beta + 1}}dx\\ &=& \frac{\beta\alpha^\beta}{e^{\beta{}y}} \end{eqnarray}\]

ここに、\(\mu = \log\alpha\)\(\beta = \dfrac{1}{\sigma}\)とおくと、

\[ f_{Y}(y) = \frac{1}{\sigma}e^{-\frac{y-\mu}{\sigma}} \]

となり 指数分布 の確率密度関数が導かれる。