2-4. ローレンツ曲線


各都道府県内にある映画館のスクリーン数のデータから下のような度数分布表を作成したところ、スクリーン数の合計が0以上100未満の都道府県は全体の約80%を占めていることが分かりました。つまり、残りの20%の都道府県には100以上のスクリーンがあり、どうやら都道府県ごとのスクリーン数の分布は「偏っている」ように思えます。

階級階級値度数相対度数累積相対度数
0以上50未満25240.51060.5106
50以上100未満75140.29790.8085
合計471.0000

この「偏り=不均等さ」を表すための曲線を「ローレンツ曲線」といいます。ローレンツ曲線を作るためには2つの累積相対度数が必要です。1つ目は各階級の度数の累積相対度数です。これは2-1章で求めた、次の度数分布表の網掛け内の値になります。

階級階級値度数相対度数累積相対度数
0以上50未満25240.51060.5106
50以上100未満75140.29790.8085
100以上150未満12520.04260.8511
150以上200未満17520.04260.8936
200以上250未満22530.06380.9574
250以上300未満27510.02130.9787
300以上350未満32500.00000.9787
350以上400未満37510.02131.0000
合計471.0000

2つ目は、各階級に属する値の合計の累積相対度数です。例えば、階級「50以上100未満」のスクリーン数の累積相対度数は、以下の手順で求められます。

  1. 47都道府県すべてがもつスクリーン数の合計:3437
  2. 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の合計:646
  3. 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の相対度数:646\div 3437=0.1880
  4. 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の合計:918
  5. 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の相対度数:918\div 3437=0.2670

したがって、スクリーン数の合計が「50以上100未満」の階級のスクリーン数の累積相対度数は0.1880+0.2670=0.4550となります。このようにして作成した度数分布表が次の表です。

階級度数各階級の度数の
累積相対度数
各階級の
スクリーン数合計
スクリーン数の
相対度数
スクリーン数の
累積相対度数
0以上50未満240.5106(2) 646(3) 0.18800.1880
50以上100未満140.8085(4) 918(5) 0.26700.4550
100以上150未満20.85112390.06950.5246
150以上200未満20.89363770.10970.6343
200以上250未満30.95746410.18650.8208
250以上300未満10.97872580.07510.8958
300以上350未満00.978700.00000.8958
350以上400未満11.00003580.10421.0000
合計47(1) 34371.0000

この度数分布表の「各階級の度数の累積相対度数」を横軸に、「スクリーン数の累積相対度数」を縦軸にとった折れ線グラフが都道府県ごとのスクリーン数のローレンツ曲線です。グラフ中の「完全平等線」については次の2-5章で説明します。

ローレンツ曲線1

■おすすめ書籍

コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。




ジニ係数


2つの累積相対度数を用いて描かれたローレンツ曲線を使うと、「偏り=不均等さ」を確認できます。

例えば、次の各都道府県内にある映画館のスクリーン数のデータから作成したローレンツ曲線の赤い矢印をたどると、約80%の都道府県内で全国のすべてのスクリーン数の40%強があるということが分かります。逆に、残りの約20%の都道府県内には60%弱ものスクリーン数があるということなので、スクリーンの分布は不均等であることが分かります。

ジニ係数1

この「偏り」や「不均等さ」を数値で表したものが「ジニ係数」です。ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(次の図の橙色部分)を2倍した値になります。ジニ係数は0から1までの値をとり、1に近いほど偏りが大きく、0に近いほど偏りが小さいことを表します。

ジニ係数2

■ジニ係数が0の場合

不均等さが全くない場合、ローレンツ曲線は次の図のように完全平等線と一致するためジニ係数は「0」となります。ジニ係数が0というのは、ここでは各都道府県内にあるスクリーン数が全て同じ場合、すなわち「20%の都道府県内に全国の総スクリーン数の20%があり、40%の都道府県内に全国の総スクリーン数の40%があり…」という状態を指します。

ジニ係数3

■ジニ係数が1の場合

一方、例えば東京都に日本の全ての映画館(スクリーン)があり、他の道府県に映画館(スクリーン)が全くない場合、ローレンツ曲線は次のようになります。このときジニ係数は最大値の「1」となります。

ジニ係数3

【コラム】ローレンツ曲線は下側凸か上側凸か

ローレンツ曲線を描くとき、一般的に階級を小さい順(昇順)に並べた場合の2つの累積相対度数を用います。そのため、よく目にするローレンツ曲線は完全平等線に対して下側に凸となっています。

一方、スクリーン数の集中度を見たい場合には、下の表のように階級を大きい順に並べたものを用いることがあります。

階級度数各階級の度数の
累積相対度数
各階級の
スクリーン数合計
スクリーン数の
相対度数
スクリーン数の
累積相対度数
350以上400未満10.02133580.10420.1042
300以上350未満00.021300.00000.1042
250以上300未満10.04262580.07510.1793
200以上250未満30.10646410.18650.3658
150以上200未満20.14903770.10970.4755
100以上150未満20.19162390.06950.5450
50以上100未満140.48959180.26700.8120
0以上50未満241.00006460.18801.0000
合計4734371.0000

この場合のローレンツ曲線は、次に示すように完全平等線に対して上側に凸となります。このローレンツ曲線を見ると、約20%の都道府県内に60%弱ものスクリーン数があることが読み取れます。

ジニ係数5

■おすすめ書籍

コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。


+ Recent posts