2-4. ローレンツ曲線
から下のような度数分布表を作成したところ、スクリーン数の合計が0以上100未満の都道府県は全体の約80%を占めていることが分かりました。つまり、残りの20%の都道府県には100以上のスクリーンがあり、どうやら都道府県ごとのスクリーン数の分布は「偏っている」ように思えます。階級 階級値 度数 相対度数 累積相対度数 0以上50未満 25 24 0.5106 0.5106 50以上100未満 75 14 0.2979 0.8085 ︙ ︙ ︙ ︙ ︙ 合計 - 47 1.0000 -
この「偏り=不均等さ」を表すための曲線を「
」といいます。ローレンツ曲線を作るためには2つの累積相対度数が必要です。1つ目は各階級の度数の累積相対度数です。これは で求めた、次の度数分布表の網掛け内の値になります。階級 階級値 度数 相対度数 累積相対度数 0以上50未満 25 24 0.5106 0.5106 50以上100未満 75 14 0.2979 0.8085 100以上150未満 125 2 0.0426 0.8511 150以上200未満 175 2 0.0426 0.8936 200以上250未満 225 3 0.0638 0.9574 250以上300未満 275 1 0.0213 0.9787 300以上350未満 325 0 0.0000 0.9787 350以上400未満 375 1 0.0213 1.0000 合計 - 47 1.0000 -
2つ目は、各階級に属する値の合計の累積相対度数です。例えば、階級「50以上100未満」のスクリーン数の累積相対度数は、以下の手順で求められます。
- 47都道府県すべてがもつスクリーン数の合計:
- 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の合計:
- 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の相対度数:
- 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の合計:
- 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の相対度数:
したがって、スクリーン数の合計が「50以上100未満」の階級のスクリーン数の累積相対度数はとなります。このようにして作成した度数分布表が次の表です。
階級 度数 各階級の度数の
累積相対度数 各階級の
スクリーン数合計 スクリーン数の
相対度数 スクリーン数の
累積相対度数 0以上50未満 24 0.5106 (2) 646 (3) 0.1880 0.1880 50以上100未満 14 0.8085 (4) 918 (5) 0.2670 0.4550 100以上150未満 2 0.8511 239 0.0695 0.5246 150以上200未満 2 0.8936 377 0.1097 0.6343 200以上250未満 3 0.9574 641 0.1865 0.8208 250以上300未満 1 0.9787 258 0.0751 0.8958 300以上350未満 0 0.9787 0 0.0000 0.8958 350以上400未満 1 1.0000 358 0.1042 1.0000 合計 47 - (1) 3437 1.0000 -
この度数分布表の「各階級の度数の累積相対度数」を横軸に、「スクリーン数の累積相対度数」を縦軸にとった折れ線グラフが都道府県ごとのスクリーン数のローレンツ曲線です。グラフ中の「
」については次の で説明します。
から下のような度数分布表を作成したところ、スクリーン数の合計が0以上100未満の都道府県は全体の約80%を占めていることが分かりました。つまり、残りの20%の都道府県には100以上のスクリーンがあり、どうやら都道府県ごとのスクリーン数の分布は「偏っている」ように思えます。
階級 | 階級値 | 度数 | 相対度数 | 累積相対度数 |
---|---|---|---|---|
0以上50未満 | 25 | 24 | 0.5106 | 0.5106 |
50以上100未満 | 75 | 14 | 0.2979 | 0.8085 |
︙ | ︙ | ︙ | ︙ | ︙ |
合計 | - | 47 | 1.0000 | - |
この「偏り=不均等さ」を表すための曲線を「
」といいます。ローレンツ曲線を作るためには2つの累積相対度数が必要です。1つ目は各階級の度数の累積相対度数です。これは で求めた、次の度数分布表の網掛け内の値になります。階級 | 階級値 | 度数 | 相対度数 | 累積相対度数 |
---|---|---|---|---|
0以上50未満 | 25 | 24 | 0.5106 | 0.5106 |
50以上100未満 | 75 | 14 | 0.2979 | 0.8085 |
100以上150未満 | 125 | 2 | 0.0426 | 0.8511 |
150以上200未満 | 175 | 2 | 0.0426 | 0.8936 |
200以上250未満 | 225 | 3 | 0.0638 | 0.9574 |
250以上300未満 | 275 | 1 | 0.0213 | 0.9787 |
300以上350未満 | 325 | 0 | 0.0000 | 0.9787 |
350以上400未満 | 375 | 1 | 0.0213 | 1.0000 |
合計 | - | 47 | 1.0000 | - |
2つ目は、各階級に属する値の合計の累積相対度数です。例えば、階級「50以上100未満」のスクリーン数の累積相対度数は、以下の手順で求められます。
- 47都道府県すべてがもつスクリーン数の合計:
- 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の合計:
- 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の相対度数:
- 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の合計:
- 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の相対度数:
したがって、スクリーン数の合計が「50以上100未満」の階級のスクリーン数の累積相対度数はとなります。このようにして作成した度数分布表が次の表です。
階級 | 度数 | 各階級の度数の 累積相対度数 | 各階級の スクリーン数合計 | スクリーン数の 相対度数 | スクリーン数の 累積相対度数 |
---|---|---|---|---|---|
0以上50未満 | 24 | 0.5106 | (2) 646 | (3) 0.1880 | 0.1880 |
50以上100未満 | 14 | 0.8085 | (4) 918 | (5) 0.2670 | 0.4550 |
100以上150未満 | 2 | 0.8511 | 239 | 0.0695 | 0.5246 |
150以上200未満 | 2 | 0.8936 | 377 | 0.1097 | 0.6343 |
200以上250未満 | 3 | 0.9574 | 641 | 0.1865 | 0.8208 |
250以上300未満 | 1 | 0.9787 | 258 | 0.0751 | 0.8958 |
300以上350未満 | 0 | 0.9787 | 0 | 0.0000 | 0.8958 |
350以上400未満 | 1 | 1.0000 | 358 | 0.1042 | 1.0000 |
合計 | 47 | - | (1) 3437 | 1.0000 | - |
この度数分布表の「各階級の度数の累積相対度数」を横軸に、「スクリーン数の累積相対度数」を縦軸にとった折れ線グラフが都道府県ごとのスクリーン数のローレンツ曲線です。グラフ中の「
」については次の で説明します。■おすすめ書籍
コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。
ジニ係数
コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。
2つの累積相対度数を用いて描かれた
を使うと、「偏り=不均等さ」を確認できます。例えば、次の
から作成したローレンツ曲線の赤い矢印をたどると、約80%の都道府県内で全国のすべてのスクリーン数の40%強があるということが分かります。逆に、残りの約20%の都道府県内には60%弱ものスクリーン数があるということなので、スクリーンの分布は不均等であることが分かります。この「偏り」や「不均等さ」を数値で表したものが「
」です。ジニ係数は ((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(次の図の橙色部分)を2倍した値になります。ジニ係数は0から1までの値をとり、1に近いほど偏りが大きく、0に近いほど偏りが小さいことを表します。■ジニ係数が0の場合
不均等さが全くない場合、ローレンツ曲線は次の図のように完全平等線と一致するためジニ係数は「0」となります。ジニ係数が0というのは、ここでは各都道府県内にあるスクリーン数が全て同じ場合、すなわち「20%の都道府県内に全国の総スクリーン数の20%があり、40%の都道府県内に全国の総スクリーン数の40%があり…」という状態を指します。
■ジニ係数が1の場合
一方、例えば東京都に日本の全ての映画館(スクリーン)があり、他の道府県に映画館(スクリーン)が全くない場合、ローレンツ曲線は次のようになります。このときジニ係数は最大値の「1」となります。
【コラム】ローレンツ曲線は下側凸か上側凸か
ローレンツ曲線を描くとき、一般的に階級を小さい順(昇順)に並べた場合の2つの累積相対度数を用います。そのため、よく目にするローレンツ曲線は完全平等線に対して下側に凸となっています。
一方、スクリーン数の集中度を見たい場合には、下の表のように階級を大きい順に並べたものを用いることがあります。
階級 | 度数 | 各階級の度数の 累積相対度数 | 各階級の スクリーン数合計 | スクリーン数の 相対度数 | スクリーン数の 累積相対度数 |
---|---|---|---|---|---|
350以上400未満 | 1 | 0.0213 | 358 | 0.1042 | 0.1042 |
300以上350未満 | 0 | 0.0213 | 0 | 0.0000 | 0.1042 |
250以上300未満 | 1 | 0.0426 | 258 | 0.0751 | 0.1793 |
200以上250未満 | 3 | 0.1064 | 641 | 0.1865 | 0.3658 |
150以上200未満 | 2 | 0.1490 | 377 | 0.1097 | 0.4755 |
100以上150未満 | 2 | 0.1916 | 239 | 0.0695 | 0.5450 |
50以上100未満 | 14 | 0.4895 | 918 | 0.2670 | 0.8120 |
0以上50未満 | 24 | 1.0000 | 646 | 0.1880 | 1.0000 |
合計 | 47 | - | 3437 | 1.0000 | - |
この場合のローレンツ曲線は、次に示すように完全平等線に対して上側に凸となります。このローレンツ曲線を見ると、約20%の都道府県内に60%弱ものスクリーン数があることが読み取れます。
■おすすめ書籍
コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。
'지식 > 경제수학' 카테고리의 다른 글
피셔3원칙 (0) | 2018.09.20 |
---|---|
추출의 방법(층화추출법,클러스터추출법,다단추출법,계통추출법) (0) | 2018.09.20 |
편상관계수 (0) | 2018.09.19 |
라스파이레스지수(기준년 수량고정), 파셔지수(비교년 수량고정) (0) | 2018.09.17 |
箱ひげ図を描いてみよう (0) | 2018.09.17 |