別記事「統計学的に「令和婚」はあったのか?」で、令和婚があったことを紹介し、また、2019年の婚姻数は2018年よりわずかに増えていることを紹介しました。
それでは、出生数はどのように変化しているのでしょうか?
そして、婚姻数と出生数にはどのような関係があるのでしょうか?
今回の記事では、
- 婚姻数と出生数にどの程度の相関があるかを知りたい
- 婚姻数と出生数に時差相関があるのかを知りたい
という人に向けて、「日本の婚姻数と出生数には相関があるのか?」を、実際のデータを見ながら考えていきたいと思います。
日本の婚姻数と出生数は相関があるのか?
婚姻数と出生数の相関を分析してみる
① 出生数のデータはe-statより入手
出生数のデータはe-statより入手可能です。
データは「人口動能統計(出生)」を用います。
② 1899年以降の出生数の推移は?
次の図はe-statより入手した出生数の年別の推移を折れ線グラフで表したものです。
データおよびグラフより読み取れる出生数データの概要は次の通りです。
- 出生数のデータは1899年から2019年まである
- 出生数のピークは1949年の270万人
- 1973年以降の出生数は右肩下がり傾向
- 2018年の出生数は91.8万人
- 2019年の出生数は86.5万人
1970年代後半以降、出生数は右肩下がりで減少していることが分かります。
また、別記事で書いた「2019年の婚姻数は前年と比較し増加した」結果とは異なり、2019年の出生数は前年を下回る結果となっています。
③ 婚姻数と出生数は相関があるのか?
次のグラフは1949年以降の婚姻数と出生数を散布図グラフで表したものです。
この結果より、婚姻数と出生数は正の相関があることは分かります。一方で、ばらつきが大きい点がいくつかあり、相関は強くないことが読み取れます。
これまで見ていた婚姻数データの折れ線グラフ結果より、2000年より以前のデータは、2000年以降のデータと傾向が違うことが分かっていました。
そのため、散布図を2000年の前と後とでプロットの色を分けてみます。
やはり、2000年より前のデータは婚姻数と出生数の相関関係が弱く、2000年以降のデータで描くことが出来る回帰直線とは異なる傾向があることが分かります。
この結果を踏まえて、次からは、婚姻数と出生数の相関を、2000年以降のデータのみを用いて考えていきます。
⑤ 2000年以降の婚姻数と出生数は相関係数は?
次のグラフは2000年以降の婚姻数と出生数のみを散布図グラフで表し、そのデータに対して回帰直線を描いたものです。
「相関係数」は0.983と高い値となりました。
また、回帰直線の信用度を示す「決定係数(R^2)」は0.966と、同じく高い値となることが分かります。
⑥ 婚姻したその年に果たして子供が生まれるのか?
さきほどの結果で、婚姻数と出生数には高い相関があることが分かりました。
しかし、ここで次のような疑問が生まれます。
「婚姻した年と同じ年に、果たして子供が生まれるのか?」と。
「できちゃった婚」「授かり婚」などの言葉が使われるようになって久しいですが、必ずしも婚姻した年に子供が生まれるとは限りません。
数年の間は、二人だけで新婚生活を楽しみたいと考えている新婚カップルもいるかと思います。
つまり、「婚約してから数年が経過してから子供が生まれる場合が多いのでは?」という可能性が考えられます。
そのため、出生数と婚姻数の関係には時差相関がある可能性が考えれられます。
⑦ 婚姻数は出生数の時差相関の傾向あるのか?
時差相関の有無を確認する方法は、「出生数を基準として、婚姻数をn年ずらす」です。
つまり1年の時差相関を検証する場合は、2018年の出生数と2017年の婚姻数を対となるデータとし、2年の時差相関を検証する場合は、2018年の出生数と2016年の婚姻数を対のデータとし、相関をとります。
次のグラフは、ある年の婚姻数に対して1年後の出生数を用いて相関を確認した結果です。
そして、次のグラフは、1年後の出生数を用いて相関を確認した結果です。
時差相関がない場合と、1年分・2年分の時差相関をとった結果が得られましたので、それぞれを比較してみます。
時差 | 相関係数 | 回帰係数 | 切片 |
---|---|---|---|
なし | 0.983 | 1.18 | 242,043 |
1年 | 0.970 | 1.18 | 230,492 |
2年 | 0.949 | 1.14 | 241,914 |
この結果より、予想に反して、時差相関を考えない場合が相関係数が高くなることから、「ある年の出生数は、その1年前や2年前の婚姻数より、同じ年の婚姻数に影響を受ける」と言うことができそうです。
まとめ
今回の記事では「日本の婚姻数と出生数は相関があるのか?」というテーマを、実際のデータを見ながら確認していきました。
2000年以降のデータで見ると、婚姻数と出生数には強い相関があることが分かりました。
さらに、出生数は婚姻数の相関は、1年前や2年前の婚姻数より、同じ年の婚姻数により相関が強いことが分かりました。
今回、婚姻数と出生数には強い相関があることが分かりましたが、その過程で求めた回帰直線を用いることで、出生数の予測をすることもできます。この内容はまた別の記事でご紹介します。
じゃあ