2017年7月27日に日刊工業新聞に掲載された記事によると「夏場の平均気温が1℃あがるごとに、ビールの販売数量は1日80万本(大瓶換算)増える」とあります。
確かに、夏の暑い日に飲むビールには格別な旨さがありますし、本数などの数値的な部分はおいておいて、感覚的には違和感のない内容のように感じます。
では、実際のデータではどうなのでしょうか?
今回の記事では、
- 気温が上がるとビールの出荷量が増えるのかが気になる?
- ビールの出荷量を予想してみたい
という人に向けて、アサヒスーパードライの実際の出荷量データと気象庁の気温データとを用いた単回帰分析をしてみた結果を紹介していきます。
気温が上がるとビールの出荷量は増えるのか?
平均気温とビールの出荷量の相関を求めてみる
① 平均気温とビールの出荷量は相関があるのか?
次のグラフは、東京都の平均気温とスーパードライの出荷量のデータを散布図で表わしたものです。
データは2011年8月から2019年7月までの8年間(96か月分)のデータを用います。また、出荷量のひと箱は大瓶(633ml)×20本となります。
このグラフ(回帰直線)より、気温が高い方がスーパードライの出荷量が多くなる傾向があることが分かります。
しかし、相関係数は0.358と非常に弱い相関となります。
相関係数 | 相関の強さ |
---|---|
0.0~0.3未満 | ほぼ無関係 |
0.3~0.5未満 | 非常に弱い相関 |
0.5~0.7未満 | 相関がある |
0.7~0.9未満 | 強い相関 |
0.9~1.0 | 非常に強い相関 |
ここで、改めてグラフを見ると、平均気温が5℃から10℃の区間に出荷量が大きい月がいくつか存在すること分かります。そして、これら月が相関係数を低くしている要因となっていそうです。
それでは、この平均気温が低いにも関わらず出荷量が大きい月には何が起きているのでしょうか?
② 気温が低いのに出荷量が多い月は何月か?
次のグラフは、スーパードライの96か月分の出荷量データを時系列に折れ線グラフで表わしたものです。
このグラフより、出荷量の推移が毎年同じように繰り返す傾向があることが見て取れます。そして、その中に、毎年、飛びぬけて出荷量が増えている月があることが分かります。果たしてその月は何月なのでしょうか?
12月です。
なるほど。12月は忘年会シーズンですね。
さらに、今回の事例で言えば、アサヒグループホールディングス株式会社の決算月が12月ということも、12月の出荷量が大きく伸びている要因なのかもしれません。
なお、12月の出荷量が多い反動で、翌月1月の出荷量の落ち込みが大きいのも特徴的だと感じました。
いずれにせよ、さきほどの散布図の中で、単回帰直線から離れている点は、12月である可能性が高そうです。なので、次は、12月が散布図の中でどこにプロットされるかを確認していきます。
③ 12月は散布図のどこに位置するか?
次のグラフは、東京都の平均気温とスーパードライの出荷量を12月とそれ以外の月とで、色分けをしたうえで散布図で表わしたものです。
やはり、回帰直線から外れ、気温が低いのに出荷量が大きくなっていた月は、12月であることを確認できました。
それでは、12月のデータを除外すると、相関係数はどのように変わるのでしょうか?
④ 12月を除外した場合の相関係数は?
次のグラフは、平均気温とスーパードライ出荷量のデータを12月のみ除外した形で、散布図とその回帰直線を引いたものです。
12月のデータを除くことにより、相関係数が0.358から0.789に変わり、気温とビール出荷量の間には、正の強い相関があることを示す結果に変わりました。
また、回帰式の当てはまり度合いを表す決定係数は0.128から0.623に変わりました。
そして、回帰係数(単回帰式の傾き)は19.1となりました。
項目 | 相関性(12月含む) | 相関性(12月除く) |
---|---|---|
相関係数 | 0.358 | 0.789 |
決定係数 | 0.128 | 0.623 |
回帰係数 | 10.52 | 19.09 |
切片 | 672.2 | 471.7 |
つまり12月を除けば、気温が1℃高くなると、月当たりのビールの出荷量が 19.1万箱=大瓶で382万本 も増えることが、過去8年のデータより推定できる、回帰式を得ることができました。
この月あたり382万本は、一日あたりの本数に換算すると、12.7万本となります。
冒頭に紹介した「夏場の平均気温が1℃あがるごとに、ビールの販売数量は1日80万本(大瓶換算)増える」という記事と比較しても、12.7万本という今回の分析結果は、ひとつの銘柄の結果であることを考慮すると、大きく外れていないのかもしれませんが、今回の分析はここまでとします。
まとめ
今回の記事では「気温が上がるとビールの出荷量は増えるのか?」という疑問に対し、東京都の平均気温とアサヒスーパードライの出荷量データを単回帰分析した結果を紹介していきました。
結果は、平均気温とビールの出荷量の関係は正の弱い相関があるという結果でした。
しかし、12月は平均気温が低いにも関わらずビールの出荷量が大きく伸びている特殊な月であったことから、12月のみ除外した場合は、正の強い相関がある結果となりました。
今回の結果より、12月を考慮に入れなければ、ビールの出荷量を平均気温からある程度推定できるようになりました。
では、12月も考慮に入れて、ビールの出荷量を予測する場合はどのようにすればいいのでしょうか?
ひとつの方法は、説明変数の数を増やすことです。
説明変数を増やすことで、平均気温だけでは説明できない要因を予想に含めることができます。
このように、複数の説明変数で目的変数を予測する手法のことを「重回帰分析」と呼びますが、「重回帰分析」の内容については、また別の記事で紹介したいと思います。
じゃあ