先日の協会けんぽの社会保険料と
都道府県別平均年齢の相関分析のつづきです。
まずは、都道府県別平均年齢の入手から。
国の統計資料は
e-Statというサービスで
インターネットに公開されています。
便利な時代ですね。
センサスくんとみらいちゃん(国勢調査のキャラクター)は
頑張っています。
e-StatはAPIも公開されているため、
やろうと思えば個人レベルでも
最新データを利用してBIが実施できます。
このあたりのAPI利用も次のテーマにしようかな。
まあ、今回のスコープとは異なるので
先に進めましょう。
私が欲しいデータは
以下の名称で存在していました。
統計名「Population Census 2020 Population Census Basic Complete Tabulation on Population and Households 」
のテーブル名「2-1-2 」です。
2020年統計だと
東京の平均年齢は「45.26076」だそうです。
(日本国籍のみに制限していません)
私は平均よりも若いのか。知らなかったです。
親切にも、統計データには平均値と中央値がありましたので、
どちらでも相関分析してみます。
どっちが相関が強いかわかるはず。
(40/300)