Skip to content

Jun-Tam/JapaneseCensusAnalysis

Repository files navigation

国勢調査等の政府統計データを用いたデータ分析と視覚化

政府統計データを用いて以下のワークフローで市区町村のライフスタイル分類を実施した。
都市圏の詳細な分類を試みるため、約1900ある全市区町村のうち、商業施設密度と人口密度でフィルターをかけ、
285件のレコード数に対して分析を行った。そのため、N/Aのクラスが多くなっている。


ワークフロー

Part 1: 食材の買い出し。
e-Statsからデータの取得。(参考 https://note.nkmk.me/python-e-stat-api-download/)

Part 2: 下ごしらえ。
使えそうな特徴量の抽出。

Part 3: 調理と盛り付け。
データの標準化。UMAPによる次元削減後、K-Meansによるクラスタリング。分類クラスの命名。
GeopandasとPlotly Expressによる、分析結果のインタラクティブマップ作成。

UMapによるクラスター分類

demo

東京都・神奈川県・埼玉県の結果

demo

Releases

No releases published

Packages

No packages published