mzumi's blog

Pythonを使ったデータ分析 (3)

March 24, 2015

前回より、少し時間が空いてしまったが、3章のつづき。

購入したユーザーの内、どの金額帯のユーザー数が減少しているかを確かめる。

購入したユーザーのみ集計したいので、購入していないユーザーの情報は除外する。

今月と先月で新規ユーザーの内、どこの購入金額の層に増減があったかを調べる。
そこで、購入金額の幅を2000円とするため、まず、各月、ユーザー別に金額を合計する。
その合計した金額を2000円毎にするため、applyを使って 整数を2000で割って、2000掛ける。

この情報より、月別の価格帯毎のユーザー数を求めたいのだが、上記の集計だとindexがmultiindexになってしまい、
集計しづらい。

そこで、集計する際に、as_index=False を指定する事により、
log_monthuser_id をindexとして使用しないようにする。

よってここから、月別の価格帯毎の新規ユーザー数を集計し、グラフ化すると以下のようになる。
(ちょっとわかりづらいが。。)

月別、新規ユーザーの購入金

この as_index=False を見つけるまで、いろんな集計方法を試してみたが大変だった。。。

とりあえず、3章については以上で終わり。