2015年8月10日月曜日

Kaggleに挑戦 その1

kaggleというデータ解析コンペに挑戦する。

https://www.kaggle.com/c/coupon-purchase-prediction
リクルート社ポンパレのデータが公開されているので
そのデータからお客さんがどのクーポンを買うか予測するってもの。


やってみる。

眠いので調査ははしょりはしょり

pythonの準備
ライブラリはnumpy, pandas, matplotlib
R使おうと思ったけどなんだかpythonのほうがやりやすかったので
勉強がてら使ってみた
Rでもいいんだけどね。


user_list.csvから

まず女性ユーザーの年齢分布

  • 30〜40代多し
  • 40代前半と20代後半多し

※なぜか男性の分布がプロットできねー!

次 都道府県別ユーザー数
  • 東京、神奈川、大阪 多い

user_list.csvからは大して傾向はつかめないことはわかった。
そもそも登録日、性別、解除日、県名くらいじゃ性質なんてわからないだろうね。


たいした収穫はないが、user_list.csvからはたいしたことがわからないことがわかったなり。



メモ

  • coupon_detail_train.csv   購入したクーポンについてのログ
  • coupon_visit_train.csv    閲覧したクーポンについてのログ

0 件のコメント:

コメントを投稿