データ分析を始める前に読んだ本と読んだ後にやったこと
きっかけ
1年ほど前に受託開発をやっている会社からwebサービスを運営している会社に転職したのですが、いきなり新しいサービスの立ち上げに参加しそのあとの運用も担当することになったためです。 僕と事業担当者で施策出したりしてたのですが、勘と雰囲気でやってもなかなか進まないし、ここはデータ分析かなーと。 データサイエンティストとして仕事してる友人におすすめの書籍を教えてもらって全部読んでみました。
読んだ本
データドリブンマーケティング
Amazonの社員が読んでるらしい。LTV、CPA、解約率など基本的な単語の意味を知ることができる www.amazon.co.jp
ロジカルデータ分析
何のためにデータ分析するのかがよくまとまっている。帯に「パッション」ってあるように各所エモい。 www.amazon.co.jp
確率思考の戦略論
データ分析というかマーケティングの本。データを使ってどうしたいのかという点で参考にできる www.amazon.co.jp
戦略的データサイエンス概論
Webエンジニアがぱっと読んですぐ実践できる内容ではない。 データサイエンティストを雇うとこういうことをやってくれるのか!という学びがありました。 www.amazon.co.jp
ビッグデータ分析・活用のためのSQLレシピ
SQLのレシピ集。普段の業務では一番役に立つ。これがあるだけで様々な指標をSQL一発で出せます。 あらためてSQL勉強し直しました。特に分析関数。 www.amazon.co.jp
やったこと
いきなりかっこいいデータ分析をすることはできないが、ログ設計してデータ分析をするところまではやるべき、となってそこまでは一気に進めました。たしかその判断したのがリリース1週間前ぐらいだった気がしますが、多少壊れててもユーザーには影響ないしいいかと思ってやってしまいました。 やったことは以下の3つです
- 行動ログをアプリケーションサーバからfluentdでBigQueryに流す
GitHub - kaizenplatform/fluent-plugin-bigquery これ使えばさくっとできました。感謝。
- EmbulkでRDBのデータを全てBigQueryにinsert
RDBに格納しているデータを個人情報はマスクした状態でBigQueryにinsertしています。 cronを設定して深夜に全件洗い替えしてます。
- データの可視化にはGoogleDataStudioを利用
無料で使えたのでさくっと導入。
現状
データをがっつり活用できているかというとまだ全然そんなレベルではないのですが、何か仮説があったときに実際のデータに対してSQLを利用して数値を確認し、必要に応じてレポート化して定期的にモニタリングするような運用ができるようになりました。 いずれはフルタイムでデータサイエンティスト雇って一緒に何かやりたい!