こんにちは、もっちーです。
データ分析・機械学習の実践スキルを身につけるため、学術図書出版の実践マーケティングデータサイエンスを読んでみました。
正式なタイトルは「実践マーケティングデータサイエンス(ショッパー行動の探索的データ解析と機械学習モデル構築)」です。
実際の店舗に集められたショッパー(お客さん)の行動データを使って、ビジネス視点から提案をするためのデータ分析・機械学習モデルを作っていく内容になっています。
それでは内容を詳しく見ていきましょう!
良かった点
まずは良かった点から。
- 分析する前に「仮説」を立てている
- 分析するテーマが実際の案件をベースにしている
- 章ごとに書かれているコラムが面白くて役に立つ
- マーケティングにつながるデータ分析の考え方が身につく
それぞれ詳しく解説します。
分析する前に「仮説」を立てている
実際のデータを確認したあとに
- 女性のほうが滞在時間が長いのではないか
- 有名なメーカーだと購入率が高いのではないか
などの仮説をしっかり立てておき、それが本当かどうか調べるためにデータ分析を進めていきます。
Pythonでの実装方法を説明するだけでなく、実際のデータサイエンティストの業務に沿った流れで学べるのが良い点だと思いました。
分析するテーマが実際の案件をベースにしている
この本で分析の対象にしているデータは、実際の案件をイメージして用意されています。
オフラインの店舗(コンビニやスーパーなど)で発生するデータをもとに、「どのようなマーケティング施策を取れば売上が増えるか」という問題をデータサイエンスの力で解決する内容です。
使用するデータは以下のような形になっています。
customer_id | event_day | event_type | store_id | area_id | gender | age | time_duration |
顧客のID | 日付 | イベントの種類 | 店舗ID | エリアID | 顧客の性別 | 顧客の年齢 | 滞在時間 |
実務で使われるデータとほとんど同じ形式なので、どのようにして作成されたデータかイメージしやすいです。
そのため理解がスムーズに進んで、効率よく学習できたと感じています。
章ごとに書かれているコラムが面白くて役に立つ
途中でデータサイエンスに関するコラム(プチ情報)が書かれています。
これがデータサイエンティストでない自分にとっては、新鮮な情報だと感じました。
1つ目:地味な仕事
「地味」は恥だが役に立つ?
リアル店舗では商品データベースが確立されていないため、同一商品なのに別の商品名になっていることがある(表記ゆれ)
これらの商品名を1つにまとめる作業も、データサイエンティストの作業で多かったりする。
このような地味な作業は一見すると「恥」かもしれないが、将来的に大いに役に立つものだと思って積極的に行ってみよう。
実践マーケティングデータサイエンスより引用
リアルな仕事内容がわかって良いですね。
「データサイエンティスト」という名前からかっこいい印象を持つ人が多いと思いますが、実際は地味でコツコツ進める作業もあるようです。
2つ目:面白さを含んだコラム
決定木の気持ちになって考える
与えられないデータについては読み取ってくれない。
気を利かせて特徴量を自作することもないし、余計なことは頭に取り込まない。
ストレートな性格なのだ。
実践マーケティングデータサイエンスより引用
機械学習で使われる「決定木」という手法の特徴を、面白い表現で説明しています。
マーケティングにつながるデータ分析の考え方が身につく
Webマーケティング会社で働いている自分にとっては、学べることが多かったです。
会社のデータを使ってアイデアを提案できるようになれば、社内での評価も上がりそうですね(給料アップも狙える・・?笑)
微妙だった点
ここからは「微妙だった点」についても解説します。
全体的には満足できる内容でしたが、強いて悪い点を挙げるならば・・という基準でリストアップしました。
- ライブラリの詳しい使い方などは省略されている
- 機械学習のモデル作成は3種類だけしか解説されていない
データ分析・機械学習(とくにPythonの書き方)にまったく知識がない人だと、よく分からず苦戦することがあるかもしれません。
それぞれ解説します。
ライブラリの詳しい使い方などは省略されている
データ分析によってビジネス面での提案をすることが目的の本なので、プログラミングについての説明は省略していることが多いです。
プログラミング初心者だと途中で挫折してしまう可能性があるので、Pythonやデータ分析ライブラリの使い方は基礎レベルで良いので事前に身につけておきましょう。
機械学習のモデル作成は3種類だけしか解説されていない
今回のモデル作成で使っているのは、以下の3つの手法です。
- 決定木
- アンサンブル
- ロジスティック回帰
これだけでも十分ですが、機械学習の手法は他にもたくさんあります。
機械学習モデルを作ることがテーマの参考書ではないので、そこまで多くのモデルには触れていませんでした。
興味のある人は「他のモデルを使った分析」を試してみるのが良いかもしれないですね。
身についたことのメモなど
作成中です(QiitaかZennに書いたほうが良いかな・・?)
最後に
データ分析や機械学習の基礎を学んだあとの、実践スキルの習得にぴったりな本でした。
プログラミングの内容ばかりではなく、ビジネス面で提案するための考え方なども解説されているので、非エンジニアの人でも勉強になるはずです。
これまで読んだ技術書の中でも、個人的にかなりお気に入りの1冊でした!
データサイエンスに興味のある人は、ぜひ読んでみてください。