神のみぞ知る正解
From: 山極綾子
よし!お客さんの嗜好を分析するモデルを作ろう!
お客さんの嗜好はきっとこれまでに買ったものに表れるはず?
他にも、広告をクリックしてくれたのはきっと、
それに対して興味を持ってくれてからだろうし。
あとは、ショッピングカートに入れてくれたのもきっと、興味があったからだよね?
だけれど、もしかしてデータに残ってないけどお客さんが興味があったこと、
嗜好に沿うものがあったかもしれない。
お客さんが本当に好きな物って何なんだろう…!
実際のデータを分析しているときにとっても困ること。
「何が本当に正しいか分からない!」と言うことです。
例えばお客さんになにがしかの商品を推薦する、いわゆる推薦システムの研究では、
過去にお客さんが購入した商品を正解として、その商品を当てられるようにモデルを作成します。
(AmazonなどのECサイトで出てくる「オススメ商品」や、
YouTubeの「オススメ動画」などで何を推薦するか?をモデル化する機械学習です。)
ですが、実は購入していなかったけど欲しかったものがあったり
(プレゼントしてもらったのかも)、見たかった動画があるかもしれません。
そう考えると、何を正解として、当てにいくべきか?というのは本当に難しい問題です。
そんな時、自分のモデルが良い精度を出せているのか?を正確に表現できる方法として、
人工データの作成があります。
人工データとは、自分が仮定した条件のもと作成したデータのこと。
つまり、このデータの中においては私たちは全知全能の神様になることができます。
どんな状況も作れるし、そのデータについてはどんなことでも知っています。
自分が解きたい問題にきちんと沿ったデータ生成方法を使わなければいけませんが、
少なくともこの世界の中でだけは正解がわかりますし、
機械学習の改善がとてもやりやすくなります。
もちろん、実際に私たちの周りにあるデータに比べて複雑さは圧倒的に劣りますが、
そこは分析者の腕の見せ所。
自分が解きたい問題をより抽象化して、大事なところをモデルに落とし込むには、
ビジネスの知識やお客さまへの理解が欠かせません。
単に機械学習のモデルをたくさん知っているだけでは、
実際に機械学習をビジネスにつなげることは難しいようです。
山極綾子
P.S.
便利な人工データですが、やはりどうしても限界があります。
実際のデータのような複雑さは、どうしても表現しきれないのです。
人工データで当てられたからと言って、必ずしも
実際のデータで成果が出るとは限らないというのもまた、難しいポイントです。。。
P.P.S.
今日も最後まで読んでいただきありがとうございます!
メルマガの感想などありましたら、こちらからお聞かせ下さい。
いつも嬉しく拝見しています。いつもありがとうございます!
↓
https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5
—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-
↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3
↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm