お願い、精度上がらないで…!
From:山極綾子
どのくらいの精度が出るんだろう。
とりあえず似た商品は20個で、合計100商品あるから、
ランダムに20個選んできても1/5の確率で似た商品を当てられるんだよね。
願わくば、ランダムと同じかそれ以下の精度になってくれるといいんだけど…。
私は機械学習を学び始めてからはじめて、精度が高くならないことを祈っていました。
というのも、自分の提案した手法のライバルである比較手法の精度が低くなるよう
祈っていたのです。
もちろん、祈ろうと祈らなかろうと精度に影響はないのですが。
そして出てきた結果を見て、私はほっと一息、安堵のため息をつくことになりました。
そのスコアは平均3.8。
見事、ランダムより悪い数値をたたき出しました。
今回比較手法として用いた手法は、Item2Vecという、商品の分析を行うかなり有名で、
さらに精度が高いことで知られる手法です。
ニューラルネットワークを活用しています。
例えばAmazonなどでの購買履歴に対して、同じ顧客に購買された商品は
似ているものだろう、と仮定して他の顧客にも推薦するようなことが出来ます。
具体的には、Aさんがノートと鉛筆と消しゴムを買っていて、
Bさんがノートと鉛筆を買ったなら、合わせて消しゴムを推薦するようなイメージです。
被引用数は今日時点で359。
359件の論文が、この論文を引用しながら出版されたということになります。
それくらい、いろいろな分野で有効性が確認されている手法なのですが、
今回私が実験したデータセットではうまくいきませんでした。
その理由はなぜかと言いますと、私が意地悪をしたからです。
もちろん、データを改ざんするというようなことはしていません。
問題設定を、Item2Vecが苦手な状況にしたのです。
そもそも私の研究対象のデータはItem2Vecが苦手であろう特徴を持っていて、
それに合わせて作成した人工データを使って実験をしたところ、
予想通り、うまくいかなかったのです。
どんなに優秀な手法であっても苦手な場面がある。
そして、他の場面では勝てないかもしえない手法でも、その手法が強い場面は存在する。
論文投稿がしやすいという意味でも、自分のこれからのキャリアについて考えていく
という点でも、ちょっと、心強くなるような結果が得られて嬉しいです。
山極綾子
P.S.
もちろん、今回の研究対象のデータがすごくニッチな対象問題かというと、
手前味噌かもしれませんが、そんなことはありません。
どんなにすごいものにも苦手があり、そしてなぜ苦手なのか?をきちんと分析することで、
新しい発見につながるのは、人も機械学習も同じの様な気がします。
P.P.S.
今日も最後まで読んでいただきありがとうございます!
メルマガの感想などありましたら、こちらからお聞かせ下さい。
嬉しく拝見しています。いつもありがとうございます!
↓
https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5
—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-
↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3
↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm