とある機械学習の憂鬱

 From:山極綾子

 

 

ご主人様から言い渡された指令。

 

「この中から犬の画像を探せ」

 

でも、僕には「犬」が何か、よくわからない。

 

何が犬で、何が犬じゃないのか。

 

目の前には100万枚以上の画像データがあるけれど、そもそも何から学んでいいのか分からない。

 

どうしよう…。

 

 

機械学習はあくまで、手元にあるデータのルールを学習するにすぎません。

 

画像のデータが何万枚あっても、それが何を表しているかを学習することはできず。

 

人間が「これは犬」「これは猫」と答えを教えてあげることで、

ようやく種類を推定するためのルールを学習することができます。

 

というわけで、ご主人様である私は適当に目についた犬の画像に、

「犬である」「犬ではない」というラベルを付けることにしました。

 

 

よくわかったよご主人様!

 

犬っていうのは、耳が垂れていて、目が二つあって、黒くて、

全体的にふさふさしている生き物なんだね!

 

さらなる落とし穴が機械くんを襲います。

 

なんと、私が「犬である」とラベルを付けた画像は全て、特定の犬の写真だけだったようです。

 

名前順で上に来ていた画像だけを見てしまったがために、

ラベルの付け方がかなり偏ってしまったのです。

 

でも、全ての画像にラベルを付けるだなんて、100万枚も画像があるのに、

そんなことは到底無理です。

 

どうすれば効率よく機械くんに「犬とはなんぞや」を教えられるんだ…!

 

 

そんな悩みを解決するための手法として、能動学習と呼ばれるものがあります。

 

能動学習はその名の通り、能動的に、学習を進めていきます。

 

具体的には、モデルの学習に有用であると考えられるデータに、

能動的にラベルを付与することで、より効率よく学習を進めることを目指す機械学習の手法です。

 

例えば犬の例で言えば、様々な犬種の犬にラベルを付けたり、

様々な角度から撮影された画像にラベルを付けることで、

効率よく「犬」の特徴を探ることができます。

 

 

データにラベルを付けるには、人間の目で見たり、実験をしたり、

多大な労力がかかります。

 

無駄なデータばかりで機械学習が何も学習できない…。

 

そんな状況を避けるためにも、効率よくデータ(とそのラベル)を集める方法が

注目されるのは、当然のことなのかもしれません。

 

 

山極綾子

 

 

P.S.

今日も最後まで読んでいただきありがとうございます!

 

メルマガの感想などありましたら、こちらからお聞かせ下さい。

 

いつも嬉しく拝見しています。いつもありがとうございます!

https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5

 

 

—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-

↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3

↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm