Googleのおしゃれ論文

From:山極綾子

 

 

Googleさんの出している論文、おしゃれだなあと感じる割合が高いのです。

 

何がおしゃれと感じるかというと、そのタイトル。

 

この前後輩が説明してくれた論文もその一つでした。

 

その名も、”An image is worth 16X16 words”。

 

内容がわかると「ああ!」となるところも、すごくおしゃれだなあと思います。

 

 

この論文、何をした論文なのかを簡単に説明しますと…。

 

「この画像が何であるか?」を識別する問題(例えばこの画像はネコか?といった問題)に対して、

 

元々言語分析のために開発されたTransformerというモデルを活用して

アプローチしたものです(Transformerという名前すらおしゃれで感動です…)。

 

Transformerは元々、言語用のモデルであるため画像の問題に適用するには工夫が必要です。

 

そこで、画像を16×16の領域ごとに分けて、それを一つの単語として扱うことにしています。

 

そしてその結果、非常に高い精度を出すことができました。

 

つまり、画像を16×16の要素を持つ一つの単語として扱うと、

すごく有用な単語として機能するということでした。

 

だからこそ、An image is WORTH 16X16 wordsが論文タイトルになった様です。

 

 

私はこのタイトルを”おしゃれ”だと思うのですが、あなたはどう感じるでしょうか。

 

わざわざこんな分かりにくくしなくてもいいのに

 

と思う方もいるでしょうし、

 

わかる!とっても面白い!

 

と賛同してくれる方もいるのではないでしょうか。

 

もちろんこれは個人の感じ方なので、様々な感想があって当たり前なはずです。

 

こういった、個人の主観による感じ方の揺らぎを学習してくれる研究、

実はあまり盛んではありません。

 

個人によらないような大小関係を評価する問題であれば、

もちろん様々なモデルが提案されています。

 

しかし、それらは個人間の違いを評価できないため、そういった問題に適用しても、

あまり良い成果が得られないだろうことが推測されます。

 

言葉にすればほんのちょっとの「個人差」という前提なのですが、

それがあるかないかで、分析に必要なモデルががらっと変わってきます。

 

どんな前提条件の下でモデルを構築しているのか。

 

しっかり確認しなければならないようです。

 

 

山極綾子

 

 

P.S.

実は、その個人差を考慮したモデルを、次の研究対象としたいなあと思っています。

 

どんな結果が出るかまだ分からないのですが、

とても個人的に興味が持てる研究対象で、今から結果がたのしみです。

 

 

P.P.S.

今日も最後まで読んでいただきありがとうございます!

 

メルマガの感想などありましたら、こちらからお聞かせ下さい。

 

いつも嬉しく拝見しています。いつもありがとうございます!

https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5

 

 

—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-

↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3

↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm