Untitled

 From:山極綾子

 

 

準備に不安を抱えた昨日を乗り切り。

 

ついに久しぶりの出国の日…!

 

目の前にはANAとJALの飛行機がずらり。

 

両方見れるのは国際線ターミナルだからこその贅沢。

 

普段から「飛行機大好き!」という訳ではないのですが、なんだかわくわくします。

 

(ANAを先に書いたのは、目の間にある機体の数がANAの方が多いためです。

順不同ですので悪しからず。)

 

 

ANAとJALと言えば、その色味のおかげで遠目から見てもすぐにどちらの機体か判断できます。

 

他の航空会社もそれぞれ特徴的な見た目をしていますし、電車もそれぞれ特徴的な色をしています。

 

山手線は緑。

 

中央線は黄色。

 

カラフルなこともまた、複数の路線が入り混じっている景色の眺めが良くなる要因のような気がします。

 

 

ところで、どの航空会社の飛行機であるかを見分けようとしたとき、

パッと目が行くのが尾翼の部分で、他の部分まで見ることはとても少ないように思います。

 

例えば機体の横に書いてある社名を見ても判断できますし、

もしかすると他にも違いがあるのかもしれません。

 

ですがほとんどの方が、尾翼を見て判断するのではないでしょうか。

 

機械学習にも、どの部分が判断に大きな影響を与えるか?を評価する手法がいくつかあります。

 

最近提案されたSHAPという手法もありますが、統計のもっと基本的な方法があります。

 

 

それは主成分分析です。

 

厳密に言えば「判断に効く変数はどれか?」を評価しているわけではないのですが、

より対象の特徴を表してくれる新しい変数を作ることができます。

 

そして、その作成された変数と、元々の変数の関係性を見れば、

より「特徴的な」変数を作り出すことができます。

 

データにとって特徴的であると言うことは、

その値を見ればデータを判断しやすいかもしれない、と考えられます。

 

(もちろんすべてにおいて成り立つ、という訳ではありません。)

 

 

例えば学年全員の国語・社会・理科・算数テストの点数を集めて主成分分析をすれば、

理系科目・文系科目といった新しい軸ができるようなイメージです。

 

しかもこの手法の嬉しい所は、元々の各教科の点数を使うよりも、

新しい軸で得られた特徴量を使って分析した方が、精度が上がる可能性が高いということです。

 

エクセルでも簡単に実行できる分析ですので、何かのデータが手元にあるとき、

データの分布にはどんな特徴があるか?特徴的なのはどんな変数か?

関係性がある変数はどれか?

 

そんなことを始めに見てみると、より質の高い分析につながるように思います。

 

 

山極綾子

 

 

P.S.

今日も最後まで読んでいただきありがとうございます!

 

メルマガの感想などありましたら、こちらからお聞かせ下さい。

 

現在データ分析コンサルティング受付中です。

 

お問い合わせもこちらからどうぞ。

 

いつも嬉しく拝見しています。いつもありがとうございます!

https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5

 

—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-

↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3

↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm