データが足りない!

From:山極綾子

 

 

1つ当たり6分かかるから…あと50ファイルで…。

 

ん?単純計算で5時間!?

 

…今日中に終わるだろうか…。

 

 

今日の私の一日は、人事のKPIレポートの作成に溶けていきました。

 

その作成中の集中力は我ながら素晴らしく、

午前からお昼過ぎにかけて行われていたゼミの記憶もうつろなほどです。

 

どんな資料を作っていたかと言うと、人事に関する様々な指標について、

それぞれの売上高ごとに、他社との比較を可能にするKPIレポートでした。

 

例えばこの売上高の会社であればどれぐらいの給与が適正なのか?

なんかもわかるようになります。

 

 

「えっ。私の給料、安すぎ…?」

 

なんて疑問にも、定量的に答えることが可能になります。

 

 

その資料を作る際に使っているデータは、

統計局が公開しているデータなのですが、

場合によってはそのデータが少なすぎるのです。

 

というのも、このレポートを作る際、業種ごとに絞って作成していたりもします。

 

業種ごとに、従業員の多さや少なさも変化するため、

全体の傾向と合わせて、業種ごとの分析も必要になるためです。

 

全業種を対象に分析しているときは、さすがに対象企業数も約300万社と多いため、

十分なデータがそろっていたのですが、問題は業種を絞った時です。

 

特にいくつかの業種の分析で、困ったことがいくつか起きました。

 

 

データが足りない!!

 

対象の企業数が少ないために、例えば極端に稼いでいる企業があれば、

その情報に引きずられてしまうなどしてしまったのです。

 

全体としての傾向を見たいのに、特徴的なデータに引きずられてしまうことは、

全く喜ばしくありません。

 

 

こんな時、どうすべきか?

 

大きく分けて2つの方法があります。

 

1つ目に、データを増やすこと。

 

一般に、たくさんのデータがあればあるほど外れ値の影響も

無視することが出来るようになっていきます。

 

(増やしたデータが不適切だった、など、例外はあります)

 

2つ目に、外れ値を手作業や機械学習のモデルで削除すること。

 

そのどちらも、それぞれ異なるコストがかかってしまいます。

 

 

例えば今回の場合では、提供されているデータの都合上、

外れ値を削除することは簡単なことではありませんでした。

 

分析するのに十分なデータをどうやって得ればいいのか?

 

本当に難しい問題だなあと感じました。。。

 

 

山極綾子

 

 

P.S.

今日も最後まで読んでいただきありがとうございます!

 

メルマガの感想などありましたら、こちらからお寄せ下さい。

 

いつもありがとうございます!

https://keieijinjipartnersytube.typeform.com/to/B8JjDrk5

 

—————————————————————-
【経営人事メールマガジン】
発行責任者: 山極毅(株式会社経営人事パートナーズ)
発行者住所:〒100-0005東京千代田区丸の内1-8-3丸の内トラストタワー本館20F
連絡先:https://keieijinji.co.jp/
メールアドレス: strategic-membership-program■■keieijinji.co.jp(■■を@に置き換えてください)
—————————————————————-

↓バックナンバーはこちら↓
PC: https://04auto.biz/brd/BackNumber.htm?acc=keieijinji&bid=3
スマホ・ガラケー: https://04auto.biz/brd/BNMobi.htm?a=keieijinji&b=3

↓メルマガの新規登録はこちらから↓
PC: https://48auto.biz/keieijinji/touroku/scenario13.htm
スマホ: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
ガラケー: https://48auto.biz/keieijinji/touroku/sp/scenario13.htm