input & output

完全文系プログラミングど素人が機械学習に興味を持ってしまった。

良い分析、悪い分析

http://www.maremame.com/2015/07/blog-post_22.html?m=1

 
随所で話題になっている東芝の第三者委員会報告書。やはり印象的なのは、一番最後の方にある「PC事業月別売上高・営業利益推移」だと思う。振幅がどんどん大きくなっていること、また利益の増価額が売上の増価額を上回っている月があるところ、こういうところに着目すれば、(経営学部で真面目に勉強している大学4年生くらいなら)一目見れば(第三者委員会報告の添付資料となっているという前提は無視することはできないが)異常な感じを持てるのではないだろうか。ましてや、社内外のチェックする側としては、このような増減を細かくみているのではないか(細かく見過ぎて、大枠を外したのかもしれないが)。
 
この件を機に、改めて「良い分析・悪い分析」とは何かを考えてみたいと思う。なお、分析結果を利用する人は『自分』という前提を置いて話を進めていこう。
 

分析の目的

  悪い分析:分析の目的を明確にしない。
  良い分析:分析の目的を明確にする。
分析にあたり、月別、四半期別、年別に数字を並べてみたり、さらにこれを細かくして、会社別、事業別、産業別、等々、何を分析しようか明確に決めないままでとりあえず数字を並べようとする。これは非常によろしくない。数字の情報は、調べれば調べるほど出てきます。それをいちいち並べていたら、時間が幾らあってもたりません(もっとも、学生の長期休暇のように時間に相当余裕がある人であれば、否定するものではありません)。まずは目的を決めましょう。分析の目的はただ一つ、自分が何を知りたいのかを明確にすることです。東芝の例で言えば、「PC事業の売上と売上総利益を月次で並べて異常な変動があるのかどうか知りたい!」という目的を明確にしておけば、(異常な状況を判断できる知識があるという前提で)すぐに状況の異常さに気づけるでしょう。しかし、とりあえず数字だけ並べて置いてー、と言われたことを何の目的も持たずに粛々と行っているだけでは、何も気付かずに終わってしまうでしょう。
 
分析の材料集め
  悪い分析:材料が不明、不足
  良い分析:材料が明確、充分
何かを分析するためには、分析の基礎となるデータが必要です。特に、数値(金額、数量、回数、距離、重さ……)を必要とすることが多いです。この時、必要な数値を特定し、充分な量のデータを集めることが重要です。そもそも、何を集める必要があるのかわからないのでは、分析を始められません。必要なものを特定しましょう。データが集まったところで、少ないのでは意味がないかもしれません。例えば数年分のデータを見る必要があるところ、集まったデータは2ヶ月分では充分ではないでしょう。分析の目的を達成するために必要なデータを特定し、収集方法を探り、実際に充分な量を確保する、これが大事な要素です。
 
結果に対しての自己批判
  悪い分析:自己批判を行わずに分析結果に満足してしまう
  良い分析:分析結果を自己批判し、不足・解釈の誤りをトコトン洗い出す
大量のデータの収集に疲れ、とりあえず分析した結果をなんとなく良いものと思ってしまい、それをそのまま受け入れてしまう。ありがちな、残念な分析です。数値上の分析結果と現実の感覚に異常な差はないか?分析結果は本当に正しいのか?分析に使った手法は正しいのか?基礎となるデータに誤りはないのか?色々な面から自己批判を行うことで、分析の精度・証拠力が高まります。分析結果を利用する『自分』が満足いくまで突き詰めましょう。そうすることで、最初の分析では見えなかった状況が明らかになることもあります。
 
いかがでしょうか。これが『他人』のための分析であれば、『他者からの批判』も大事な要素になります。人によっては、「分析手法が大事だろ!」という声も上がるかと思います。自分で声を上げたなら、ご自身で何かを分析する時に、ぜひ意識してください。
 
東芝と同じような悲劇が繰り返されないよう、良い分析を心がけましょう。
 

 

 

 

企業分析入門 第2版

企業分析入門 第2版