ベイズの定理でプロジェクトの失敗を予測失敗のまとめ

第4回：ベイズの定理でプロジェクトの失敗を予測
http://www.thinkit.co.jp/article/139/4/
これのページ3

プロジェクト管理利用する「ベイズの定理」

がひどかったので詳細をまとめておく。事後確率の関わる話を最初から正しく理解できる人が多くないのは確かかもしれない*1が、解説記事でこの混乱ぶりはちょっとどうかと。

求めようとしているものは、既に求まっている

図3-2

実際の結果↓＼返事→ ほぼ予定通りそのほか

予定通り 0.7 0.3

遅れた 0.3 0.7

この表は、上司の進捗状況調査に対して部下が「ほぼ予定通り」かそれ以外の返事を返し、その後、実際の結果がどうなったかの確率を表してます。id:andalusia さんのはてブコメントにあるように、なんで横まで揃えちゃったの？*2という感じですが、一致してたら絶対に駄目というわけでもないのでこのまま話を進めます。返事があった上での結果の確率ですから、表の各項は

実際の結果↓＼返事→	ほぼ予定通り	そのほか
予定通り	P(予定通り｜「ほぼ予定通り」と発言)	P(予定通り｜その他の発言)
遅れた	P(遅延｜「ほぼ予定通り」と発言)	P(遅延｜その他の発言)

を表しています。この問題で求めようとしている、『「ほぼ予定通り」と返事が来た上で、実際に予定通りに終わる確率』は、表の左上に載っていますね。既に上司が体得している通りであって、それ以上の何かではありません。この問題にベイズの定理を使う余地はありません。

確率設定の矛盾

また、図3とともに

あなたは、Yさんはスケジュールを結果的に9割の確率で守るものの、スケジュールに関する発言は7割程度の信頼しかないと常日ごろ感じています。

と述べており、この「結果的に9割の確率で守る」というところが、P(予定通り)=0.9、P(遅れた)=0.1 を意味しているようです。
が…この確率は先ほどの事後確率の表といきなり矛盾します。
今、x=「ほぼ予定通り」の返答回数、y=その他の返答回数としましょう。すると、比例式
$0.7x+0.3y\hspace{1em} : \hspace{1em}0.3x+0.7y = 0.9\hspace{1em} : \hspace{1em}0.1$
が成り立ちます。左辺前項は、予定通り終わった回数です。図3-2によると、「ほぼ予定通り」の返答がきたうちの7割と、その他の返答がきたうち3割は予定通り終わっているはずですから、足せば予定通り終わった回数全体になるわけですね。同様に左辺後項は遅れた回数全体です。内項の積と外項の積の等式に変形し、両辺に100掛けすれば
$7x+3y=27x+63y$
整理すると
$x+3y=0$
です。つまり、 $x=y=0$ となるか、片方が負になるかのどちらかです。図3-2と実績9割の両方を満たす結果はありえません。

それどうやって出した？

後ろの計算式でP(「ほぼ予定通り」と発言|予定通り)とP(「ほぼ予定通り」と発言|遅れた)をさも当然のように0.7と0.3として扱っていますが、これこそベイズを使わないと出せない確率のはず。

記事に沿う内容にするにはどうすべきだったか

というわけで、記事の最後の節に限ってはもう何もかもが駄目駄目な感じです。
最後に、記事に沿ってベイズの定理を使う問題にしたかったらどうすればよかったかというと、求めるものをP(「ほぼ予定通り」と発言|予定通り)にしておけば筆者のやりたいことに沿った問題になったでしょう。*3まあ上で述べた通り確率が矛盾してるのでそこも修正が必要ですけど。

なお、2ページ目は単にベイズの解説だったのでほとんど読んでいないが、この様子だと2ページ目の解説にも間違いがあるのかもしれない。

*1:モンティ・ホール問題で正解に抗議が沢山来た件

*2:横を足して1になるように揃えたかったのかも。もちろんそんな必要はまったくない

*3:後で気づいたが、ベイズの定理を使う問題にはなったけど「プロジェクトの失敗を予測」にはなってなかった。もうめんどくさいので修正しないけど