こんにちは。YUMAです。 アクティブファンドはベンチマークを上回るのか?という問いは至上命題ですが、現時点で疑いが…
アクティブファンドはベンチマークに勝てないのか?世界最古の研究を紹介(2/3)
こんにちは。YUMAです。
前回に続きJensen[1967]の研究論文を紹介します。と思いましたが、検定の考え方を紹介するだけでボリュームが出すぎましたのでさらに次回にも続きます。
前回のおさらいと問題意識
前回の記事はこちら↓
前回はアクティブマネージャーはベンチマークを上回っているのか?を今から50年前に分析したJensen[1967]の研究成果の概要を紹介しました。
- アクティブマネージャーの能力はリターンの高さではなく、βリスク考慮後のαで測るべき
- 信託報酬控除前であるGrossリターンで見るとαは半数のファンドでマイナス、残りの半数がプラス
- 信託報酬控除後のNetリターンで見るとおよそ2/3のファンドはαがマイナス
しかし、実際の計算結果を見て、
- αがわずかにマイナスだからと言って本当に無能なマネージャーを意味するのか?
- 有能とまでは言わないが本当はαがプラスなのに誤差の範囲でたまたまマイナスになっただけではないか?
という批判もないとは言えません。
ここで「検定」という考え方が必要になります。
検定の考え方
検定とは??
検定とは計算結果がどのくらい信用できるかを測るチェック作業、いわば分析の〆です。
検定した結果、分析結果は確からしくないということならその分析は意味がない。
まず帰無仮説(=仮想敵)を立ててからやっつける
検定の考え方は少し変わっています。
示したい仮説があったなら、それと反対の仮説を立てることから始めます。仮想敵ですね(笑)この仮想敵となる仮説を「帰無仮説」と言います。打ち破る仮説なので無に帰す仮説です。
例えば、ある研究者が血糖値を下げる新薬を発明したとします。1,000人に治験した結果、血糖値を表す数値xは平均値として下がりました。でも、この結果は本当?誤差?偶然かも?
そこで検定です。まず「この薬は効かない」という帰無仮説を立てます。この帰無仮説が正しいときの平均値xを把握します。次に実際のデータから同じ平均値yを計算して両者を比較、差分を見ます。帰無仮説が正しいとき、つまり新薬が無効である場合は両者の平均値は一致するでしょう。x-y=0です。新薬が有効ならx-yはゼロではない数値になるはずです。
x-yがゼロでなかった場合 、データから検定統計量と呼ばれる値を計算します。検定統計量があると「帰無仮説が正しい(x=yである)確率は何%か?」を知ることができます。
例えば、x=0.1, y=0.3だったとして見た目の違いは0.2です。この0.2は大きな差ですか?僅かな差ですか?x=yと見なして良い?悪い?
そんなとき、検定統計量を計算すれば帰無仮説が正しい確率(x=yである確率)は1%だった、みたいなことがわかります。つまり、99%の確率でxとyは異なるとも言えるので、この新薬は効果がありそうです。帰無仮説という仮想敵をやっつけて文字通り無に帰したわけです。これを帰無仮説を棄却した、と言います。
有意水準は慣習的に決める
検定のミソは、
では、帰無仮説の平均値とデータの平均値が何%の確率で異なっていれば棄却できるのか?この%を統計的な有意水準と言います。この水準は分析者が勝手に置くものですが、慣習的には1%とか5%とかが用いられます。
検定の流れを再確認
流れをおさらいします。
- 示したい仮説(新薬は効果がある)とは逆の帰無仮説(新薬は無効)という仮想敵を立てる
- データから平均値や検定統計量を計算する
- 帰無仮説が正しいなら、帰無仮説が正しいケースと実際のデータに平均値の差はないはず
- 差があるなら検定統計量を使って、「帰無仮説は何%の確率で間違っているか」を計算する
- 当初想定したx%という有意水準を突破するかによって確率的に結論をつける
- 仮に5%水準としたなら、「帰無仮説が正しいのは5%なので棄却する。つまり、新薬は5%有意水準で有効」という感じ
どんなことにも100%正しいとか誤りというのはないので、あくまで確率的に結論を語ります。
ここまでのまとめ
今回は検定の大まかな考え方を紹介しました。
Jensenの論文ではどんな検定がされているのか?次回に持ち越しです。
当初決めた有意水準の持つ意味を忘れないことが大事です。Jensen の論文では皆が陥りそうになるトラップがうまく考察されています。
それではまた。