ANOVA & t-test

一か月以上前に書いててそのままエントリーしてなかったお題があったのでアップしておこう。すごい基礎的なんだろうけど、分散分析とt-testに関する問題。
ちょっと長いです。

-------------------------------------------------------------------------------------
最近自分のデータの分析をしていて、自分がANOVA4を用いて得られた結果が指導教員の出した結果と異なっていたことで少しもめた。見たいのはAという要因の効果で、この要因は2水準のみ(A1/A2)なのでt-testによる比較が可能。しかしA以外にBとCの要因があったので全体で分散分析もできると考えてください。分散分析の結果では2次の交互作用が有意でした。
したがって個別の条件でAの要因の効果を見るのだが、

私:ANOVA4の下位検定を利用
先生:t-testで個別に検定

これをして結果が異なってしまったわけです。具体的にはAの単純・単純主効果の見られる場所が異なった、つまり検定方法によってAの効果が有意になったりならなかったりしていました。

基本的なことながら今回おさらいしたので、なぜ同じデータでこのように異なる結果となったかをメモします。具体的にはANOVA4の下位検定とt-testの違いですが、

ANOVA4: プールされた誤差項を用いる
t-test: 個別の誤差項を用いる

これがどのような違いを生むかというと、例えば2要因(A,Bとしよう;Aは2水準)のデータで交互作用があり、Bの各水準において、Aの単純主効果を見たいとする。

ANOVA4の場合: 同一の誤差項を用いるので、Aの水準間の差が大きいほど有意になりやすい。
t-testの場合: 条件によって誤差項が異なるので、Aの水準間の差が大きくても有意になりやすいとは限らない。

どちらが好ましいのかは状況によって異なると考えられる。ただ、等分散性が仮定できるか微妙な場合はt-testのほうが正しいと思う。例えば要因Aが会社(α社/β社)で、株価の変動の検定をしているとして、α者の株が値動きが激しく、β者の株が比較的安定しているとしたら、これらを「プールされた等しい誤差項」で検定することには問題があるでしょう。

年中上下している投資銀行の株が1000円動いたとしても驚かないが、
比較的安定していた食品会社の株が1000円動いたら一大事(買収か!?)

みたいな感じでしょうか。そもそも株価を分散分析することってないし統計的に問題ありそうな気がするけど、そこはたとえってことにしといてください。

-------------------------------------------------------------------------
それで件のデータはどうなったかというと、検定によって結果が変わるようなデータは好ましくないということで、ほぼお蔵入りになりました。まあそうだよね。実験の道は厳しいのですよ。

そのうちこのとき調べた統計関係の論文のメモもしておこう。また使うはず。

Post a comment

Private comment

Search form
Display RSS link.
Link
Friend request form

Want to be friends with this user.