Within-Subject計画での信頼区間(CI: confidence interval)について

被験者内要因の実験の場合、Loftus&Masson(1994)が被験者要因を考慮したCIの出し方を1994年に提言している。
私が専門(にしようと希望しているところ)のTMS研究で知ってる論文をざっと眺めたところ、条件別のCIではなくこのLoftus&Masson(1994)の提言したCIを用いているものが多い。そしてこのCIはだいたいの場合、条件別のCIよりも短くなる、ということだ(とあるTMS研究者に聞いた)。

「計算・要因計画しだいでCIが短くなっていいのか?」という意見があるかもしれないが、被験者内要因の場合「被験者」による分散(要するに個人差*)を取り除くのは当然。個人差と実験要因の効果が混ざるのがイヤだからわざわざ同じ人からデータをとるのである。
分散分析にかける時もsubjectの項目があってこの効果を全体の誤差から取り除けるから有意差取り出しやすい、というのが被験者内要因データの利点のはず。

で、計算方法はというと、
CI = M ± √(MSs×c/n)* [criterion t(dfs×c)]

ルートの中身は()内。
t値の自由度は(被験者数-1)×(条件数-1) *1

MSC = SSall-SSs-SSc / (n*c) [c は条件数]

簡単な方法としては、一要因計画のデータと見立てて分散分析をし、その誤差項を(被験者数×条件数)で割ればMSS×C になる。
ANOVA4なら要因名をAとしたらerror[AS]で出てくる数字のMSの列がそれなのでそれを(n*c)で割るべし。

<まとめ>
multifactorの被験者内計画のCIの計算は一要因被験者内計画の場合と一緒。

間違ってたら教えてください。
ちなみにその後カナダの軍事研究所の二人のメンバーがさらに考察を加えているようだ(Hollands and Jarmasz, 2009; Jarmasz &Hollands, 2010)。でも今のところはLoftus&Masson,1994使い続けていいと思う。
そのうち議論をフォローしたら追加予定

*1
ここではまず全体の平方和SSAから被験者による変動SSSと実験条件による変動SSCを引いているわけである。そのうえで1セルあたりの値(平均平方)を得るために、(被験者数×条件数)で割る。ちなみにA要因とB要因の2要因分散分析をし、SSA×S+SSB×S+SSA×B×S として、これをこれらの自由度の総和で割っても、一要因の場合の誤差項の平方平均と同じになる(Masson&Loftus,2004ではこちらの方法で説明していた)。
誤差の総和はデータが同じ限りは一要因分析をしても2要因以上の分析をしても一緒、ということである。


References

Loftus & Masson (1994) Using confidence intervals in within-subject designs. Psychonomic Bulletin & Review, 1, (4), 476-490.

Masson & Loftus (2003) Using Confidence Intervals for Graphically Based Data Interpretation. Canadian Experimental Pscyhology, 57, 203-220
(1994のものとほぼ内容一緒らしいけどcontrastとか言うのが出てくる)

Jarmasz, J., & Hollands, J. G. (2009). Confidence intervals in re
peated measures designs: The number of observations principle. Ca
nadian Journal of Experimental Psychology
, 63, 124-138.

Hollands &Jarmazs (2010) Revisiting confidence intervals for repeated measures designs. Psychonomic Bulletin & Review, 17, (1), 135-138
(彼らの議論を読むならこちら。2009のものより短くまとめられているようだ。)

ANOVA & t-test

一か月以上前に書いててそのままエントリーしてなかったお題があったのでアップしておこう。すごい基礎的なんだろうけど、分散分析とt-testに関する問題。
ちょっと長いです。

-------------------------------------------------------------------------------------
最近自分のデータの分析をしていて、自分がANOVA4を用いて得られた結果が指導教員の出した結果と異なっていたことで少しもめた。見たいのはAという要因の効果で、この要因は2水準のみ(A1/A2)なのでt-testによる比較が可能。しかしA以外にBとCの要因があったので全体で分散分析もできると考えてください。分散分析の結果では2次の交互作用が有意でした。
したがって個別の条件でAの要因の効果を見るのだが、

私:ANOVA4の下位検定を利用
先生:t-testで個別に検定

これをして結果が異なってしまったわけです。具体的にはAの単純・単純主効果の見られる場所が異なった、つまり検定方法によってAの効果が有意になったりならなかったりしていました。

基本的なことながら今回おさらいしたので、なぜ同じデータでこのように異なる結果となったかをメモします。具体的にはANOVA4の下位検定とt-testの違いですが、

ANOVA4: プールされた誤差項を用いる
t-test: 個別の誤差項を用いる

これがどのような違いを生むかというと、例えば2要因(A,Bとしよう;Aは2水準)のデータで交互作用があり、Bの各水準において、Aの単純主効果を見たいとする。

ANOVA4の場合: 同一の誤差項を用いるので、Aの水準間の差が大きいほど有意になりやすい。
t-testの場合: 条件によって誤差項が異なるので、Aの水準間の差が大きくても有意になりやすいとは限らない。

どちらが好ましいのかは状況によって異なると考えられる。ただ、等分散性が仮定できるか微妙な場合はt-testのほうが正しいと思う。例えば要因Aが会社(α社/β社)で、株価の変動の検定をしているとして、α者の株が値動きが激しく、β者の株が比較的安定しているとしたら、これらを「プールされた等しい誤差項」で検定することには問題があるでしょう。

年中上下している投資銀行の株が1000円動いたとしても驚かないが、
比較的安定していた食品会社の株が1000円動いたら一大事(買収か!?)

みたいな感じでしょうか。そもそも株価を分散分析することってないし統計的に問題ありそうな気がするけど、そこはたとえってことにしといてください。

-------------------------------------------------------------------------
それで件のデータはどうなったかというと、検定によって結果が変わるようなデータは好ましくないということで、ほぼお蔵入りになりました。まあそうだよね。実験の道は厳しいのですよ。

そのうちこのとき調べた統計関係の論文のメモもしておこう。また使うはず。

SD, SE, & CI

おさらい

SDはデータのばらつきを表す指標
SD=√{(X-Xj)^2}/(n-1)

SEは
SE=SD/√n

CIは
CI=μ±SE*t(α,df)

もし16のサンプルの値からその平均値の95%信頼区間を求めるなら、
この場合のt≒2.13なので(自由度15で両側95%)
CI=μ±SE*2.13

サンプル数が十分に多ければ、95パーセント信頼区間のtは1.96になる。
ちなみに両側検定のtで話をしている。
片側検定のtを使うことがあるかは専門家ではないのでわからないが、
通常の分散分析に対応する信頼区間を求めるなら、両側検定のtを用いて
信頼区間を想定しておく方がよいだろう。

Search form
Display RSS link.
Link
Friend request form

Want to be friends with this user.