以前紹介したχ二乗検定とt検定の必要症例数(統計力検定って、どうやるの?)に引き続き、多変量解析の必要症例数を勉強してみました。
多変量解析の場合は、因子の数が重要なようです。因子とは、年齢、性別、罹病期間、etc...の、検討する変数の事です。
ロジステック回帰分析 因子数×10例
コックス比例ハザードモデル 因子数×10例
線形回帰モデル 因子数×15例
結論から言うと、アウトカムのどちらか1群の必要症例数は、上記になります。普通は2群間で比べるので、全体症例数は最低でも上記の2倍になります。
ロジステック回帰分析では、因子の数×10 例 が、目的とするアウトカムの少ない方の群に必要な数です。たとえば、発生率10%の骨折があったとして、骨折の危険因子を、年齢、性別、骨密度の3因子で調べようとすると、骨折群に3因子×10例=30例必要で、全体では300例が必要症例数になります。
例えば、骨密度と骨折の関連を調べる線形回帰モデルの場合、性別、年齢、筋量の3因子で補正を行う場合、 骨折群 3因子×15例= 45例、 非骨折群3因子×15例= 45例 合計90例が必要になります。
現実には検証可能な症例数は限られているので、あれもこれもと因子を増やそうとすると、不安定な統計モデルとなってしまします。そこで、先行論文や臨床経験等で重要な因子を選択し、最適なモデルを作ることが重要で、研究者のOriginality(ともすると、恣意性に陥りますが。)が発揮される点になります。
そうした目で見てみると、整形外科領域の論文では、いかに統計力の足りない多変量解析が多いことか、、、 IFが低い要因がわかる気がします。
もちろん僕のような統計初心者の関わる臨床研究はほとんどが「探索的研究」(反対語は「検証的研究」)であるため、必ずしも必要症例数を満たす必要はありません。その点をうまく読者、reviwerに伝えることが重要になります。
参考URL
必要症例数 多変量解析
http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02933_08
http://www.kdcnet.ac.jp/hepatology/technique/statistics/multivar/multivar1.htm
探索的研究について。
http://med.kyushu-u.ac.jp/recnet_fukuoka/e-learning/method.html