3757.
インデックスページへ戻る第3回 理解しておきたい検定セクション5 標準誤差(SE)とはセクション1 セクション2 セクション3 セクション4セクション4では、仮説検定の概念としてその考え方と具体的な検定手順を学習しました。引き続いてセクション5では、標準誤差を求め、データの散らばり具合をみて、検定の正確性を判断します。■標準偏差と標準誤差仮説検定で最初にすることは、標準誤差(SE)を求めることです。よく似た統計用語に標準偏差(SD)がありますね。標準誤差(standard error)とは、標準偏差を√nで割った値です。注)標準誤差と標準偏差とは類似しているので、混乱を避けるため本文では標準誤差をSE(標準誤差)あるいはSEで表します。このSEとはいったい何なのかが、気になりますね。今までの勉強で、この式の中にある標準偏差(SD)はおわかりだと思います。データの散らばりの程度を示す値です。SDが大きいと、外れ値があったり、解熱剤で言えば解熱の効き目が患者によって異なったりするという傾向が大きいということです。したがって、SDは小さいほうが良いわけです。では、サンプルサイズnの大小関係については、どう考えれば良いでしょうか。母集団のことを知るためには、サンプルサイズnは大きいほうが良いですね。SEの式を見てください。SD、nがどのような場合、SEは小さくなるでしょうか。SDが小さく、nが大きいときにSEが小さくなります。つまり、データの散らばり程度とサンプルサイズnの大きさを考慮して求められたSEは、母集団のことを知るためのバロメーターとなるのです。ですから、SEは重要だということです。SEについて、興味深いお話をしておきましょう。少し難しいかもしれません。●SEは標本平均の分布の散らばり程度(標準偏差)ある調査の標準偏差をsとする。SEはs÷√nである。nが十分に大きな値のときは、sは母集団の標準偏差に等しい。調査の実施は通常1回だが、多数回(たとえば1,000回)実施したとする。各調査の平均値をx1、x2、…、x1,000とする。この平均値を「標本平均」と言う。標本平均x1、x2、…、x1,000 1,000個の標準偏差をuとする。1回の調査より求められたSEであるs÷√nは、標本平均の標準偏差であるuに等 しい。調査より求められたSEは、実際には実施していない多数回(1,000回)の調査の標本平均の散らばり程度(標準偏差)を示しているということである。この法則を「中心極限定理」と言う。1730年代にフランスの数学者シモン・ラプラス(Pierre-Simon de Laplace)は、中心極限定理の法則を見出した。最終的に1930年代フィンランドのリンデベルグ(Jarl Waldemar Lindeberg)とフランスのレヴィ(Paul Pierre Levy)が、中心極限定理が成立することを証明した。このようにSEは、標本平均のSDであるという考えに基づき、仮説検定の公式が作られているということです。仮説検定を学ぶために、SEとは別にもう1つ知っておくべきことがあります。それが、「対応のあるデータ」「対応のないデータ」です。こちらについては、セクション6で学んでいきましょう。■今回のポイント1)標準偏差(SD)が小さく、サンプルサイズnが大きいときに標準誤差(SE)は小さくなる!2)データの散らばり程度、サンプルサイズnの大きさを考慮して求められたSEは、母集団のことを知るためのバロメーター!3)SEは標本平均の分布のSD!インデックスページへ戻る