×

[PR]この広告は3ヶ月以上更新がないため表示されています。
ホームページを更新後24時間以内に表示されなくなります。

■F検定→t検定・・・平均値の差の検定
【要約】・・・数学を使わない要点のみ
◎ 前提:以下において母集団は正規分布に従うとする.

 2つの母集団の平均に有意差があるかどうかを判断するには 検定を用いる.
 t検定は,2つの母集団の分散が等しい場合と異なる場合とで用いられる公式が違うので,先に2つの母集団の分散に有意差があるかどうかをF検定によって判断する.

 以上をまとめると,異なる2つの母集合の平均値の差の検定は,次の手順で行えばよい.
(1) F検定を行い2つの母集団の分散に有意差があるかどうか判断する.
(2) 分散に有意差が見られないときは,「分散が等しいときのt検定の公式」を用いて平均値の有意差を判断する.
(3) 分散に有意差があるときは,「分散が異なるときのt検定の公式(Welch法,Welch検定)」を用いて平均値の有意差を判断する.

 なお,同一集団の変化を見る場合のように,同一標本に対する2回の観測結果を比較するときは「対応がある場合のt検定」を行う.
 (これに対して上に述べたような独立な2つの集団の平均値の有意差を判断するものを「対応のない場合のt検定」という.)
※ 与えられた自由度に対するt値が95%の信頼区間の外にある=外側の確率が5%以下 → 平均値に有意差がある.
(有意水準5%がよく使われる.)

※ 分母分子の自由度に対応するF値が95%の信頼区間の外にある=外側の確率が5%以下 → 分散に有意差がある.
(有意水準5%がよく使われる.F分布表[5%点]は分母分子で決まる2つの自由度に対して上側確率が5%となるFの値を示している.)
 F分布表はF≧1のみの表であるが,分散が大小いずれにも外れる可能性を考えるときは両側検定とし,有意水準5%のときは2.5%の表を使う.
■Excelにおける操作
例1 ・・・等分散の場合の例
○ 右の表1のように2つの異なるグループから抽出された標本のデータ(長さ,重さ,得点など)があるとき,これら2つの母集団の平均に有意差があるかどうか判断したいとき
(1) まずF検定を行い,分散に有意差があるかどうか調べる:
=FTEST(B2:B7,C2:C5) は0.88となり,0.88>0.05だから,2つの母集合の分散に(有意水準5%で)有意差はないと判断できる.
(2) 等分散のときのt検定を行う:
=TTEST(B2:B7,C2:C5,2,2) ・・・ [2:両側検定2等分散
は0.48となり,0.48>0.05だから,2つの母集合の平均値に有意差はないと判断できる.(見かけの差は誤差の範囲である.)

○(分析ツールを用いる場合)
(1) まずF検定を行い分散に有意差があるかどうか調べる:
メニュー→ツール→分析ツール→「F-検定 : 2 標本を使った分散の検定」→[OK]→
変数1の入力範囲: → $B$2:$B$7
変数2の入力範囲: → $C$2:$C$5
範囲にラベルを含めていなければ,「ラベル」にチェックをしない.
αは初期設定で0.05となっているが,「Excel2002までの分析ツール」で出力されるものは片側確率なので,両側検定の有意水準5%にするときは0.025とする.
※ Excel2002まででは右のように出力されるが,P(F<=f)の箇所はミスプリントで画面に出力される数字は片側確率のものらしい.
(http://www.aoni.waseda.jp/abek/document/f-test.html
http://www.kikuchi-lab.jp/memo/excelftest.html
 参照)
0.44>0.025だから,2つの母集合の分散に有意水準5%で有意差はないと判断できる.

(2) 等分散のときのt検定を行う:
メニュー→ツール→分析ツール→「t検定 : 等分散を仮定した2標本による検定」→[OK]→
変数1の入力範囲: → $B$2:$B$7
変数2の入力範囲: → $C$2:$C$5
範囲にラベルを含めていなければ,「ラベル」にチェックをしない.
「仮説平均との差異」を空欄のままにするかまたは0を記入すれば帰無仮説として平均が等しいとした場合になる.
αは初期設定のままで0.05となる.
P(T<=t) 両側 0.48>0.05だから,2つの母集合の平均値に有意差はないと判断できる.
または
2.31>| -0.73|だから,2つの母集合の平均値に有意差はないと判断できる.
表1
  A B C
1 No Aグループ Bグループ
2 1 31 29
3 2 29 31
4 3 30 32
5 4 32 30
6 5 28  
7 6 29  
8 平均 29.83 30.50

(分析ツールの出力結果 Excel2002)
F-検定 : 2 標本を使った分散の検定
     
  変数 1 変数 2
平均 29.83 30.50
分散 2.17 1.67
観測数 6 4
自由度 5 3
観測された分散比 1.30  
P(F<=f) 両側 0.44  
F 境界値 両側 14.88  
t-検定 : 等分散を仮定した2標本による検定  
     
  変数 1 変数 2
平均 29.83 30.50
分散 2.17 1.67
観測数 6 4
プールされた分散 1.98  
仮説平均との差異 0  
自由度 8  
t -0.73  
P(T<=t) 片側 0.24  
t 境界値 片側 1.86  
P(T<=t) 両側 0.48  
t 境界値 両側 2.31  
例2 ・・・不等分散の場合の例
○ 右の表2のように2つの異なるグループから抽出された標本のデータ(長さ,重さ,得点など)があるとき,これら2つの母集団の平均には有意差があるかどうか判断したいとき
(1) まずF検定を行い分散に有意差があるかどうか調べる:
=FTEST(B2:B13,C2:C11) は0.017となり,0.017<0.05だから,2つの母集合の分散に有意差があると判断できる.
(2) 不等分散のときのt検定を行う:
=TTEST(B2:B13,C2:C11,2,3) ・・・ [2:両側検定3不等分散
は0.11となり,0.11>0.05だから,2つの母集合の平均値に有意差はないと判断できる.
○(分析ツールを用いる場合)
(1) まずF検定を行い分散に有意差があるかどうか調べる:
メニュー→ツール→分析ツール→「F-検定 : 2 標本を使った分散の検定」→[OK]→
変数1の入力範囲: → $B$2:$B$13
変数2の入力範囲: → $C$2:$C$11
範囲にラベルを含めていなければ,「ラベル」にチェックをしない.
αは初期設定で0.05であるが,「Excel2002までの分析ツール」で出力されるものは片側確率なので,有意水準5%にするときは0.025とする.
※ Excel2002まででは右のように出力されるが,P(F<=f)両側はミスプリントで画面に出力される数字は片側確率となっているらしい.
(http://www.aoni.waseda.jp/abek/document/f-test.html 参照)
0.0085<0.025だから,2つの母集合の分散に有意差があると判断できる.
 分析ツール→F検定では,変数1の入力範囲に「分子側=不偏分散の大きい側」,変数2の入力範囲に「分母側=不偏分散の小さい側」を指定したときに,統計の教科書に書かれている通りのF≧1となる値が表示されるが,右の例の出力結果は,分母分子の順序を考えずに使用したため「観測された分散比=F値」が<1となったものである.この逆数 1/0.207 が通常のF値=4.83となる.

(2) 不等分散のときのt検定を行う:
メニュー→ツール→分析ツール→「t検定 : 分散が等しくないと仮定した2標本による検定」→[OK]→
変数1の入力範囲: → $B$2:$B$13
変数2の入力範囲: → $C$2:$C$11
範囲にラベルを含めていなければ,「ラベル」にチェックをしない.
「仮説平均との差異」を空欄のままにするかまたは0を記入すれば帰無仮説として平均が等しいとした場合になる.
αは初期設定のままで0.05となる.
P(T<=t) 両側 0.108>0.05だから,2つの母集合の平均値に有意差はないと判断できる.
または
2.179>| -1.739|だから,2つの母集合の平均値に有意差はないと判断できる.
表2
  A B C
1 No
2 1 0.987 1.037
3 2 1.723 3.125
4 3 3.1 1.88
5 4 2.143 3.805
6 5 1.212 1.108
7 6 1.483 3.985
8 7 2.31 3.71
9 8 1.45 1.323
10 9 2.077 1.03
11 10 1.155 3.93
12 11 1.467  
13 12 1.34  

(分析ツールの出力結果 Excel2002)
F-検定 : 2 標本を使った分散の検定  
     
  変数 1 変数 2
平均 1.704 2.493
分散 0.364 1.757
観測数 12 10
自由度 11 9
観測された分散比 0.207  
P(F<=f) 両側 0.0085  
F 境界値 両側 0.3588  
t-検定 : 分散が等しくないと仮定した2標本による検定  
     
  変数 1 変数 2
平均 1.704 2.493
分散 0.364 1.757
観測数 12 10
仮説平均との差異 0  
自由度 12  
t -1.739  
P(T<=t) 片側 0.054  
t 境界値 片側 1.782  
P(T<=t) 両側 0.108  
t 境界値 両側 2.179  
例3 ・・・対応がある場合の例
 右の表3は1つの母集団から抽出された標本について垂直跳びのテスト(単位cm)を2回実施したデータで,2回目は筋力トレーニング実施後のテストとする(架空データ).これら2回の平均値に有意差があるかどうか判断したいとき
(1) (F検定は行わなくてもよい.)
(*) 対応がある場合のt検定を行う:
=TTEST(B2:B7,C2:C7,2,1) ・・・ [2:両側検定1対応のある場合
は0.04となり,0.04<0.05だから,2回の平均値に有意差があると判断できる.

○(分析ツールを用いる場合)
(1) (F検定は行わなくてもよい.)
(2) 一対の標本による平均の検定を行う:
メニュー→ツール→分析ツール→「t検定 : 一対の標本による平均の検定ツール」→[OK]→
変数1の入力範囲: → $B$2:$B$7
変数2の入力範囲: → $C$2:$C$7
範囲にラベルを含めていなければ,「ラベル」にチェックをしない.
「仮説平均との差異」を空欄のままにするかまたは0を記入すれば帰無仮説として平均が等しいとした場合になる.
αは初期設定のままで0.05となる.
P(T<=t) 両側 0.041<0.05だから,2つの母集合の平均値に有意差があると判断できる.
または
2.571<| -2.745|だから,2つの母集合の平均値に有意差があると判断できる.
表3
  A B C
1 No 1回目 2回目
2 1 54.3 56.5
3 2 55.2 54.8
4 3 55.0 58.2
5 4 56.4 57.8
6 5 53.1 59.0
7 6 53.1 60.7
8 平均 54.51 57.83

t-検定 : 一対の標本による平均の検定ツール  
     
  変数 1 変数 2
平均 54.508 57.833
分散 1.690 4.139
観測数 6 6
ピアソン相関 -0.563  
仮説平均との差異 0  
自由度 5  
t -2.745  
P(T<=t) 片側 0.020  
t 境界値 片側 2.015  
P(T<=t) 両側 0.041  
t 境界値 両側 2.571  

■F分布表,F検定,t検定とExcel関数,分析ツールの読み方
○ F分布表
  印刷物で示されるF分布表は,不偏分散の大きい方を分子として,「分子の自由度分母の自由度,上側確率5%(または1%)を与えるF値」の組を次のように上欄左欄縦横交わるセルの数値で表にしたものなので,%の数だけ表が必要となるが,代表的な値だけ示される.次の例では,「分子の自由度3分母の自由度4F値6.59のとき上側確率が5%になる」ことを表わしている.

F分布(5%点) 1 2 3 4 5 6 7 8 9 10 ・・・
1 161 199 216 225 230 234 237 239 241 242 ・・・
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 ・・・
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 ・・・
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 ・・・
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 ・・・
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 ・・・
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 ・・・
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 ・・・
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 ・・・
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 ・・・
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 ・・・
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 ・・・
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 ・・・
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 ・・・
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 ・・・
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 ・・・
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 ・・・
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 ・・・
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 ・・・
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 ・・・
・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・

 次の例では,「分子の自由度3分母の自由度4F値9.98のとき上側確率が2.5%になる」ことを表わしている.
F分布(2.5%点) 1 2 3 4 5 6 7 8 9 10 ・・・
1 648 799 864 900 922 937 948 957 963 969 ・・・
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 ・・・
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 ・・・
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 ・・・
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 ・・・
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 ・・・
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 ・・・
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 ・・・
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 ・・・
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 ・・・
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 ・・・
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 ・・・
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 ・・・
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 ・・・
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 ・・・
16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 ・・・
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 ・・・
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 ・・・
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 ・・・
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 ・・・
・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・

上の表にない値は次の欄に入力(Internet Explorerのみ:ActiveX使用)

○ Excel関数でF分布を表わすもの
 メニュー→挿入→関数→統計 で表示されるものの内で,
  • =FINV(上側確率, 分子自由度, 分母自由度) により「上側確率,分子自由度,分母自由度」に対応するF値が返される.  =FINV(0.05,3,4) は 6.59 となる.
  • =FDIST(F値, 分子自由度, 分母自由度) により「F値,分子自由度,分母自由度」に対応する上側確率が返される.  =FDIST(6.59,3,4) は 0.05となる.
  • =FTEST(配列1, 配列2) により2種類の資料に対するF検定の結果(両側確率)が返される(これを2で割れば片側確率になる).(※Excel2002のバージョンではヘルプにもミスがあって,この関数の戻り値は片側確率となっているが値は両側確率ということらしい.http://support.microsoft.com/kb/417964/ja 参照)  次の表において,=FTEST(B2:B7, C2:C5) とすれば0.883となり,分子自由度5,分母自由度3の資料のF値に対する両側確率が0.88であることを表わす.この確率が0.05よりも大きければ有意差なしと考える.
  A B C
1 No
2 1 31 29
3 2 29 31
4 3 30 32
5 4 32 30
6 5 28  
7 6 29  
○ F値と分散との関係
(1) 2つの母集団から抽出された標本の不偏分散(標本から推定される母集団の分散)をV1≧V2≧0とするとき
F = V1/V2 
で定義する.(大きい方を分子にするのは印刷物で表の枚数を減らすための伝統的な都合であって,理論上の問題ではない.)
  上の表では  V1 = VAR(B2:B7) = 2.17, V2 = VAR(C2:C5) = 1.67,F = V1/V2 = 2.17/1.67 = 1.3
(2) 次に,「2.5%のF分布表で,上欄の自由度6-1=5,左欄の自由度4-1=3」の交わるところで読み取ると14..88となるから,上側確率2.5%(両側確率5%)はF=14.88のときに実現され,観測されたF値は1.3<14.88だから分散には有意差なしとする.
 Excel上では =FDIST(F値, 分子自由度5, 分母自由度3) = 0.44で上側確率が0.025より大きいから分散には有意差なしとする.
 または,=FINV(0.025,分子自由度5, 分母自由度3) = 14.88>1.3だから分散には有意差なしでもよい.

○ Excel2002までのツール→分析ツール→F検定 で出力される表
 右の表のようなデータについて分析ツールの「F検定:2標本を使った分散の検定」によって出力される表(下図)は次のように解される.

(1) 分析ツールのパラメータ指定に当たって,「変数1の入力範囲」としては不偏分散の大きい方(右図では乙)を指定し,「変数2の入力範囲」としては不偏分散の小さい方(右図では甲)を指定すると,通常用いられるF値が「観測された分散比」に表示される.(逆順の場合はその逆数となる.)
 出力される表は両側検定のものなので有意水準5%の検定のときはα=0.025とする.

(2)
  • 観測数とは,標本数のこと.
  • 自由度は,標本数-1
  • 出力される表の下2行は,画面上の表示とは異なり「片側検定(上側確率)」に対応する値となっているので注意.・・・Excel2002よりも新しいバージョンでは訂正されているとのこと
  • 観測された分散比が F値 = 大きい方の不偏分散/小さい方の不偏分散 を表わす.右の例では 4.823 = 1.757/0.364
  • P(F<=f)両側 は P(F<=f)片側 と読み替える.すなわち,0.0086は求めたF値の上側確率を表わす.
  • F 境界値 両側 は F境界値片側 と読み替える.すなわち上側確率が0.025となるFの値は3.5879
Excel関数との対応
FDIST(F値,乙側の自由度,甲側の自由度)=0.0086
FINV(0.025,乙側の自由度,甲側の自由度)=3.5879

FTESTは甲乙の順にかかわらず同じ値となりF検定の両側確率を表示する:
FTEST(甲の値の範囲,乙の値の範囲) = 0.017=0.0086×2
No
1 0.987 1.037
2 1.723 3.125
3 3.100 1.880
4 2.143 3.805
5 1.212 1.108
6 1.483 3.985
7 2.310 3.710
8 1.450 1.323
9 2.077 1.030
10 1.155 3.930
11 1.467  
12 1.340  
平均 1.704 2.493
不偏分散 0.364 1.757
F-検定 : 2 標本を使った分散の検定  
     
  変数 1 変数 2
平均 2.493 1.704
分散 1.757 0.364
観測数 10 12
自由度 9 11
観測された分散比 4.823  
P(F<=f) 両側 0.0086  
F 境界値 両側 3.5879  
○ t分布表については ( sample3.htm )参照
○ t検定に使うExcel関数
 =TTEST(配列1, 配列2, 尾部, 検定の種類) により,t値に対応する外側確率が返される.
 ここで
 尾部は,片側検定なら1,両側検定なら2とする.
 検定の種類は,対応がある場合は1,分散が等しい場合は2,分散が等しくない場合は3とする.
 次の甲乙の資料の平均値に有意差があるかどうか検定するには,先にF検定を行ってFTEST(B2:B7, C2:C5)が0.88だから上側確率は0.44となり,分散が等しい(=有意差なし)と判断でき,
   =TTEST(B2:B7, C2:C5, 2, 2) により 0.483>0.05となるから有意差なし.
  A B C
1 No
2 1 31 29
3 2 29 31
4 3 30 32
5 4 32 30
6 5 28  
7 6 29  

○ 分析ツールの「t-検定 : 等分散を仮定した2標本による検定」出力結果
 等分散の場合のt値は次の公式で計算される:
  
 上の表・・・右の出力結果では
(ただし,出力結果の「分散」は不偏分散,自由度1=6-1=5自由度2=4-1=3
= -0.73となる
t-検定 : 等分散を仮定した2標本による検定  
     
  変数 1 変数 2
平均 29.83 30.50
分散 2.17 1.67
観測数 6 4
プールされた分散 1.98  
仮説平均との差異 0  
自由度 8  
t -0.73  
P(T<=t) 片側 0.24  
t 境界値 片側 1.86  
P(T<=t) 両側 0.48  
t 境界値 両側 2.31  

○ 分析ツールの「t検定 : 分散が等しくないと仮定した2標本による検定」出力結果
 不等分散の場合のt値は次の公式で計算される:

 右の表と出力結果では
= -1.739となる
t-検定 : 分散が等しくないと仮定した2標本による検定  
     
  変数 1 変数 2
平均 1.704 2.493
分散 0.364 1.757
観測数 12 10
仮説平均との差異 0  
自由度 12  
t -1.739  
P(T<=t) 片側 0.054  
t 境界値 片側 1.782  
P(T<=t) 両側 0.108  
t 境界値 両側 2.179  

○ 分析ツールの「t検定 : 一対の標本による平均の検定ツール」出力結果
 対応がある場合のt値は次の公式で計算される:
 右の表と出力結果では
= -2.74 となる
No 1回目 2回目
1 54.3 56.5 -2.2
2 55.2 54.8 0.4
3 55.0 58.2 -3.2
4 56.4 57.8 -1.4
5 53.1 59.0 -6.0
6 53.1 60.7 -7.6
平均 54.51 57.83 -3.33
不偏分散 1.69 4.14 8.81
t-検定 : 一対の標本による平均の検定ツール  
     
  変数 1 変数 2
平均 54.51 57.83
分散 1.69 4.14
観測数 6 6
ピアソン相関 -0.56  
仮説平均との差異 0  
自由度 5  
t -2.74  
P(T<=t) 片側 0.02  
t 境界値 片側 2.02  
P(T<=t) 両側 0.04  
t 境界値 両側 2.57  
■例と答
別添ファイル( t_test.xls  )にこのページで解説した例があるので,確かめることができる.

○=== メニューに戻る

◇このページの内容について,考え方の間違い,計算間違い,著作権上の
問題点などお気づきの点がございましたら までご連絡ください.