×

[PR]この広告は3ヶ月以上更新がないため表示されています。
ホームページを更新後24時間以内に表示されなくなります。

⇔ このページは正規分布を用いた推定検定の内容を前提としています.

■t分布 ・・・ 母集団が正規分布で,母標準偏差が未知,標本数が少ないとき
(概ねn が30未満)の推定と検定
■要約■
 小さい標本 n (概ね30未満)から母集団の値を推定するときt分布を用いる.
○ 母集団が正規分布,標本の大きさ n <30のとき,次の値 t を用いて,自由度 n-1t分布で考える.
 (標本平均:m,母平均:μ,母標準偏差:σ,標本(単純)標準偏差:s,標本(不偏)標準偏差:u とする)
 
 (1) 標本(不偏)標準偏差:uで計算するとき
 (2) 標本(単純)標準偏差 s で計算するとき

○ t分布のグラフは正規分布のグラフと似ているが,各自由度ごとにグラフが異なるので,正規分布と同じように1つの表として示すことはできない.(コンピュータで行うときはこの制限はない.)

両すその面積の和がpになるようなtの値
  pの値
自由度 : n-1 0.1 0.05 0.01
1 6.314 12.706 63.656
2 2.920 4.303 9.925
3 2.353 3.182 5.841
4 2.132 2.776 4.604
・・・ ・・・ ・・・ ・・・

 (1) よく使われる確率に絞って,自由度-確率に対応するtの値が求められるようになっている.
 
(2) t分布のグラフは左右対称となっている.
 
(3) 片側検定に用いるには,2倍のpの値に対応するtを求めればよい.


※ t分布の表として,上記のようにA「pを両すその面積で表示するもの」の他,B「pを片側の面積で表示するもの」,C「-∞からの累積(1-Bの面積)」などがある.何を表わした表か確認してから使うことが重要.


 n=5(自由度n-1=4)のとき,両すその和が0.05(5%)となるtの値は2.776
[ 詳しいt分布表は右下欄 ]
※ Student のt分布
 Studentは,「学生の成績の分布?」とは関係ない.この分布を研究した統計学者のペンネーム
 正規分布や二項分布のように,実際にt分布に従う事象があるのでなく,標本の性質(統計量)から母集団の性質(母数)を推定するための正規分布の補正表というべきか.

○ 母標準偏差σが未知のとき,nが大きければ標本標準偏差sで代用できるが,nが小さくなるほど誤差がひどくなるので,標本の値から母標準偏差σを推定するには標本(不偏)標準偏差 u を用いる.(これは単なる経験則でなく,理論の裏付けあり.)

○ 標本 x1, x2, ・・・ , xnの(単純な)標準偏差
に対して,母標準偏差を推定するときは,分母を n-1 に替えたもの
を使う.u2不偏分散と呼ばれる.

 u2 はどの書物でも「不偏分散」と書かれているが, u は「母標準偏差の不偏推定値」「不偏分散から求めた標準偏差」「標本に基づいて予測した標準偏差」などと表記は多様.気楽に"不偏偏差"といいたいところだが,手持ちの書物にはこの用語はない.専門家にとっては不偏推定量を使うのが当然なので,uのことを標本標準偏差,標準偏差と呼ぶ場合もあるが,このページでは初学者に区別が分かりやすいように,s:標本(単純)標準偏差,u:標本(不偏)標準偏差,σ:母標準偏差とする.

○ 母標準偏差:σ,標本(不偏)標準偏差:u,標本(単純)標準偏差:sの関係
・標本(不偏)標準偏差:u は母標準偏差:σの近似値として使える:u≒σ
・定義から だから =
・n>30のときは,σ, u, s はほぼ等しい.

※ 自由度
 2次元のxy平面全体ではxもyも自由に決められるので,自由度は2
 しかし,xy平面上で x+ y = 1 という条件を満たすx,yの組では,xを決めるとyが決まるから,自由に決められる変数は1個
 自由度は 2 - 1=1

 3次元空間ではx,y,zが自由に決められるから,3次元空間全体の自由度は3
 しかし, x + y + z = 5 という条件を満たすx,y,zの組では,x,yを決めるとzが決まるから,自由に決められる変数の数は2個
 自由度は 3 - 1 = 2
 
このように,条件式を1つ追加すると,自由度は1個減る.

○ 平均値が m となる変数の組  x1x2 , … , xn は,次の方程式を満たす.
m = ( x1 + x2 + … + xn )

変数が n個で方程式が1個だから自由度は n-1
○ 正規分布を用いる推定や検定と比べると,正規分布表の代わりにt分布表を用いることと,自由度(標本の大きさ-1)を考えることが異なるが,考え方は正規分布を用いた推定検定と同様

例1[推定]
 誤差が正規分布をなすと考えられる製品から標本10個を無作為抽出したところ,重さの標本平均は148.5(g),標本(単純)標準偏差は3(g)であった.この製品の母平均の信頼度95%の信頼区間を求めよ.
(解答) n<30なのでt分布による
= (148.5-μ)/1
 自由度9のt分布でp=0.05のとなるのはt=2.262
-2.262≦148.5-μ≦2.262より
146.2≦μ≦150.8
例2[両側検定]
 ある錠剤は1粒あたり平均250.0mgのビタミンCを含むものと定められている.錠剤の標本20個を無作為抽出したとき,ビタミンCの含有量は1粒当り平均249.5mg,標本(単純)標準偏差0.5mgであった.この標本を取り出した母集団の錠剤は規格を来しているか.有意水準1%で検定せよ.
(解答)n<30なのでt分布による
= (249.5-250.0)/0.1147=-4.359
 自由度19のt分布でp=0.01のとなるのはt=2.861
-4.359<-2.861
棄却域に入るから,規格を満たしていない.
例3[片側検定]
 標本の大きさ n = 12,標本平均 m = 305,標本(不偏)標準偏差 u = 5,有意水準 α = 0.01 のとき,帰無仮説H0:μ = 300,対立仮説:μ>300 の検定をせよ.
(解答)n<30なのでt分布による
= (305-300)/1.443=3.465
 自由度11のt分布で(両側で)p=0.02となるのはt=2.718
2.718<3.465
棄却域に入るから,帰無仮説は棄却され,対立仮説が採択される.
t分布表

※上の表が見えないときは[ →こちら ]     
■例と答■
(1)[推定]
 ある会社の製品であるゴルフボールから12個抽出して重さを測定したところ,標本平均45.8(g),標本(単純)標準偏差1(g)であった.この製品の母平均の信頼度95%の信頼区間を求めよ.

[※架空の問題です.45.93(g)以下という規則があるそうです.]

(解答)標本の大きさ(個数)が12<30なのでt分布を用いる.
= (45.8 - μ)/(1/3.317) = (45.8 - μ)/0.3014
t分布で自由度11,p=0.05となるtの値は2.201
-2.201≦(45.8 - μ)/0.3014≦2.201より
45.13≦μ≦46.46
(2)[両側検定]
 ある小麦粉は,1袋の内容量1000(g)として販売されている.この小麦粉15袋を無作為抽出して測定したところ,標本平均1002(g),標本(単純)標準偏差2(g)であった.この袋詰めは正しく行われているかどうか有意水準5%で検定せよ.
(解答)標本の大きさ(個数)が15<30なのでt検定とする.
H0:μ = 1000, H1:μ ≠ 1000 で両側検定を行う.
= (1002-1000)/(2/3.74) = 2/0.535 = 3.738
t分布で自由度14,p=0.05となるtの値は2.145
2.145<3.738 だから帰無仮説棄却.
袋詰めは正しく行われていない.
(3)[片側検定]
 母集団が正規分布をしていると考えられるとき,標本の大きさ n = 10,標本平均 m = 49.8,標本(単純)標準偏差 s = 0.5,有意水準 α = 0.01 のとき,帰無仮説H0:μ = 50.0,対立仮説:μ<50.0 の検定をせよ.
(解答)標本の大きさ(個数)が10<30なのでt検定とする.
H0:μ = 50.0, H1:μ < 50.0 で片側検定を行う.
= (49.8-50.0)/(0.5/3) = -0.2/0.167 = -1.198
t分布で自由度9p=0.02となるtの値は2.821
-2.821<-1.198 だから帰無仮説は棄却されない.

■Excelを用いた計算■

利用できる主な関数名,利用方法 概要,
=TINV(確率, 自由度)

 値を求めたいセルに直接 =TINV(0.05, 10) のように書き込む

 または,メニューから「挿入」→「関数」→関数の分類「統計」→関数名「TINV」→確率の欄に0.05など有意水準(危険率)または有意水準の小数が記入されたセル名を記入→自由度の欄に標本の大きさ-1の自由度を記入→OK

※ 引数(パラメータ)を有意水準,自由度の順に書き込む点に注意
○ メニューでは「スチューデントt-分布の逆関数を返します」と表示されるが,この関数で
自由度n-1有意水準p t値 が求まる.

  A B C D E F G
1       確率p
2     自由度 0.1 0.05 0.02 0.01
3     9 1.833 2.262 2.821 3.250
4 2.201   10 1.812 2.228 2.764 3.169
5     11 1.796 2.201 2.718 3.106
6     12 1.782 2.179 2.681 3.055
 セルA4に=TINV(0.05,11) と記入すれば,上のような値が返される.
 セルD3に=TINV(D$2, $C3) と記入し,この式をD3からG6までコピー・貼付すると,上のようなt分布表ができる.

※ この関数は,確率,自由度からt値を求めるものなので,信頼区間の推定にも,検定にも使える.
=TDIST(X, 自由度, 尾部)
Xのところにt値を記入
自由度には標本数-1を記入
尾部には,両側の確率を求めるときは2を,片側の確率を求めるときは1を記入
○ 指定されたX(t値)の外側にあるt分布の確率を返す.
   t値(X)自由度片側か両側か確率p が求まる.
尾部が2のとき→
尾部が1のとき→

  A
1 0.050
 セルA1に =TDIST(2.226,10,2) と記入すると,t = 2.226, n-1 = 10, 両側 のときの確率p が0.05と返される.

※ この関数は,t値,自由度,両側か片側かを指定して確率を求めるものなので検定に使える.
(単純)標準偏差の計算 =STDEVP(範囲)
 範囲内に空白や文字列データがあってそれらを0とみなして計算したいとき(個数nに含めるとき)は STDEVPA(範囲)を用い,それらを個数に数えたくないときは=STDEVP(範囲)を用いる.

(不偏)標準偏差の計算 =STDEV(範囲)
 範囲内に空白や文字列データがあってそれらを0とみなして計算したいとき(個数nに含めるとき)は STDEVA(範囲)を用い,それらを個数に数えたくないときは=STDEVA(範囲)を用いる.
 なお,蛇足ながらこの関数を利用せずにΣ(xk - m)2 から定義に従って計算するときは,平均(期待値)mは標本の大きさnで割ることに注意

正の平方根の計算 =SQRT(セルまたは値)
  B C
1 3.7    
2 4.1    
3 4.8    
4 5.5    
5 5.6    
6 5.8    
7 6.1    
8 6.7   1.194
9 7.8   1.267

 セルC8に =STDEVP(A1:A9) と記入すればC8にA1〜A9までの値の(単純)標準偏差1.194が返される.
(「母集団の標準偏差を求める」とは,単純に個数nで割った標準偏差を求めるということ)
 セルC9に =STDEV(A1:A9) と記入すればC9にA1〜A9までの値の(不偏)標準偏差1.267が返される.
(「標本に基づいて予測した標準偏差を求める」とは,n-1で割った不偏推定値の標準偏差を求めるということ)
=C8/SQRT(8), =C9/SQRT(9) はいずれも0.422 となる.

■例と答■

(1)[推定]
 得点が正規分布に従うと考えられる多数の答案の中から9枚を無作為抽出して採点した結果は次のとおりであった.
  38, 44, 70, 53, 50, 34, 51, 49, 58
 この試験で母平均の信頼度95%の信頼区間を求めよ.
(解答)
標本の得点をA1からA9に入力し,
=AVERAGE(A1:A9) で標本平均 m=49.667 を求めておく.
=STDEVP(A1:A9) で標本(単純)標準偏差s=10.055 が得られる.
=TINV(0.05, 8) を求めると,t=2.306 となるので
49.667±2.306×10.055/SQRT(8) より
41.4≦μ≦57.9となる

※ =STDEV(A1:A9) で標本(不偏)標準偏差u=10.665を求めて,49.667±2.306×10.665/SQRT(9) としても同様

※ メニューから「ツール」→「分析ツール」→「基本統計量」→入力範囲:A1:A9,平均の信頼区間の出力:95%
として出力される値 8.198 は上の赤字部分(平均からの幅)
(2)[両側検定]
 ある食品の内容量(g)について標本12個を無作為抽出して検査したところ,次の結果が得られた.
48.2, 54.7, 51.0, 49.3, 46.9, 46.8, 49.6, 46.9, 47.0, 50.9, 50.2, 45.9
 この製品は母平均50.0(g)という条件を満たしているといえるか.危険率5%で検定せよ.
(解答)標本の大きさ(個数)が12<30なのでt検定とする.
H0:μ = 50.0, H1:μ ≠ 50.0 で両側検定を行う.

標本の値をA1からA12に入力し,
=AVERAGE(A1:A12) で標本平均 m=48.95 を求めておく.
=STDEV(A1:A12) で標本(不偏)標準偏差u=2.52 が得られる.
=TINV(0.05, 11) を求めると,t=2.20 
|m-50.0|/(u/SQRT(12)) = 1.44<2.20だから
帰無仮説は棄却されない.

※ =TDIST(1.44, 11, 2)を求めると0.17となりp>0.05だから帰無仮説は棄却されない.
(3)[片側検定]
 ある会社では通勤距離3.0km以下の社員には通勤手当は支給されず,3.0kmを超える社員についてはその距離に応じた通勤手当が支給される.自宅から会社までの通勤距離を15回測定したところ,次の結果が得られた.
3.02, 3.16, 2.95, 2.99, 3.32,
3.21, 2.86, 2.85, 3.08, 2.93,
3.00, 2.92, 3.22, 3.10, 2.98 
 この社員には通勤手当を支給すべきかどうか有意水準5%で検定せよ.
(解答)標本の大きさ(個数)が15<30なのでt検定とする.
3.0kmを超えるかどうかが問題だから片側検定とする.
H0:μ = 3.0, H1:μ > 3.0 で片側検定を行う.

標本の値をA1からA15に入力し,
=AVERAGE(A1:A15) で標本平均 m=3.039 を求めておく.
=STDEV(A1:A15) で標本(不偏)標準偏差u=0.138 が得られる.
=TINV(0.10, 14) を求めると,t=1.76 
|3.039-3.0|/(u/SQRT(15)) = 1.05<1.76だから
帰無仮説は棄却されない.

※ =TDIST(1.05, 14, 1)を求めると0.156となりp>0.05だから帰無仮説は棄却されない.支給すべきだとは言えない.
○=== メニューに戻る

◇このページの内容について,考え方の間違い,計算間違い,著作権上の
問題点などお気づきの点がございましたら までご連絡ください.