Siegel ???????????? ?????? 1983

Document Sample
Siegel ???????????? ?????? 1983 Powered By Docstoc
					統計手法アラカルト
        ン パ
                        ラ
  ノ                         メトリック法


 行動計量学講座B3
  林賢一二十一歳
      nonparametrique                1
        目次(適当)
• ノンパラメトリック検定とは
• ノンパラメトリック検定の特徴
• いろんな検定
 – たくさんあります(18個+α)




            nonparametrique   2
     ノンパラメトリック検定とは
• Nonparametric tests
   – ⇔Parametric tests
• 母集団分布について極めてゆるい仮定しか設け
  ない統計学分野
   – 分布に拠らない(distribution-free)検定
• 測定値が完全な量でなく、順序や度数として表さ
  れるデータを扱う
   – パラメトリック検定にはない
   – データの順序や順位付けに焦点

                         nonparametrique   3
              長所
• 母集団分布の形がわからなくてもよい
• 計算が比較的簡単
 – 高校程度の数学知識しか使わない
• 仮定の壊れによる影響を受けにくい
 – 頑健(robust)な検定
• 小標本に対しても適用できる


             nonparametrique   4
                短所
• データの浪費
 – 得られた情報を十分活用できない
 – パラメトリック検定に比べ検出力が劣る
• めんどい
 – 方法がいろいろありすぎて使いどころに困る
 – 各検定のための有意確率表が多い
   • 入手するのも大変

• 分散分析モデルでの交互作用を検定できない
  (特殊な仮定が必要)
                nonparametrique   5
       のんぱらは
• すごくたくさんほうほうがあります
• ここでぜんぶせつめいできません
 – ぜんぶってなんだろう?


• だから、ここではSPSSでできるやつだけ
  しょうかいします
 – SASののんぱらはへぼい?

          nonparametrique   6
         前置き
• 関数は函数と表現します
 – 好みの問題です
• 断りが無ければ、α=0.05とします
• データは全て捏造です
 – 「ガッツ」は仮想量です
 – ガッツに関する質問は授業後にでも・・・


             nonparametrique   7
           1:1標本のとき
•   二項検定
•   χ2検定
•   Kolmogorov-Smirnovの検定
•   ラン検定
    – 無規則性の検定



                nonparametrique   8
                1-1:二項検定
• Binomial test
• 2つのカテゴリからなるデータの期待度数
  と観測度数が等しいか否かを検定
  – 二項分布を用いる
             N  x n x
  – P( x)    p q
             
          x
• 観測値より極端な値をとる確率を求めれ
  ばよい

                     nonparametrique   9
                            例
(問)コインを20回投げたら、表が5回、裏
が15回出た。このコインは公平か?
(答)観測値より極端な値をとる確率は
                                  20 x
               20  1   1 
           5            x

p( x)  2     
              x 2                        0.042  0.05
         x 0        2 

よって、このコインは公平であるといえない。

                       nonparametrique                     10
       大標本の場合
• N(全事象)>25のとき、正規近似できる

     x  NP,  x  NPQ
   で近似でき(P≒0.5のとき)
             x  x
        z
                x
         で検定できる
             nonparametrique   11
                    1-2:χ2検定
• Chi-square test
• 2つ以上のカテゴリからなるデータの期待
  度数と観測度数が等しいか否かを検定
  – χ2統計量を用いる
        k
          (Oi  Ei ) 2
  –  
      2
                       (Oは観測値、Eは期待値)
        i 1   Ei
• 小さいほど観測値と期待値の一致はよろ
  しい

                      nonparametrique   12
                          例
(問)大学生100人にガッツ税(地方税)導入に関
する意見を聞いたら、以下のようになった。
  意見 大反対 反対                 中立        賛成        大賛成
  人数        9        40        11        17        23

(答) χ2統計量を計算する
       5
           (Oi  Ei ) 2 (9  20) 2     (17  20) 2
 2                                           31.0
      i 1     Ei          20              20
自由度4のχ2分布の臨界値は9.49なので、ガッツ税
に関する意見は一様でない。
          nonparametrique 13
           注意
• 自由度が1のとき、各期待度数が5以下
• 自由度が1以上のとき、セルの20%が5未
  満か期待度数が1以下

 χ2検定は適当ではない(Cochran,1954)
• そういうときは隣接するカテゴリを結合して
  みるのもよい(2つになったら二項検定)
           nonparametrique   14
 1-3:Kolmogorov-Smirnovの検定
• 標本分布がある特定の理論分布と一致するか
  否かの検定
  – 適合度検定
• F0(X)
  – 指定された累積度数分布函数
• SN(X)
  – N個の観測値による標本の累積度数分布
• D  F0 ( X )  S N ( X ) の最大値を最大偏差と呼ぶ
• 数表からDの臨界値を調べる
                nonparametrique       15
                     確率
• 二項分布に従う

              p q
 P S N ( X )     F0 ( X )  1  F0 ( X )
                                  p              q p
              q   p
                  




                    nonparametrique                16
                            例
(問)学生10名に狩野先生のめがねの色が異な
る写真を見せ、好みを聞いた。好みは偏るか?
   色         1(透明)   2(微黒)      3(弱黒)     4(半黒)   5(真っ
                                                   黒)
  人数           0       1             0      5       4
 F0 ( X )     0.2     0.4           0.6    0.8     1.0

 S10 ( X )    0.0     0.1           0.1    0.6     1.0

   D    0.2  0.3 0.5  0.2 0.0

(答)maxD=0.5であり、数表からN=10のとき臨界値
は0.41なので、好みは偏っているといえる
                      nonparametrique                    17
           検出力
• Kolmogorov-Smirnov検定は個々の観測
  値を個別に扱う
 – カテゴリの結合を通して情報を失わない
 – χ2検定より検出力高い




            nonparametrique    18
       1-4:ラン検定
 • 2つの変数(表/裏、男/女など)の観測の順
   序がランダムか否かを検定
 • ラン(run、連)の数に基づく検定
 • コインを20回投げ、表、裏ともに10回ずつ
   出た。公平なコインだろうか?
表表表表表表表表表表裏裏裏裏裏裏裏裏裏裏        こんなんでも?

表裏表裏表裏表裏表裏表裏表裏表裏表裏表裏        こんなんでも?



          nonparametrique      19
              ランとは
• run
• ひとつの変数の、ひとつの継続

  蟹鮭鮭鮭蟹蟹蟹鮭蟹鮭
  run   run   run        run run run


        この場合、ランは6つ
              nonparametrique          20
                        確率
• 二つの変数をn1、n2(N=n1+n2 )としたとき、
  ランのが数r(≦N)である確率は
                    n1  1 n2  1  n  n 
                  2 r  r           1 2  rが偶数のとき
                     1   1   n1 
P(r )              2  2                   
         n1  1 n2  1  n1  1 n2  1  n1  n2 
         k  1  k  2    k  2  k  1   n 
                                                
                                         1 
                                          rが奇数のとき(r=2k-1)
                        nonparametrique               21
              ランをもとに
• 二つの変数をの総数(それぞれn1、n2)から
  数表を引いてランダム性を検定
• n1、n2のいずれかが20以上のとき
          2n1n2             2n1n2 (2n1n2  n1  n2 )
    r           1,  r 
         n1  n2            (n1  n2 ) 2 (n1  n2  1)
           で正規近似でき
        r  r
   z                    で検定できる
          r
                      nonparametrique                    22
              例
(問)コインA、Bをそれぞれ20回投げ、表、
裏10回ずつ出た。公平なコインだろうか?
A:表表表表表表表表表表裏裏裏裏裏裏裏裏裏裏
B:表裏表裏表裏表裏表裏表裏表裏表裏表裏表裏

(答)A系列はラン2個。B系列はラン20個。
n1=n2=10のとき、数表より、コインがランダ
ムならばランは6~16の値をとる。よってど
ちらのコインも公平とはいえない。
             nonparametrique 23
SPSSを使おう1の1
   • ラン検定を例に
   • 左のようにデータを入力
   • 分析の前に名義変数を量
     的変数に変換すること
     – めんどくさいですね




    nonparametrique   24
    SPSSを使おう1の2
                           変換した変数
                           の名前を指定




• 「変換」→「値の再割当て」→「ほかの変
  数」
• 「今までの値と新しい値」で、変換の種類を
  指定
         nonparametrique       25
           SPSSを使おう1の3
今までの値を指定                         新しい値を指定




                                      既に指定した
                                      変数




                       名義変数から量的変数に変換する
               nonparametrique             26
            SPSSを使おう1の4



       連に よ る 検定


検定値a
                   A
                    .5000
                                • 「分析」→「ノンパラメ
ケース < 検定値
ケース >= 検定値
                        10        トリック検定」→ラン
                        10
全ケース
連の個数
                        20
                         2
                                • 分割点は中央値でよ
Z
漸近有意 確率 (両側)
                   -3.905
                      .000
                                  い
  a. 中央値
                             nonparametrique   27
     2:2標本(独立)のとき
• Kolmogorov-Smirnovの検定
  – 位置母数の検定
• Mann-WhitneyのU検定              分布の位置と形を特定
• Wald-Wolfowitzのラン検定
• Mosesの外れ値反応検定
  – 過剰反応に関する検定


              nonparametrique          28
2-1:Kolmogorov-Smirnovの検定
• Kolmogorov-Smirnovの2標本検定
• 独立な2標本が同じ分布を持つ母集団から
  抽出されているか否かを検定
• 1標本の場合とほぼ同じ
• 一方の累積度数分布を S n1 ( X ) 、他方を
  とおき、その最大偏差Dをみる
  S n2 ( X )
 – で、数表を引く

             nonparametrique   29
        大標本の場合 、n が40以上)
              (n                1   2



• 両側検定の臨界値は1.36 (n1  n2 ) n1n2
  で求められる
• 片側検定の場合は下式が自由度2のχ2分
  布に近似できることから求める

                n1  n2
           4D
          2         2

                 n1n2

              nonparametrique           30
         特徴
• 標本が非常に小さいときは、U検定よりも
  やや効率がよい
• 大標本に対しては逆に効率が悪い




         nonparametrique   31
 2-2:Mann-WhitneyのU検定
• 独立な2標本が同じ分布を持つ母集団から
  抽出されているか否かを検定
• 順序尺度が適用できるときに利用
• 2標本をひとまとめにし、昇順に順位付け
 – U統計量を算出
• ノンパラメトリック検定の中で極めて検出力
  が高い
             nonparametrique   32
                  U統計量
一方の標本(n1個)の順位の和をR1、他方の
標本(n2個)の順位の和をR2としたとき
             n1 (n1  1)              n2 (n2  1)
   U1  R1              , U 2  R2 
                  2                        2
とし、小さいほうをU統計量として数表から臨
界値を得る。
ちなみに U1  U 2  n1n2

                     nonparametrique            33
             大標本の場合
• 2標本のデータ数がそれぞれ10以上
 – 統計解析ハンドブック
• 小さい方の標本のデータ数が20以上
 – ノンパラメトリック統計学(S.Siegel)
 のとき、Uは正規近似でき
          n1n2        n1n2 (n1  n2  1)
     U       , U 
            2                12
          U  U
 から、  z            で近似する
           U
                    nonparametrique        34
                       例
(問)小学二年生と人科三回生で逆上がり10回
中10回成功するまでの回数を調べた。逆上がり
の上達に差があるだろうか?
   小2(S)    9           11         15
   人3(J)    6            8         10       13

(答)二つの群をひとまとめにし、順位をつける
  順位   1    2      3         4     5    6        7
  回数   15   13    11         10    9    8        6
  群    S    J      S         J     S    J        J

                 nonparametrique                     35
            つづき
U(順位の合計)は、RS=1+3+5=9なので

               nS (nS  1)
    U S  RS              3
                    2
数表より、このデータ数のときにUがこの値
をとる確率は0.2であり、小学2年生と人科3
回生の逆上がりの上達に差は無い

             nonparametrique    36
2-3:Wald-Wolfowitzのラン検定
• 独立な2標本が同じ母集団から抽出され
  たものか否かを検定
• 1標本ラン検定と同じ
• 2つの標本をひとまとめにして、順番に並
  べてランを算出、検定



         nonparametrique   37
2-4:Mosesの外れ値反応検定
• 過剰反応に関する検定
• ある状況や条件が、ある人には一方に過
  剰な反応を起こさせ、またあるひとには逆
  方向に過剰な行動を起こさせることを想定
  してデザインされた検定
• わかりづらいので、わかりづらい例で説明
  します

        nonparametrique   38
                        例
(問)パーソナリティ・テストから判別して、自分の衝
動を統制できる人のグループ(C群)と、統制が困
難である人のグループ(E群)それぞれ9名ずつに、
達成困難な課題をさせた後、ガッツを測定し、課題
前後でのガッツの差を比較した。2つのグループの
間で変動の仕方に差はあるだろうか?

  C   12   16   6    13      13       3   10   10   11
  E   25   5    14 19         0       17 15    8    8
      2群の課題前後でのガッツの差
                    nonparametrique                      39
               仮説
• E群のほうが課題による苛つきを解消できず、
  ガッツの変動が大きいだろう
• ガッツが増える人もいるだろうし、減る人もいるだ
  ろう
 – E群の差の平均は0に近い?
• C群はあまり変わらないだろう
 – やっぱり平均は0?
• 今までの検定じゃ対応できない
 – Mosesの検定は、こうした状況を想定した検定方法な
   のです
           nonparametrique   40
              新しい概念
• スパン(span)
  – 得点をひとまとめにしたときの、ひとつの群の順位の
    範囲
  – s  で表す
  – 要するにレンジ(range)
• レンジの不安定さを考慮して修正
  – 端点を取り去ったスパン(truncated span)
  – s h で表す
  – 取り去る数hは自分で決める
                nonparametrique   41
                           例のつづき
          (答)ひとまとめにして、順位をつける
順位    1   2   3   4    5   6   7      8    9 10 11 12 13 14 15 16 17 18
ガッツ   0   3   5   6    8   8   10 10 11 12 13 13 14 15 16 17 19 25
群     E   C   E   C    E   E   C     C     C     C   C   C   E   E   C   E   E    E



      Cのスパンは14。端点を除いた s h は9(h=1)。最小
      な s hは7だから観測値との差は2であり、これをgと
      おく。つまり、
                      sh  9, h  1, g  2
                                   nonparametrique                           42
          例のつづきのつづき
求めるのは、s h が観測値より極端な値をと
る確率だから
                           g
                               i  nC  2h  2  nE  2h  1  i 
                            
                         i 0 
                                                
                                                     nE  i
                                                                   
                                                                   
 P( sh  nC  2h  g ) 
                                       i                         
                                          nC  nE 
                                         
                                          n        
                                                    
                                              C    
であり、これよりp=0.077であり、両群に差が
あるとはいえない

                            nonparametrique                            43
SPSSを使おう2の1
       •   U検定を例に
       •   左のようにデータ入力
       •   名義変数を変換
       •   小2→0
       •   人3→1
       •   「ノンパラ」→「2個の独
           立サンプルの検定」

    nonparametrique   44
SPSSを使おう2の2
                      検定したい変数を指定


                      変数をどう分けるか指定


                      検定の種類を選択




                 グループ化させる数値を指定


    nonparametrique              45
    3:2標本(対応)のとき
• 符号検定
• Wilcoxonの符号順位和検定
• McNemarの検定
 – 変化の顕著性に関する検定
• 周辺等質性検定
 – Exact testがないと使えない


             nonparametrique   46
            3-1:符号検定
• Sign test
• 対応のある2標本に用いる
• 順序尺度のときに適用
• 2標本の差の符号に注目
• 一方をA群、他方をB群としたとき、検定さ
  れる帰無仮説は p( X A  X B )  p( X A  X B )  1 2
• 確率は二項分布によって与えられる
    – 大標本のときの近似も二項検定と同じ
                    nonparametrique           47
                                  例
     (問)人科17名の1回生のときと4回生のときの体
     育の成績を比較した。差はあるだろうか?
学生 a     b   c   d    e   f   g    h     i      j   k   l   m n     o   p        q

1回   4   4   4   2    3   2   4    3     1      3   4   3   2   3   4   4        2

4回   2   3   2   1    3   3   3    3     2      2   2   2   3   2   4   3        1

                     成績(優=4、良=3、可=2、不可=1)




                              nonparametrique                               48
                                つづき
(答)タイ(差が0)は検定から落とす。このときN=14。
学生 a    b   c   d       e   f     g    h     i    j       k   l   m n   o   p    q
差   2   1   2   1       0 -2 1         0 -1 1             2   1 -2 1    0   1    1
符号 +    +   +   +       0 - +          0 - +              +   + - +     0   +    +

表より、符号が負であるのは3個。これより極端な
結果になる確率は、片側検定で
                                        x         14 x
                    3
                     14  1   1 
            p       
                     x 2                                 0.029
                x 0       2 
であり、1回のときのほうが成績がよいといえる
                                nonparametrique                             49
3-2:Wilcoxonの符号順位和検定
• Wilcoxon’s sign rank test
• 符号検定の強力版
• 差の向きだけでなく、大きさも考慮
• 一方のスコアをxi、他方をyiとして
  di  xi  yi
  に順位をつける
• 少ないほうの符号を持つ順位の和をTとし
  て、数表から臨界値を得る
           nonparametrique    50
          大標本の場合
• N(全事象)>25のとき、正規近似できる
      N ( N  1)                N ( N  1)( 2 N  1)
 T             , T 
          4                             24
               で近似でき
                  x  T
             z
                     Tx
              で検定できる
                  nonparametrique                      51
                      例
(問)人科生8名について一週間ジムに通った後と、
一週間事務的な事をした後でガッツを測定した。差
はあるだろうか?
  学生    a   b     c     d       e    f    g    h
  ジム   82   69   73    43      85   56   76   85
  事務   63   42   74    37      51   43   80   82
   差   19   27   -1     6       7   13   -4    3
  順位    7   8     1     4       5    6    3    2

(答)少ない符号の順位の和T=4なので、数表よりジ
ムと事務ではガッツに差があるといえる
                 nonparametrique                   52
    3-3:McNemarの検定
• 主に前・後(before-after)計画に適用
 – 前後でどれだけ傾向が変わるか
 – 変化の顕著性
• 名義尺度、順序尺度に適用     後
• 右のような表を用いる       - +
• AとDに注目       前 + A B
                              -   C    D
            nonparametrique           53
                 で
• A=Aでの観測数、D=Dでの観測数とすると
                 (O  E ) 2
       2  
            A, D    E
           ( A  D) 2
         
             A D
は自由度1のχ2分布に近似できる

             nonparametrique   54
                              例
(問)学生25名にガッツ税の賛否を2回調査した。1回
目と2回目の間にあるビデオテープを見せた。これは
意見を賛成に向けさせる効果をもつと期待される。
本当に効果あるか?
                                                  後
         (4  14 ) 2
(答) 2               5.56                       否    賛
          14  4
であり、自由度1 のχ2分布の臨界                         前   賛   4        4
値は3.84なので、ビデオテープに
は効果があるといえる                                    否   3    14

                        nonparametrique               55
   3-4:周辺等質性検定
• 周辺対称性とも
• 2つの関連のある順位変数に対する検定
• 2値反応(McNemar検定)の、多値反応へ
  の一般化
• χ2分布を使って、反応の変化を検定
• 前後計画における反応の変化を調べるの
  に適す
          nonparametrique   56
                       方法
•   詳しいことはよくわかりません
•   2次元分割表
•   帰無仮説は
           H 0 : pij  p ji
•   分解すると
               H 01 : pi  pi
                     H 02 : pij p jk pki  p ji pik pkj
• MH統計量
    – Marginal Homogeneity?
    – Mantel Haenszel?

                       nonparametrique                    57
SPSSを使おう3の1
    • 符号検定を例に
    • 例によって左の如く
    • 「ノンパラ」→「2個の対応
      サンプルの検定」




    nonparametrique   58
SPSSを使おう3の2

                      検定したい変数の
                      組を指定



                      検定の種類を選択




        で、実行(出力は省略)
    nonparametrique         59
     4:k標本(独立)のとき
• χ2検定
  – 割愛
• 中央値検定
• Kruskal-Wallisの分散分析
• Jonckheere-Terpstraの検定
  – Exact Testsがないと使えない
• SPSSの使い方は2標本と同じ
               nonparametrique   60
    4-1:中央値検定
• Median test
• k組の独立な標本が、同一母集団から抽出
  されているか否かを検定
• データは順序尺度




        nonparametrique   61
         方法
• k組の中央値を求める
• kこの中央値の中央値を求める
• 中央値の中央値より大きいなら+、小さい
  なら-に置換
• で、 χ2値を計算



        nonparametrique   62
                  例
(問)母親の最終学歴と母親の学校訪問回数に
関係があるといえるか?
   学歴   小学校    中学校              高校   大学

   回数    4        24            2    9
         3         1            0    4
         7         6            4    2
         1         3            3    3
         2         0            8    2
         0         2            0    4
         3         5            5    5
         5         1            2    2
         1         2            1    2
                   1            7    6
                                6
                                5
                                1
              nonparametrique             63
                       例つづき
(答)群毎にデータを中央値の中央値以上、
以下に分類 する
   学歴                小学校          中学校         高校        大学
   以上                   5            4        7         6
   以下                   5            7        6         4

     r    k     (Oij  Eij ) 2
 2                           1.295  7.82(  3 )
                                                  2

    i 1 j 1        Eij
となり、母親の学歴によって差があるとは
いえない
                            nonparametrique                  64
4-2:Kruskal-Wallisの分散分析
• k組の独立な標本が、同一母集団から抽出
  されているか否かを検定
• 連続変量を順序に置き換える
• 1元配置




         nonparametrique   65
               方法
• ひとまとめにして順序をつける
• njをj組目の標本数、Rjをj組目の順位の和、
  Nを全標本数とする
• このとき
               k R2
  は自由度k-1のχ
          12 2分布に近似的に従う
    H
                  j

         N ( N  1)
                    n
                    j 1
                                  3( N  1)
                            j




               nonparametrique                 66
                 例
(問)ある店でバイト君と社員と客のガッツを測定
した。3つの群のガッツは等しいだろうか?
   群   社員      バイト             客

   ガ
       96       82             115
   ッ   128      124            149
   ツ   83       132            166
       61       135            147
       101      109




             nonparametrique         67
                例つづき
    (答)順位をつける(降順)
群    社員   バイト   客

ガ
     4     2     7             12       222  
                         H            
                                        5    3(14  1)
ッ    9     8    13
     3    10    14          14(14  1)       
ツ
     1    11    12                            
     5     6                  6.4
    数表より群の標本数(5,5,4)のときp<0.049
    であり、ガッツが等しいとはいえない

                 nonparametrique                    68
         検出力
• 95.5%の漸近効率
• 中央値検定よりよい
 – データを2分せず、順位とすることでデータの
   情報をより多く利用しているから




          nonparametrique   69
4-3:Jonckheere-Terpstraの検定
• k 個の母集団の自然な 事前の位付け (昇順
  または降順) があるときに有効
• 例えば、k 個の母集団が k 段階の上昇温度
  を表す場合
 – 帰無仮説:異なる温度で同じ反応
 – 対立仮説:温度の上昇につれ反応が上昇(下
   降)
  • 対立仮説が順序付けられる
          nonparametrique   70
                  方法
• H1 : F1 ( x)  F2 ( x)    Fk ( x) とする
• 母集団i、j(i<j)からの標本で、xij<xjvをみた
  す組の数をUijとするとき
                 k 1     k
            J         U         ij
                 i 1 j  i 1

  を検定に用いる

                 nonparametrique         71
                   大標本の場合
 • N(全事象)>9のとき、正規近似できる
               k                             k
       N 2   n2
                j            N 2 (2 N  3)   n 2 (2n j  3)
                                                 j
            j 1                             j 1
J                 , J 
           4                               72
                      で近似でき
                         x  J
                    z
                             J
                     で検定できる
                         nonparametrique                  72
    5:k標本(対応)のとき
• CochranのQ検定
• Friedmanの分散分析
• KendallのW検定
 – 一致度係数
• SPSSの使い方は2標本のときと同じ



            nonparametrique   73
   5-1:CochranのQ検定
• k組の対応ある標本の、それらの間で有意
  差があるかを検定
• McNemar検定の拡張
 – 従って、データは2値反応




          nonparametrique   74
                         方法
• データがN×k表になっているとする
• Gjをj列における成功数、Liをi行における
  成功数、Nを全標本数とする
• このとき
               k 2  k
                         
                          2
                             N    N
  は自由度k-1のχ 分布に近似的に従う L 2
                            
   Q  (k  1)k G   G   k L 
                     j                 j              i         i
          
             j 1            j 1         
                                                i 1       i 1




                         nonparametrique                               75
               例
• ある意見調査の、主婦の解答
 – 調査に応じてくれるか否か
 – 調査員の態度が影響するだろうか?
• 3種類の態度
 – 1:興味、親切、熱心
 – 2:礼儀、遠慮、丁寧
 – 3:無関心、無遠慮、無礼

           nonparametrique   76
            例つづき                            yes=1
                                            no=0
組    態度1 態度2 態度3              Li      Li2

1     0    0        0             0   0

2     1    1        0             2   4

中略   中略    中略    中略         中略        中略

18    1    1        1             3   9

計    13    13       3         29      63

      G1   G2     G3
                nonparametrique                     77
        例つづきつづき
• Qを計算する
 – 16.7
 – 自由度が3-1=2
 – このとき、p<0.001
• 面接員の態度によって主婦の態度も変わ
  るといえる


              nonparametrique   78
 5-2:Friedmanの分散分析
• k組の対応ある標本の、それらの間で有意
  差があるかを検定
• 順序尺度に適用
• 2元配置




        nonparametrique   79
               方法
• データがN×k表になっているとする
• Rjを第j列の順位の和、とする
• このとき
  は自由度k-1のχ2分布に近似的に従う
          12  k
    
    2
    r
         Nk (k  1)
                     (R )
                       j 1
                                 j
                                     2
                                          3 N (k  1)



               nonparametrique                           80
         検出力
• パラメトリックな分散分析とは優劣つけが
  たい(Friedman,1937)
• CochranのQ検定よりは良い
 – Nが小さすぎると使用されるべきではないのに
   対して、Friedmanのは小標本でも正確




         nonparametrique   81
                例
• だんだん適当に・・・
• こんな表があったとしますよ
                  要因
        Ⅰ       Ⅱ   Ⅲ         Ⅳ
   群A   9       4    1        7
   群B   6       5    2        8
   群C   9       1    2        5
            nonparametrique       82
           例つづき
• で、順序(群内で)に直す
• Rjを基に統計量を算出
 – 7.4                         要因
 – 数表をひく               Ⅰ     Ⅱ   Ⅲ    Ⅳ
 – 有意      群A           4    2    1    3
           群B           3    2    1    4
           群C           4    1    2    3
           Rj          11    5    4   10
           nonparametrique             83
       5-3:KendallのW
• W?
 – k組の変量間の連関の度合
• 相互試験間の信頼性の測定に有用




           nonparametrique   84
           考え方
• ある事象の順位が、群間で何か関連ある
  かを確かめるには?

 全ての対のrs(スピアマンの順位相関係
                 N
 数)の平均はどう?      6 ( xi  yi )
                              rs  1    i 1
                                          N3  N
  だめ!めんどい(kが大きくなると)
            nonparametrique                        85
       ここで・・・
• W、登場
• 計算がずっと簡単
• 全ての対で得られたrsに対して線形な関係
  がある
            kW  1
       rs 
             k 1

         nonparametrique   86
               方法
•   データがk×N表になっているとする
•   Rjを第j列の順位の和、とする
•   Rjの平均からの偏差の平方和をsとする
•   このとき        s
        W
              1 2 3
                k (N  N )
             12
• Wは0(関連なし)~1(完全な一致)になる
    – 分散の大きさの程度の函数
               nonparametrique   87
      有意性の検定
• N<7(小標本)のときは数表を引く
• それ以上(大標本)のときは
  が自由度N-1のχ2分布に近似的
             s
        
        2
  に従うことから検定する
         1
           kN( N  1)
        12


          nonparametrique   88
                例
• 3兄弟に6種類の食べ物を食べさせ、好き
  な順に順序付けさせた
                食い物
        寿司 蟹玉 蕎麦 麩            湯葉 心太
  長男     1  6   3  2            5 4
  次男     1  5   6  4            2 3
  三男     6  3   2  5            4 1
   Rj    8 14  11 11           11 8
            nonparametrique           89
                例つづき
• sを計算
                      R j   25 .5
                               2
              
         s   Rj 
              
                           
                     N   
• Wを計算
                     25.5
          W                           0.16
                 1
                   (3) 2 (63  6)
                12




                    nonparametrique            90
       例つづきつづき
• 有意性を検定
• 数表を引く
 – k=3、N=6のとき、有意であるためにはs≧103.9
   でなければならない
 – 非有意




            nonparametrique   91
         つけたし
• 今日紹介したものがノンパラの全てではあ
  りません
 – 連関の測度だけでもたくさんあります
• 今回は、タイ順位の処理法については割
  愛しました
• ノンパラメトリックな多重比較法もあります
 – SPSSではできません

           nonparametrique   92
             多重比較法
• ちょっとだけ紹介
• サンプルサイズ小→ノンパラ は誤り
  – 大標本近似に基づいているから、近似精度に
    問題がある
• Still-Dwassの方法
  – Tukeyの方法のノンパラメトリック版
• Stillの方法
  – Dunnettの方法のノンパラメトリック版
              nonparametrique   93
                       参考文献
•   SPSS Base 10.0J User’s Guide SPSS Inc.
•   SPSS Base 10.0 Applications Guide SPSS Inc.
•   E.L.Lehmann ノンパラメトリックス 森北出版 1981
•   J.Hajek ノンパラメトリック統計学 日科技連 1974
•   武藤眞介 統計解析ハンドブック 朝倉書店 1995
•   永田靖 統計的多重比較法の基礎 サイエンティスト社 1997
•   S.Siegel ノンパラメトリック統計学 マグロウヒル 1983
•   S.Siegel Nonparametric Statistics(2nd Ed.) McGraw Hill 1988
•   柳川尭 ノンパラメトリック統計学 培風館 1982


                           nonparametrique                        94
おしまい




nonparametrique   95

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:28
posted:3/25/2012
language:Japanese
pages:95