Embed
Email

Factor Analysis

Document Sample

Shared by: Lingjuan Ma
Categories
Tags
Stats
views:
38
posted:
1/30/2012
language:
pages:
44
Topic 14

對數線性模式

(general log-linear model)









報告者:王譔博

指導教授:陳正昌 老師

報告日期: 2009年6月15號

對數線性模式適用時機

在進行兩個都是質的變項之列聯表(contingency table)分析

時,一般會使用  考驗。但是,如果要處理三個以上質

2





的變項的分析, 2 考驗就不適用,而應改用一般對數線性

模式(general log-linear model)。



一般對數線性模式主要可以包含兩部分:

一是對數線性模式(log-linear model),不區分自變項及依變

項,而把所有變項都當成反應變項 (response variable)



一是邏輯對數線性模式 (logit log-linear model),有自變項

及依變項的分別,比較類似迴歸分析。

對數線性模式主要目的:

1. 提出研究模式,以再製出期望次數,而且須使期望次數與

實際觀察次數之間沒有顯著差異。

2. 希望以最精簡的模式達到第一點的目標。

3. 依變項一定要與其他變項有交互作用。



如何判別兩模式差異?

1. 了解幾個質的變項彼此的關聯,會使用一般對數線性模式

2. 了解幾個質的自變項,對一個質的依變項的效果,會使用

邏輯對數線性模式。

對數線性的三種方法

A



一般對數線性分析



B



Logit 對數線性分析



C



模式選擇對數線性分析



對數線性

一般對數線性分析

列聯表中,用「一般對數線性分析」會分析那些

落入每個交叉分類中的觀察值個數,表格中的每

個交叉分類會構成一個細格,而每個類別變數就

稱為一個因子。



依變數:是指交叉表列中細格的觀察值個數 (次數)



自變數:則是指因子和共變量





對數線性

一般對數線性分析

使用 Newton-Raphson 法來估計階層與非階層對數

線性的最大概似參數。可以分析各個儲存格是

Poisson 機率分配或多項式分配。



最多可以選擇 10 個因子來定義表格內的細格。



細格結構變數:可以為不完整表格定義結構性的

零、將偏置項包含入模式中、裝上對數比率模式,

或實施邊際表格的調整方法。



對數線性

一般對數線性分析

對比變數:則能計算概化對數 odds 比 (GLOR)。



SPSS 會顯示模式訊息和適合度統計量。也可以顯

示各種統計量和圖形,或將殘差和預測值儲存。









對數線性

二維列聯表-離差智商與學業成績

學業成績

及格 不及格 總計

(代碼為 1) (代碼為 2)

實際人數 211 443 654

低 (自然對數) (5.352) (6.094) (6.483)

(代碼為 1) 期望次數 392.1 261.9 654.0

(自然對數) (5.972) (5.568) (6.483)

離差智商

實際人數 614 108 722

高 (自然對數) (6.420) (4.682) (6.582)

(代碼為 2) 期望次數 432.9 289.1 722.0

(自然對數) (6.070) (5.667) (6.582)

實際人數 825 551 1376

(自然對數) (6.715) (6.312) (7.227)

總計

期望次數 825.0 551.0 1376.0

(自然對數) (6.715) (6.312) (7.227)

對數線性

三維列聯表-

社經地位、離差智商與學業成績

社經地位 離差智商 學業成績(C 因子)

(A 因子) (B 因子) 低(C1) 高(C2)

336 126

低(B1)

(5.817) (4.836)

低(A1)

71 255

高(B2)

(4.263) (5.541)

80 49

低(B1)

(4.382) (3.892)

中(A2)

16 165

高(B2)

(2.773) (5.106)

27 36

低(B1)

(3.296) (3.584)

高(A3)

21 194

高(B2)

(3.045) (5.268)

對數線性

四變項列聯表-

離差智商(C 因子)

低 高

父親教育 母親教育 學業成績(D 因子) 學業成績(D 因子)

(A 因子) (B 因子) 不及格 及格 不及格 及格

小學 149 36 23 66

小學 中學 40 13 10 37

大專 1 0 0 0

小學 69 38 21 78

中學 中學 148 84 38 204

大專 4 4 1 16

小學 4 3 0 2

大專 中學 17 16 5 91

大專 11 17 10 120

對數線性

操作步驟









對數線性

依變數、自變數、

操作步驟

格結構、比對變

數的輸入









各個細格裡

的分配



殘差、預測值

的儲存以及圖

表的選擇

對數線性

儲存及選項

在選項裡,勾選

想要輸出的圖表









在儲存裡,勾選

想要儲存的項目









對數線性

Logit 對數線性分析

用來分析依變數 與自變數 之間的關係。



依變數通常是類別的,而自變數可能是類別的 (因

子)。至於其他自變數、格共變量,則可以是連續

的。



在SPSS 會自動假設它是多項式分配,這些模式有

時候就稱為多項式 logit 模式。其使用方法,是以

Newton-Raphson 法來估計 logit 對數線性的參數。



對數線性

Logit 對數線性分析

細格結構變數:可以替不完整的表格定義結構性

的零、在模式中包括偏置項、適合對數比模式,

或實施邊際表格的調整方法。



對比變數:則能計算概化對數比 (GLOR)。其值是

期望細格數的對數線性組合的係數。



SPSS 會顯示模式資訊和適合度統計量,也可以顯

示各種統計量和圖形,或將殘差和預測值儲存。



對數線性

二維列聯表-邏輯對數線性模式



學業成績

及格 不及格 總計

(代碼為 1) (代碼為 2)

低 人數 211 443 654

(代碼為 1) (自然對數) (5.352) (6.094) (6.483)

離差智商

高 人數 614 108 722

(代碼為 2) (自然對數) (6.420) (4.682) (6.582)

人數 825 551 1376

總計

(自然對數) (6.715) (6.312) (7.227)









對數線性

三維列聯表-

社經地位、離差智商與學業成績

社經地位 離差智商 學業成績(C 因子)

(A 因子) (B 因子) 低(C1) 高(C2)

336 126

低(B1)

(338.20) (123.80)

低(A1)

71 255

高(B2)

(68.80) (257.20)

80 49

低(B1)

(74.58) (54.42)

中(A2)

16 165

高(B2)

(21.42) (159.58)

27 36

低(B1)

(30.21) (32.79)

高(A3)

21 194

高(B2)

(17.79) (197.21)

對數線性

四維列聯表-邏輯對數線性模式

子女成績

父親教育 父親職業 子女智商 (D 變項)

(A 變項) (B 變項) (C 變項) 高 低

高 150 13



低 24 18



高 63 2



低 12 14

高 74 13



低 18 33



高 327 80



低 157 378



對數線性

操作步驟









對數線性

依變數、自變數、格

操作步驟

共變量、格結構、比

對變數的輸入









殘差、預測值

的儲存以及圖

表的選擇

對數線性

儲存及選項

在選項裡,勾選

想要輸出的圖表









在儲存裡,勾選

想要儲存的項目









對數線性

模式選擇對數線性分析

用來分析多方面的列聯表,使用疊代比例適配演

算法,以使階層式對數線性模式配適多維交叉表。

可以發現哪些類別變數之間是有關連的。



建立模式時,可用的方法有強制選入和向後消去

法。



在飽和模式,可以設定參數估計值及淨關連檢定。

飽和模式會將所有細格加上 0.5。



對數線性

操作步驟









對數線性

操作步驟依變數的輸入









每個細格的加

權數







模型使用的方



殘差的顯示、模式條件的設

定以及圖表的選擇



對數線性

選項

勾選要的圖例如殘

差圖、常態機率圖



顯示殘差、

次數分配表









設定模式條件





對數線性

實例分析







以佛羅里達州汽車事故為例









對數線性

資料內容









對數線性

分析方法

A

一般對數線性分析

模型: log(mij )     i   j   ij





B

Logit 對數線性分析

mij

模型: log( )    i

mik



對數線性

一般對數線性分析-操作步驟









對數線性

操作步驟:模式









對數線性

操作步驟:選項









對數線性

輸出結果

參數估計值

95% 信賴區間上

參數 估計 標準 誤差 Z p-value 95% 信賴區間下界



常數 12.92967 0.001557 8302.909 0 12.92662 12.93272

[安全帶 = 1] -3.23336 0.007996 -404.375 0 -3.24903 -3.21769

[安全帶 = 2] 0 . . . . .

[損傷程度 = 1] -6.69428 0.044222 -151.38 0 -6.78095 -6.6076

[損傷程度 = 2] 0 . . . . .

[安全帶 = 1] * [損傷程度 = 1] 4.376664 0.051395 85.15673 0 4.275931 4.477397



[安全帶 = 1] * [損傷程度 = 2] 0 . . . . .



[安全帶 = 2] * [損傷程度 = 1] 0 . . . . .



[安全帶 = 2] * [損傷程度 = 2] 0 . . . . .









模型: 常數 + 安全帶 + 損傷程度 + 安全帶 * 損傷程度







對數線性

輸出結果

[安全帶 = 1]

[損傷程度

設計矩陣 常數 [安全帶 = 1] * [損傷程度

= 1]

= 1]



安全帶 未使用 損傷程度 致命傷 1 1 1 1

輕傷 1 1 0 0

有使用 損傷程度 致命傷 1 0 1 0

輕傷 1 0 0 0



損傷程 觀察個 期望個 標準化殘

安全帶 % % 殘差 調整殘差 離差

度 數 數 差

未使用 致命傷 1601.5 0.3718 1601.5 0.3718 0.0000 0.0000 0.0000 0.0000

輕傷 16257.5 3.7743 16257.5 3.7743 0.0000 0.0000 0.0000 0.0000

有使用 致命傷 510.5 0.1185 510.5022 0.1185 -0.0022 -0.0001 -0.0018 -0.0001

輕傷 412368.5 95.7353 412368.5 95.7353 0.0000 0.0000 0.0000 0.0000





對數線性

輸出結果

適合度檢定

數值 df Sig

概似比 0 0 .



Pearson 卡方 0 0 .





參數估計值的相關

[安全帶 = 1] *

常數 [安全帶 = 1] [損傷程度 = 1]

[損傷程度 = 1]

常數 1 -0.19475 -0.03521 0.030299

[安全帶 = 1] -0.194755 1 0.006858 -0.15558

[損傷程度 = 1] -0.035214 0.006858 1 -0.86042

[安全帶 = 1] *

0.0302993 -0.15558 -0.86042 1

[損傷程度 = 1]





對數線性

結果說明-設計矩陣



log(m11 )    1  1   11 1111

log(m )     

 12 1 1100

 

log(m21 )    1 1010

log(m22 )   

1000





解此方程組可得:

   log( m22 )  m

  1  log( 21 ) m11

m12 未使用安全帶時受傷之比

 m12



m22 p.s:

. 

1  log( m ) 有使用安全帶時受傷之比

m21



 22  m11 m22



  log( m12

)

 11

m21  odds比



 m22

對數線性

結果說明

由參數估計區間可以得知:



未使用安全帶時受傷之odds比,相較於使用

安全帶來說,是介於71.95到88.01之間。



也就是說,遇到交通事故時,未使用安全

帶比使用安全帶約有71.95到88.01倍的危險。





對數線性

Logit 對數線性分析-操作步驟









對數線性

操作步驟:選項









對數線性

輸出結果

參數估計值

95% 信賴區間下 95% 信賴區間上

參數 估計 標準 誤差 Z Sig

界 界

常數[安全帶 = 1] 9.69631

常數[安全帶 = 2] 12.92967



[損傷程度 = 1] -6.69428 0.044276 -151.194 0 -6.78106 -6.6075



[損傷程度 = 2] 0 . . . . .



[損傷程度 = 1] *

4.376668 0.051442 85.07917 0 4.275843 4.477493

[安全帶 = 1]

[損傷程度 = 1] *

0 . . . . .

[安全帶 = 2]

[損傷程度 = 2] *

0 . . . . .

[安全帶 = 1]

[損傷程度 = 2] *

0 . . . . .

[安全帶 = 2]







模型: 常數 + 損傷程度 + 損傷程度 * 安全帶

對數線性

輸出結果

離散分析

Entropy 集中 df

模式 4020.328 267.7792 1

殘差 9317.816 3935.51 430736

總計 13338.14 4203.289 430737





4020.328

相關測量

0.301416 

Entropy 0.301416 13338.14

集中 0.063707 267.7792

0.063707 

4203.289

此值越接近1,模型的配

適可以認為越好。 對數線性

結果說明

log(m11 )  1  1   11  m11

log(m )      

 log( m )    1

12 1 2 12  12

 

log(m21 )   2  1   21 log( m21 )     2

log(m22 )   2   2   22

 

 m22





  1   2



1   11   12

     1   2  odds比

 2 21 22









對數線性

結果說明



1   11   12  4.376668  0  4.376668



 2   21   22  0  0  0





odds=e 4.376668

 79.57





對數線性

結果說明

由上式計算可以得知:



未使用安全帶時受傷之對數odds比,相較於使用

安全帶來說,是4.376668倍。



也就是說,遇到交通事故時,未使用安全帶比使

用安全帶約有79.57倍的危險。







對數線性

Thanks !

參考文獻:陳正昌、謝邦昌 教授,多變量分析-對數線性模式



Related docs
Other docs by Lingjuan Ma
First data from TOTEM experiment at LHC
Views: 0  |  Downloads: 0
Federal Data Collection _FDC_ for LEP
Views: 0  |  Downloads: 0
Ethical Consumption
Views: 0  |  Downloads: 0
Cost-Based Plan Selection
Views: 0  |  Downloads: 0
Cost terms
Views: 0  |  Downloads: 0
By registering with docstoc.com you agree to our
privacy policy

You are almost ready to download!

You are almost ready to download!