Embed
Email

? 17 ? ????

Document Sample
? 17 ? ????
Shared by: HC111122235629
Categories
Tags
Stats
views:
4
posted:
11/22/2011
language:
Chinese
pages:
21
第17章 集群分析



本章的學習主題 

1. 集群分析的概念



2. 相似性及最近距離的衡量



3. 階層分析法



4. 非階層分析法





企業研究方法 第 17 章 1

17.1 集群分析概念

集群分析 (cluster analysis) 是一種將樣本觀察值

進行分析,若具有某些共同特性者予以整合在一

起,然後分配到特定的群體,最後形成許多不同

集合集群的一種分析方法。



集群分析與因素分析的概念大致相同,但前者係

將不同的觀察值依相對距離的遠近加以分類成不

同集群,然後對不同集群所具有的特性程度加以

命名;而後者乃係將不同的變數依照相關程度加

以萃取成少數的因素,然後對依各因素中所含變

數來加以命名。

企業研究方法 第 17 章 2

表 17-1 商店業績統計表

商店

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

編號



銷售

1153 1135 1155 1151 1146 1147 1141 1135 1139 1148 1145 1150 1139 1134 1140

數量



顧客

216 199 222 218 213 214 211 202 205 215 211 223 207 199 210

人次









商店業績分佈



230

顧 220



人 210

次 200

190

1130 1135 1140 1145 1150 1155 1160

銷售數量







圖 17-1 商店業績分群示意圖

企業研究方法 第 17 章 3

17.2 界定研究問題

• 探索性

界定研究問題 • 驗證性



• 變數的共線性

• 極端值的剔除

變數及資料篩選 • 資料的標準化



• 衡量距離

相似性衡量 歐式距離

馬式距離

街道距離

混合式距離





選則集群方法 集群方法 集群數目之決定

及 • 層次集群方法 • 觀察值集合順序表

決定集群數目 • 非層次集群方法 • 垂直冰柱圖

• 樹狀圖





解釋及驗證集群 • 層次集群與非層次集群之比較

• 區別分析



圖 17-2 集群分析步驟



企業研究方法 第 17 章 4

17.3 變數與資料的篩選



集群分析在變數與資料的篩選上頇考量:



1.變數的共線性



2.極端值的剔除



3.資料的標準化









企業研究方法 第 17 章 5

17.4 相似性衡量



Objec t 2

xi , yi 



yi  y j

Objec t 1



x , y 

j j xi  x j

圖 17—3 集群分析歐氏距離計算方法





歐氏距離之公式為: d 

ij x i  x j   yi  y j 

2 2







企業研究方法 第 17 章 6

表 17 – 2 歐氏距離計算表





觀察值 1 2 3 4 5 6 7 8 9 10



1



2 10.336



3 12.571 8.411



4 14.611 6.574 27.849



5 10.336 2.334 18.096 1.277



6 23.691 5.451 24.526 5.572 4.121



7 9.397 1.305 10.068 5.500 2.747 7.482



8 6.508 18.278 12.649 29.634 22.246 41.486 18.518



9 0.922 10.181 8.323 18.787 12.624 26.661 10.042 3.231



10 7.652 20.383 8.172 36.549 27.479 45.080 19.535 2.869 3.765









企業研究方法 第 17 章 7

17.5 選擇集群方法及決定集群數目

集群分析的方法,可分為兩大類,五種方法:

1.層次集群方法(hierarchical methods)

(1)單一連鎖法(single linkage)

(2)完全連鎖法(complete linkage)

(3)中心法(centroid method)

(4)華德法(Ward’s methods)

2.非層次集群方法(non-hierarchical methods)

(1)K平均數法(k-means methods)



企業研究方法 第 17 章 8

1.單一連結法

又稱為最近法(nearest neighbor)。最近法對A、B

兩群距離的定義是以A群內每一點到B群內每一點

的距離之最小值,作為A、B兩群的距離。而最近

法的概念表示如下:





A 群 B 群









d(uv)w= min(d uw,d vw)





圖 17-4 單一連結法



企業研究方法 第 17 章 9

2. 完全連結法

又稱為最遠法(farthest neighbor)。最遠距離

法的計算是以A群內每一點到B群內每一點的距離

中之最大值,作為A、B兩群的距離。而最遠法的

概念可表示如下:





A 群 B 群









d(uv)w=m ax(d uw,d vw)





圖 17-5 完全連結法



企業研究方法 第 17 章 10

3.中心法

中心法也稱平均連結法,是以計算A群的中心點到

B群中心點的距離,作為A、B兩群的距離。中心法

的概念可表示如下:





A 群 B 群









d ( uv ) w 

 d ik



n(uv ) n w







圖 17-6 中心法







企業研究方法 第 17 章 11

4.華德法

又稱最小變異數法(minimum variance method)。華德法的分群方式是

先將每一個個體視為一個集群,然後將各集群依序合併,合併之順序

完全視合併後集群之組內總變異數之大小而定。



表 17 -3 華德法逐次集結係數表

群集 階 組合集群 先出現的階段集群

係數 係數變化 (%) 下一階段

數 段 集群1 集群2 集群1 集群2

10 236 4 5 234.767 -- 231 224 241

9 237 3 10 250.853 6.85 213 220 239

8 238 1 15 268.661 7.10 233 232 243

7 239 3 8 293.976 9.42 237 230 244

6 240 7 17 320.966 9.18 234 227 243

5 241 4 6 349.060 8.75 236 221 242

4 242 2 4 407.912 16.86 235 241 245

3 243 1 7 476.270 16.76 238 240 244

2 244 1 3 649.612 36.4 243 239 245

1 245 1 2 1044.295 60.76 244 242 0



企業研究方法 第 17 章 12

非層次集群方法:

非層次集群方法是在各階段分群過程中,

將原有的集群予以打散,並重新形成新的

集群。其主要的運用方法是:K平均數法(k-

means methods)。







企業研究方法 第 17 章 13

表 17-4 非階層 ( k-means ) 集群之各組成員分析表 (1/2)



觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群



1 1 4 2 157 2 2 3 124 3 239 3

3 1 5 2 158 2 7 3 125 3 242 3

8 1 6 2 159 2 11 3 126 3 243 3

9 1 13 2 160 2 12 3 128 3 247 3

10 1 21 2 161 2 15 3 129 3 248 3

14 1 22 2 163 2 16 3 130 3 250 3

19 1 24 2 164 2 17 3 132 3 3

41 1 25 2 165 2 18 3 136 3 3

45 1 26 2 171 2 20 3 138 3 3

47 1 29 2 173 2 23 3 140 3 3

48 1 34 2 174 2 27 3 142 3 3

51 1 35 2 175 2 28 3 143 3 3

52 1 36 2 178 2 30 3 144 3 3

53 1 40 2 182 2 31 3 145 3 3



企業研究方法 第 17 章 14

表 17-5 非階層 ( k-means ) 集群之各組成員分析表 (2/2)

觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群 觀察值 集群

57 1 42 2 183 2 32 3 149 3

62 1 44 2 184 2 33 3 152 3

63 1 46 2 185 2 37 3 153 3

66 1 49 2 189 2 38 3 154 3

67 1 56 2 190 2 39 3 155 3

82 1 58 2 191 2 43 3 162 3

85 1 59 2 192 2 50 3 166 3

87 1 61 2 193 2 54 3 167 3

92 1 71 2 195 2 55 3 168 3

97 1 76 2 196 2 60 3 170 3

99 1 78 2 197 2 64 3 176 3

100 1 83 2 198 2 65 3 177 3

103 1 86 2 207 2 68 3 179 3

105 1 93 2 211 2 69 3 180 3

106 1 95 2 212 2 70 3 181 3

109 1 96 2 213 2 72 3 188 3

115 1 98 2 215 2 73 3 194 3

139 1 104 2 219 2 74 3 199 3

150 1 107 2 221 2 75 3 201 3

156 1 111 2 226 2 77 3 202 3

169 1 112 2 229 2 79 3 208 3

172 1 113 2 235 2 80 3 209 3

186 1 116 2 236 2 81 3 214 3

203 1 119 2 237 2 84 3 216 3

204 1 120 2 240 2 88 3 217 3

205 1 121 2 241 2 89 3 218 3

206 1 123 2 244 2 90 3 220 3

210 1 127 2 249 2 91 3 223 3

222 1 131 2 251 2 94 3 225 3

246 1 133 2 101 3 227 3

134 2 102 3 228 3

135 2 108 3 230 3

137 2 110 3 231 3

141 2 114 3 232 3

147 2 117 3 233 3

148 2 118 3 234 3

151 2 122 3 238 3

企業研究方法 第 17 章 15

集群數目的決定

在進行集群時,一個很重要的問題是要決定分為多少群才

有意義,以下幾項準則可以用來作為參考:





1.集群之群數以在2~6群為宜,超過 6 群則其後續分析將

變得相當瑣碎,因此除非另有特殊的考量,集群之群數

以不超過 6 群為宜。

2.集群完成後,各群之觀察值應儘量接近,即各群之觀察

值不要相差太遠。







企業研究方法 第 17 章 16

3. 當集群數減少,集群內的同質性便會降低。研究者應權

衡集群數與同質性兩者,儘可能找到較少的集群,但仍

滿足同質性的必要水準。

4. 集群係數之增量太大則放棄集結,如表17─3所示,如

利用華德法進行分群,集結力太大,則代表分群之事實

相當明顯,應即停止集結。

5. 集群時,各集群變數在各群之分數應具有顯著性,即集

群變數應具有區分之效度,否則,該集群變數是否存在

對於分群即沒有顯著的作用。

6. 集群之後,實際分群與理論分群之比較結果,其命中率

應達顯著之水準。





企業研究方法 第 17 章 17

17.6 集群之解釋與命名

由表17-6可知,分群結果第三群在三種不同的智慧資本之集群變數中

所得之分數偏低,故命名為低智慧資本群,第二群在三個集群變數中,

所得之分數偏高,故命名為高智慧資本群,第一群在三個集群變數中

表現比較中等,故命名為中智慧資本群。



表 17-6 分群平均值差異檢定

集群1 集群2 集群3

構面與因素名稱 F值 P值 Duncan

n = 108 n = 94 n = 44



人力資本 4.9983 5.9061 3.9524 243.271 0.000** (31,2)



顧客資本 4.6058 5.7086 3.4139 143.709 0.000** (3,1,2)



結構資本之交易成本導向 4.1279 5.0905 3.0648 110.114 0.000** (3,1,2)



結構資本之創新運作導向 4.4961 5.4905 2.9352 241.575 0.000** (3,1,2)



***:P<0.001;**:P<0.01



企業研究方法 第 17 章 18

表 17-7 分群在其他構面之平均值差異檢定





集群 1 集群 2 集群 3

構面與因素名稱 F 檢定 顯著性 Duncan

n=108 n = 94 n = 44

外部化 3.8837 4.9286 3.1019 43.942 0.000*** (3, 12 )



知識創造 連結 4.6550 5.5238 4.0556 28.877 0.000*** ( 3, 1, 2 )

過程 社會化 4.9709 5.2571 3.7197 26.590 0.033** (3, 12 )

內部化 5.1860 5.6607 4.2708 22.936 0.000*** (3, 1, 2 )



結構化 集權化 6.3101 7.4952 4.4444 18.727 0.000*** (31, 2 )

程度 正式化 4.5930 4.1000 5.2500 2.497 0.085 (21, 3 )

信任關係 5.1333 4.7054 4.1667 11.467 0.000*** (321 )

社會資本 互惠關係 4.7519 5.2333 3.8241 26.109 0.000*** (312 )

互動績效 4.8837 5.5381 4.6481 14.537 0.000*** (31, 2 )

知識管理之績效 4.9286 5.7184 3.8175 75.141 0.000*** (3, 12 )









企業研究方法 第 17 章 19

17.7 集群分析方法實際流程



為使集群之作業更為周延,通常我們以二階段法來進行集群

分析法。所謂二階段法係結合階層分群法與非階層分群法二

種方式,第一階段先以華德法做分群,決定群組個數,第二

階段再以K組平均法進行集群分類。



使用二階段法的目的在於利用第一階段華德法以層次集群分

析法進行分群,我們利用分群之準則決定群數以後,再利用

第二階段以K組平均法,屬於非層次分群法予以分群。





企業研究方法 第 17 章 20

資料標準化 排除樣本資料因為衡量尺度的不同,

所可能造成的影響



第一次階層分群 進行第一次階層分群的目的在於

( 華德法 ) 判斷分群數





非階層分析法 進行非階層分析法,探討分群變數

( K 組平均數法 ) 之分群效度









圖 17-8 集群分析法實際流程









企業研究方法 第 17 章 21


Other docs by HC111122235629
AFE IIt Project Status
Views: 0  |  Downloads: 0
graham2
Views: 9  |  Downloads: 0
Indonesia2001
Views: 2  |  Downloads: 0
Calculator Notes
Views: 0  |  Downloads: 0
THE GEOSPHERE AND GEOCHEMISTRY
Views: 6  |  Downloads: 0
PENGOLAHAN PUSTAKA
Views: 30  |  Downloads: 0
Slide 1
Views: 0  |  Downloads: 0
2624 FRONT Males and Females
Views: 1  |  Downloads: 0
By registering with docstoc.com you agree to our
privacy policy

You are almost ready to download!

You are almost ready to download!