Docstoc

集群與判別分析Clustering and discriminate analysis

Document Sample
集群與判別分析Clustering and discriminate analysis Powered By Docstoc
					        集群與判別分析
Clustering and discriminate analysis



       主持人:謝邦昌 教授
          演講主持人
謝邦昌 教授
  學歷
    國立臺灣大學農藝所 生物統計組博士

  主要經歷
    現任:輔仁大學統計資訊學系暨應用統計所 教授
        中華資料採礦協會 理事長
        中國統計學社 理事
    曾任:輔仁大學進修成長學院院長
        輔仁大學總務長
        中華資料採礦協會秘書長
        南開大學資訊科學與概率統計顧問
        輔仁大學統計系系主任
                        集群與判別分析方法
                 主要內容

   系統集群          集群分析的正確應   距離、相似係數和
 (Hierarchical
                     用        相似衡量
  clustering)



距離判別、Fisher      判別分析的正確應
                              SPSS操作
判別&逐步判別              用



                            集群與判別分析方法
  系統集群的基本思想
相近的聚為一類(以距離表示,樣
品集群)




相似的聚為一類(以相似係數表示,
變數集群)


                   集群與判別分析方法
     系統集群的基本步驟

構造n個類,每個    計算n個樣品兩兩
                         合併距離最近的兩
類包含且只包含一    間的距離,構成距
                          類為一新類。
個樣品         離矩陣,記作D0。




                         計算新類與當前各
決定類的個數,及                 類的距離。若類的
各類包含的樣品數,    畫集群圖。       個數等於1,轉到
並對類作出解釋。                 步驟(5),否則回
                         到步驟(3)。


                        集群與判別分析方法
集群分析要注意的問題
           用什麼統計
 用什麼指標
           量(距離、相
 (變數)表達
           似係數)描述
 要分析的樣
           樣本間的相
 品?
           似程度?


 用什麼方法
           分成幾類比
 (類間距離等)
           較合適?
 進行集群?


                    集群與判別分析方法
             集群分析原理
 集群分析         • 將資料檔中的觀測值或變數加以歸類在各
                個集群內,也就是把沒有分群的個體按相
 (Cluster       似程度歸於同一群
 Analysis)    • 集群分析可以作資料簡化

              • 分層法(Hierarchical)與非分層法(Non-
集群分析分群方         hierarchical)
法有兩大形式        • 結合兩種方法的集群分析則稱為兩階段法
                (Two Step)

              • 分層法以個體間某項量測的距離或相似性將個體
集群分析兩大形         連結,但是事前並不知道分群的個數,通常可表
                示成樹型圖。
式概述           • 非分層法則是於事前依據其他研究或主觀認定,
                其中以K平均值法(K-Means)為代表。

                               集群與判別分析方法
      集群分析的基本概念
 集群分析使在同一集群內的事物具有高度的同質性
 (homogeneity),而不同集群的事物具有高度的異質性
 (heterogeneity)。
 亦即將樣本分成幾群互相沒有交集的群組。
 因素分析是將同質性高的變數(variables)集成一群;而
 集群分析則是將變數相似性高的觀察值(cases)集成一群。
 集群分析的大部分應用都屬於探索性研究,最終結果是產
 生研究對象的分群。

                        集群與判別分析方法
   集群分析的主要步驟(1/2)
集群分析至    •   STEP1:根據研究的目的選擇合適的分群變數
少都應該包    •   STEP2:計算相似性衡量
括以下四個    •   STEP3:選定集群方法進行集群
         •   STEP4:對結果進行解釋和驗證
步驟


         •   1. 和集群分析的目標密切相關
分群變數應該   •   2. 反映了要分群對象的特徵
具有以下特點   •   3. 在不同研究對象上的數值具有明顯差異
         •   4. 變數之間不應該有高度相關


                            集群與判別分析方法
  集群分析的主要步驟(2/2)
 選擇分群變數時要注意克服「加入盡可能多的變數」這種錯
誤觀念。
 此外所選擇的變數之間不應該高度相關。
 選定了分群變數,下一步就是計算研究對象間的相似性。相
似性反映了研究對象間的親疏程度。
 計算出相似性矩陣之後,下一步就是要對研究對象進行分群。
這時主要涉及到兩個問題:一是選定集群方法;二是確定形
成的分群數。
 得到集群結果後,最後一步還應對結果進行驗證和解釋。
                       集群與判別分析方法
    集群方法:層次集群法
• 層次集群法又可分為兩種層次集群法:凝聚法
  (Agglomerative Method,或稱聚集法)和分離法
  (Divisive Method,或稱分解法)。
• 凝聚法首先是把每個觀察值各自看成一群,先把距離最近的
  兩群合併。直到合併成一大群為止。
• 分解法和聚集法的過程相反,每一步增加一群,直到每個觀
  察值都自成一群為止。
• 目前SPSS採用凝聚法,故層次聚集法是集群分析中應用最廣
  泛的集群方法。
• 層次集群法的集群過程可以用一個樹狀圖(Dendogram)表示出
  來。

                         集群與判別分析方法
系統集群(Hierarchical clustering)
1.最短距離法(single linkage)
2.最長距離法(complete linkage)
3.中間距離法(median method)
4.可變距離法(flexible median)
5.重心法(centroid)
6.類平均法(average)
7.可變類平均法(flexible average)
8.Ward最小變異數法(Ward’s minimum variance)
                                集群與判別分析方法
8種系統集群法所得集群圖




         集群與判別分析方法
 最短距離法與最長距離法
最短距離法(Nearest Neighbor)或稱單一連結法
(Single Linkage)

最短距離法主要的缺點為「鏈接聚合」缺陷,容
易形成一個比較大的組。

大部分的觀察值皆被聚集在同一組,故最短距離
法在研究上很少被使用。

最遠距離法(Furthest Neighbor)或稱完全連結法
(Complete Linkage):和最短距離法相反。

                         集群與判別分析方法
最短距離法與最長距離法比較之示意圖




            集群與判別分析方法
身高&體重的最短距離法集群所得樹狀圖




             集群與判別分析方法
身高&體重的最遠距離法集群所得樹狀圖




             集群與判別分析方法
 重心法(Centroid Clustering)&
 中位數法(Median Clustering)
每一群的重心是該群中所有觀察值在各個變數上的均
值所代表的點

每合併一次群,都需要重新計算新群的重心                             2
            D pq  D( x p , x q )  x p  x q


與重心法相似的方法為中位數法


中位數法把兩群之間的距離定義為兩群中位數之間的
距離

                                集群與判別分析方法
     重心間距離(centroid)

     S1                     S4
           S2
S3                               S5




          重心間距離(centroid)



                            集群與判別分析方法
身高&體重的重心法集群所得樹狀圖




            集群與判別分析方法
  平均連結法(Average Linkage)
     A
把兩群間的距離定義為兩群中所有觀察值之間距
離的平均值,不再依賴於特殊點之間的距離。


     B
平均連結法為集群效果較好、應用較廣泛的一種
集群方法。  D 
         pq  d
               n
              i p jq
                         ij



                              集群與判別分析方法
          平均距離(average)

     S1                    S4
           S2
S3                              S5




           平均距離(average)



                           集群與判別分析方法
    最小變異數和法(Ward)
    基本思想是同一群內觀察值的變異數和應該較
1   小,不同群之間觀察值的變異數和應該較大




2   要求觀察值之間的距離必須採用歐氏距離



    最小變異數和法和平均連結法一樣,是分群效果較
3   好,在社會科學領域應用較廣泛的集群方法
                              2                    2
       D pq  n p  x p  x        nq  x p  x
                                        集群與判別分析方法
各方法之塊頭集群結果




        集群與判別分析方法
   集群方法:非層次集群法
• 層次集群法在集群過程中需要儲存距離矩陣,並且在每
  一步的併群過程中都需要作很多計算
• 非層次集群法克服了層次集群法的這兩個缺點,適用於
  大樣本的集群分析,分為以下四步驟:
 1. 指定要形成的集群數
 2. 調整分群:計算每個觀察值到各群重心的距離,把每個觀察值
    歸入距重心最近的那一群
 3. 重新計算每一群的重心
 4. 重複步驟(2)~(3),直到沒有觀察值可以再調整為止
• 不同的初始分群用於同一資料往往也會得出不同的結果。
• 通常將每一群的重心作為初始集群中心

                       集群與判別分析方法
           分群數的確定
    根據樹狀結構圖來分群的準則如下:
    準則1:任何群都必須在鄰近各群中是突出的,即各群的重心間距離
        必須很大
    準則2:各群所包含的觀察值數都不要過多,以便各群內的相似性提高
1   準則3:分群的數目應該符合使用的目的
    準則4:若採用數種不同的集群方法,則在各自的集群圖上應發現
        相同的群


    集群分析時最好不要有某個群的觀察值很多,或某個群的觀察值
2   特別少的現象。


    集群數最好在二至四群間,因為當超過五群時,就很難對每個集群加
3   以解釋其特徵與命名了。


                         集群與判別分析方法
         集群方法的選擇
• 以下四個因素會大大影響集群方法的使用效果:
 1. 群的結構(主要指群的形狀、規模和個數)
 2. 偏離值(Outliers,或稱異常點)的存在
 3. 群與群之間重疊的程度
 4. 相似衡量的選擇
• 為了減輕偏離值的影響,研究者可能要反覆進行幾次的
  集群分析。
• 與層次集群法相比,非層次集群法受偏離值、相似衡量
  和不合適的分群變數的影響較小;其缺點是集群結果對
  初始分群非常敏感。

                             集群與判別分析方法
                      相似衡量(Measure)
• 很多種相似的衡量方法,都從不同的角度衡量了研究對象的
  相似性,其主要分為以下二類:1.距離衡量;2.關聯衡量
• 距離衡量-計量資料:
 1. 歐基里得直線距離                                                5. 柴比雪夫(Chebychev)距離
    (Euclidean distance)                                           Distance(X Y)  MAX i Xi  Yi
                                                                             ,

         Distance(X, Y)              X           Yi    6. 區塊(block)距離:
                                                        2
                                               i
                                       i


 2. 歐基里得直線距離平方                                                      Distance(X , Y)   X i  Yi
                                                                                      i

   (Squared Euclidean distance)                             7. 明可夫斯基(Minkowski)距離
                                                                                                   1
        Distance(X, Y)   X i  Yi                                                          p p
                                      2

                                 i                                  Distance(X Y)    X i  Yi 
                                                                              ,
                                                                                     i           
                                                            8. 自訂式(Customized)距離
 3. 餘弦(Cosine):
                                     X i Yi                                                       1
         Similarity( x, y )                                                                   p r
                                     X i2 Yi 2                    Distance(X Y)    X i  Yi 
                                                                              ,
                                                                                     i           
 4. Pearson相關:
                                 ( Z Xi Z Yi )
         Similarity( X , Y ) 
                                    N 1

                                                                                集群與判別分析方法
          兩階段集群法
1   現在的趨勢是把兩種方法結合起來使用,取長補短


    首先使用層次集群法確定分群數,檢查是否有偏離值,去除偏離
2   值後,對剩下的觀察值重新進行分群,用層次集群法得到的各個
    類的重心,作為非層次集群法的初始分群中心

    除了層次集群法與分層次集群法外,兩階段法也相當常見,結合
    分層法與非分層法二種方式
      第一階段:以華得法或其他分層法作分群,決定集群個數k
3     第二階段:再以K-平均值法進行集群,移動各群組內的個
       體,但要保持全部集群仍有個k個,在SPSS也發展出結合層
       次集群法與分層次集群法優點的兩階段集群法


                          集群與判別分析方法
     集群結果的解釋和驗證
    對集群結果進行解釋是希望對各個集群的特徵(有顯著集群效果的
1   分群變數)進行準確的描述,給每群取一個合適的名稱



    計算各個群在各分群變數上的平均值,對平均值進行比較分析(若
2   是二群進行T檢定分析,若是三群以上進行One-Way ANOVA分析)



    當集群命名後,後續的分析中將以新的集群名稱來代表原始分群變
3   數,故集群命名與因素命名同等重要;也與因素分析一樣,集群的
    命名相當不易,特別是當有太多分群變數時,分群變數也不宜太多

    若命名不恰當所造成的問題,正如同因素分析命名一樣,將造成讀
4   者閱讀的不易與誤解


                            集群與判別分析方法
塊頭集群結果與分群變數之F檢定
      分析表



       A
結果顯示這三群間的身高與體重皆達顯著差異,且可發現集群一的身
高與體重最小、集群二次之、集群三最大

       B
可根據分群變數身高與體重將集群一命名為「小塊頭」、集群二命名
為「中塊頭」、集群三命名為「大塊頭」


                       集群與判別分析方法
塊頭集群結果與性別及居住地之
   卡方檢定分析表




          集群與判別分析方法
      集群結果的後續分析

1 通常集群分析只是研究的起點而不是終點




2 本範例將學生分成三群後,就可檢定塊頭群與其它變數的關係



  由表的卡方檢定可知,塊頭與性別有顯著關聯,小塊頭皆為女性,大
3 塊頭皆為男性,中塊頭則男女各半




4 塊頭與居住地為北部、中部或南部則沒有顯著關聯



                           集群與判別分析方法
     SPSS的Cluster分析程序
    分層法:限用於小型的資料檔,可分析區間(連續)、個數或二元
1   變數。它能夠集群觀察值或變數;能夠計算某個範圍的可能解,
    並儲存每個集群的組員

    K平均值法:限用於連續資料,並且需要事先指定集群數,可以
    分析大型的資料檔。能夠讀取各集群初始的中心,並將最後的集
2   群中心儲存成外部 SPSS 檔。在SPSS之前的版本稱為快速集群
    (Quick Cluster)


3   兩階段法:可自動選取最佳的集群數




                           集群與判別分析方法
       距離判別
   A                B
           判別準則(discriminate
           criterion)可寫成:
               X G1:
               如果D(X,G1)<D(X,G2)
按就近原則歸類!
               X G2:
               如果D(X,G1)>D(X,G2)
               X待判:
               如果D(X,G1)=D(X,G2)



                    集群與判別分析方法
           Fisher判別逐步判別(stepwise
               discriminant analysis)
              A                     B
基本思想
1.投影
2.即把K類的m維資料投影(變換)到某一
  個方向,使得變換後的資料,同類別
  的點“盡可能聚在一起”,不同類別
  的點“盡可能分離”,以此達到分類                        從很多變數中篩選出重要作用的變
  的目的。                                    數來建立判別函數,使所得函數的
3.投影(變換)                                  判別效果“最優”
 y1  l11 x1  l12 x 2    l1 m x m

 
 y  l x  l x   l
 L      L1  1    L2    2        Lm x m



   將原來m個變數綜合成L個新變數



                                                集群與判別分析方法
兩類Fisher判別示意圖

Y
    G1




         G2   L=b1X+b2Y




               X
               集群與判別分析方法
 判別結果的評價                判別分析的正確應用
                         理論上,類間分得越開,
原樣本(訓練樣本),組內考核,          判別效果越好,類間距離
組內回代                     越近,判別效果就越差

                         不同的判別方法間是個參
考核樣本(test data set),組    照,大多情況下,效果近
外考核                      似

交叉驗證(cross validate)
*棄一法,刀切法                 關鍵是指標是否具有判別
(jackknife)              價值




                             集群與判別分析方法
           集群與判別
       A
集群(clustering)
 1.分成幾類?
 2.每個樣品屬於哪一類?


       B
判別(discriminate)
 1.已知分成幾類。(有師分類)
 2.根據訓練樣品建立判別函數
 3.根據判別函數對待判樣品進行歸類

                     集群與判別分析方法
   SPSS集群分析操作教學

• 主題1:SPSS的分層集群分析法

• 主題2:SPSS的K-Means集群分析法

• 主題3:SPSS的Two Step集群分析法


                   集群與判別分析方法
步驟1:SPSS的分層集群分析法



           分析→分類→階層集群分析法




             集群與判別分析方法
步驟2:SPSS的分層集群分析法




           選入欲分層集群之變數




            集群與判別分析方法
步驟3:SPSS的分層集群分析法




           最小層數:2
           最大層數:4




            集群與判別分析方法
步驟4:SPSS的分層集群分析法
                圖形:樹狀圖、冰
                   柱圖




        選取欲啟動
        及停止層集




                集群與判別分析方法
步驟5:SPSS的分層集群分析法




           使用”Ward’s法”;區
           間選擇歐基里得直線距離
           平方




            集群與判別分析方法
步驟6:SPSS的分層集群分析法




         層級數目選擇3(可自行決定)




               集群與判別分析方法
1.SPSS的分層集群分析法步驟分析
 樹狀圖(dendograms)可用來評估所形成之集群的內聚
 性,並提供適當集群數的相關資訊以供參考;
 冰柱圖(Icicle)會顯示群數凝聚的過程。
 Cluster Method的下拉式選單中尚提供了七種不同的方
 法。
 在大部分的研究中,最好的集群方法不是華得法,就是組
 間連結法,而單一連結法效果最差。



                           集群與判別分析方法
2.SPSS的分層集群分析法步驟分析
 可指定分析所需的相異性量數,其有下列選擇:
 1. 區間(Interval):共有歐基里得直線距離、歐基里得直線距離平
   方、Chebychev、區塊、Minkowski 或自訂式。例如Minkowski法
   可設定冪次(Power)是4,會得到         的距離。Power的預設
   值是2
 2. 個數(Counts):用在計數頻率的相異性資料
 3. 二進位(Binary):用在二元的相異性資料
 轉換值(Transform Values)框中,當變數是以差異甚大之尺度來衡
 量時,或每個變數所用的尺度不同,則在計算相異性之前先將數值標
 準化


                                 集群與判別分析方法
凝聚過程
          分層集群分析法結果輸出                                                                          集群成員
                      群數凝聚過程                                               各集群組員
          組合集群                      先出現的階段集群               觀察值            4集群    3集群    2集群
   階段   集群1    集群2      係數          集群1    集群2      下一階段 1:Case 1            1      1      1
    1      1     10          .000      0      0        42  2:Case 2          1      1      1
    2     51     62          .002      0      0        48  3:Case 3          2      2      1
    3     26     27          .003      0      0         5  4:Case 4          1      1      1
    4     37     59          .006      0      0        43  5:Case 5          3      1      1
    5     15     26          .011      0      3        28  6:Case 6          1      1      1
    6     28     32          .020      0      0        36  7:Case 7          4      3      2
    7     17     41          .030      0      0        30  8:Case 8          3      1      1
    8      8     14          .044      0      0        31  9:Case 9          1      1      1
    9     54     67          .057      0      0        19 10:Case 10         1      1      1

   10     38     45          .072      0       0        33   11:Case 11      1      1      1

   11     34     46          .090      0       0        21   12:Case 12      3      1      1

   12     35     44          .108      0       0        38   13:Case 13      1      1      1

   13     22     49          .127      0       0        44   14:Case 14      3      1      1

   14      9     20          .145      0       0        37   15:Case 15      2      2      1

   15     21     52          .163      0       0        41   16:Case 16      2      2      1
                                           …




   64      1      5      93.493       61       57       65   65:Case 65      1      1      1

   65      1      3     137.303       64       63       66   66:Case 66      1      1      1

   66      1      7     198.000       65       62        0   67:Case 67      1      1      1



                                                                                 集群與判別分析方法
分層集群分析法結果輸出
        垂直冰柱圖




          集群與判別分析方法
分層集群分析法結果輸出
           樹狀圖:為分
           層後截取其中
           一部份




         集群與判別分析方法
        層次集群法的評估
• 對研究者而言,階層式集群分析的凝聚過程通常並不重要

• 大部分的研究者通常只是要知道集群的結果而已,只要知道
 Cluster Membership的結果且將所要的集群數以Save儲存起來即
 可

• 階層式集群法只有得到各種不同集群數的集群結果,但K-
 Means集群法則可以進一步檢定每個分群變數對集群效果的F檢
 定,以對每個集群進行描述性分析

• K-Means集群法顯然比階層式集群分析法更常被使用


                              集群與判別分析方法
    SPSS的K-Means集群分析法
    若要使用K-Means集群分析法,分群變數應該是量化的,
1   而且使用歐基里得直線距離來計算距離



    如果變數是二元資料或個數,或者想要使用其他距離或
2   類似的量數,則必須使用層次法



    如果所選用的集群個數不適當,或者省略重要的變數的
3   話,則集群結果會令人誤解



                        集群與判別分析方法
步驟1:SPSS的K-Means集群分析法




              分析→分類→K平均數集群




                集群與判別分析方法
步驟2:SPSS的K-Means集群分析法


                 選入欲分層
                 集群之變數




                 選擇觀察值標
                  示依據




               集群與判別分析方法
步驟3:SPSS的K-Means集群分析法


         如勾選使用可動平均數(Use running
         means),則在確定每一個事件的分群後,
         可更新集群中心




                    集群與判別分析方法
步驟4:SPSS的K-Means集群分析法


         各集群組員(Cluster membership)可輸出集群
         後每一事件所屬類別




                        集群與判別分析方法
步驟5:SPSS的K-Means集群分析法




           勾選:各集群初始的中心、ANOVA摘
           要表、各觀察值的集群資訊




                 集群與判別分析方法
    K-Means集群分析法結果輸出
     各集群初始的中心                 疊代的過程

               集群        疊     集群中心點的變更
                         代      1           2
          1         2    1    17.700      20.648

候診時間--時   0         0    2    3.263       2.958
                         3    1.847       1.818
候診時間--分   2         45   4     .000        .000
                         a . 叢集中點沒有或僅有小幅變動,因此
                         達成收斂‧任何中點的最大絕對座標變
候診時間--秒   50        5
                         動為 .000。目前的疊代為 4。初始中點
                         之間的最小距離為 62.241。




                                    集群與判別分析方法
 K-Means集群分析法結果輸出
    集群的最終中心值             最終集群中心點間的距離

               集群
                         集群     1        2
          1         2

候診時間--時   0         0    1             30.231

候診時間--分   18        21
                         2    30.231
候診時間--秒   42        11




                                集群與判別分析方法
       K-Means集群分析法結果輸出
                    ANOVA                                  各集群中的觀察值個數
               集群               誤差
                                          F 檢定      顯著性
       平均平              平均平                                            1   34.000
                自由度               自由度
       方和               方和
                                                            集群
候診時間
        .014        1    .075        65    .182     .671               2   33.000
 --時

候診時間
     188.265        1   169.319      65    1.112    .296
 --分                                                             有效的       67.000

候診時間 15116.4
                    1   69.057       65   218.898   .000
 --秒   51                                                        遺漏值        .000
F 檢定僅能用於描述性的目的,因為 集群已經選來將不同集群中
各觀察值 之間的差異最大化。基於這個原因,觀 察值的顯著水準
尚未更正,因而無法解釋 為集群平均數為相同的假設檢定。




                                                                 集群與判別分析方法
   SPSS的Two Step集群分析法
          A             B
Two Step集群分析法的特色

如下:                每個連續變數都假設具有常

  1.可處理類別和連續變數     態分配,而每個類別變數則

                   假設具有多項式分配
  2.自動選擇集群數目

  3.擴展性



                        集群與判別分析方法
步驟1:SPSS的Two Step集群分析法




               分析→分類→Two Step集群




                 集群與判別分析方法
步驟2:SPSS的Two Step集群分析法




                選擇連續變數(亦可用
                類別變數)




                集群與判別分析方法
步驟3:SPSS的Two Step集群分析法

                 待標準化變數




                集群與判別分析方法
步驟4:SPSS的Two Step集群分析法




             選擇圖形,勾選欲選選項




                集群與判別分析方法
步驟5:SPSS的Two Step集群分析法

             “輸出”選項,勾選欲選取項目




                  集群與判別分析方法
Two Step集群分析法結果輸出
                  自動叢集
         Schwarz 的
                             BIC 變動比 距離測量比
 叢集數目    貝葉斯準則 BIC 變動a
                                率b     率c
           (BIC)                                 由自動集群過程,依BIC準
     1     163.045
     2     144.385 -18.660       1.000   1.662
                                                 則可以看出最適集群數為
     3     143.210  -1.175        .063   1.246   二群,因此時BIC值為各個
     4     147.243   4.032       -.216   1.749
     5     160.350  13.108       -.702   2.000   集群中最小者。
     6     179.519  19.169      -1.027   1.241
     7     199.864  20.344      -1.090   1.184
     8     220.967  21.104      -1.131   1.035
     9     242.212  21.245      -1.139   1.400
    10     264.595  22.383      -1.200   1.573
    11     288.014  23.419      -1.255   1.614
    12     312.121  24.107      -1.292   1.085
    13     336.316  24.195      -1.297   1.122
    14     360.624  24.308      -1.303   1.244
    15     385.112  24.488      -1.312   1.019
a 變動來自表格的上一個叢集數目。
b 變動比率與兩個叢集解答的變動相關。
c 距離測量比率是現有叢集數目除以上一個叢集數目。



                                                 集群與判別分析方法
      Two Step集群分析法結果輸出
                    組合的     總計的
               N                              候診時間--時       候診時間--分       候診時間--秒
                     %       %
                                                                           標準
          1    65   97.0%   97.0%                 標準            標準
                                              平均            平均         平均 Deviati
                                                 Deviati       Deviati
                                               數             數          數 on 離
                                                 on 離差         on 離差
                                                                            差
叢集        2    2    3.0%    3.0%
                                              .00    .000   19.62 13.037 26.89 17.201
                                          1

      組合       67   100.0% 100.0%             1.50   .707   9.00   9.899 21.50 24.749
                                     叢集   2

                                          組   .04    .272   19.30 13.023 26.73 17.235
     總計        67           100.0%
                                          合


              集群分配表                             集群的輪廓(Profile)


                                                            集群與判別分析方法
Two Step集群分析法結果輸出
      集群圓餅圖




                   圓餅圖


              集群與判別分析方法
Two Step集群分析法結果輸出

                         分
                         群
                         變
                         數
                         在
                         各
                         集
                         群
                         的
                         信
                         賴
                         區
                         間


             集群與判別分析方法
               結論
 群集分析的目的是要將觀察點分群,使得群內同質性愈高,群間
異質性愈高愈佳。層次群集法的分群成階層狀,每一階段形成的
群集個數分別是 n-1 , n-2 , n-3 等等

 層次群集法有數種不同的演算法,其差異主要是群間距離的定義
不同
 非層次法的分群則將每一觀察點分派至最接近的群集,因此需先
指定分群的群數
 分群時,先用層次法得出初始群集,再用非層次法重新分群,才
能取到最佳的分群結果


                             集群與判別分析方法
Thanks !

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:6
posted:2/18/2013
language:Unknown
pages:73