Documents
Resources
Learning Center
Upload
Plans & pricing Sign in
Sign Out

Different Aspects of Social Network Analysis

VIEWS: 2 PAGES: 43

									    DIFFERENT ASPECTS OF SOCIAL
         NETWORK ANALYSIS

       Mohsen Jamali and Hassan Abolhassani
        Web Intelligence Research Laboratory
         Computer Engineering Department
     Sharif University of Technology, Tehran, Iran



1                指導教授:郭文興
                   學生:吳順雄
目錄
   Abstract

   I. Introduction

   II. Social Network Models
       A. Using formal methods to show Social Networks

       B. Using Graphs to Represent Social Relations

       C. Using Matrices to Represent Social Relations

       D. Statistical Models for Social Network Analysis


                                                            2
目錄
   III. Social Network Properties
       A. Maximum flow
       B. Hubbell and Katz cohesion
       C. Centrality and Power

   IV. Groups and SubStructures in Social Networks
       A. Cliques
       B. N-Clans
       C. K-plexes

   V. The Web as a Social Network
                                                         3
       A. Applying social network analysis to the Web
目錄
   VI. Inferring Communities in Web
       A. Bibliographic Metrics

       B. Bipartite Cores

   VII. Blogsphere as Social Network

   VIII. Semantic Web and Social Networks

   IX. Conclusions

   X. References

                                             4
ABSTRACT
   社群網路分析的重點是分析人群、組織或是國家間的關係
    形態。

   社群網路分析提供了視覺和數學的分析。

   社群網路是由網頁間的超連結組成的。

   調查範圍從純數學分析到已知的語意網中的社群網路分析。

   主要目的是替研究不同方面的社群網路分析提供一個路線
    圖。

                            5
INTRODUCTION
   社群網路是許多個體或組織間的社交結構。

   E-mail流量、疾病傳播和犯罪活動都可以被做成社群網路

    模型。

   社群網路分析是測量個人、群體、組織、動物、電腦或其

    他資訊處理的流向和關係。

   個人和群體是網路中的節點,而各節點間的關係和流向就
                               6
    是節點間的連線。
INTRODUCTION
   網路中的子群體的數量、大小和連線可以透露出整個網路的習

    慣。

   在第二節,我們描述將社群網路視覺化以及分析的各種不同的

    模型。

   在第三節會詳細討論一些社群網路的重要屬性。

   網路也可以看成是一種社群網路,這在第5、6節會討論。

   BLOG是網路中一種特殊的子集合,在第7節會討論BLOG的社
                                  7
    群網路。
INTRODUCTION
   語意網是一個新興的概念,他將網路上的資料被定義和連

    結,使得人們可以使用,也可以被機器處理。

   在第8節會討論社群網路中的語意網的分析,以及他們彼

    此間的影響。

   最後是結論和未來工作的步驟。


                                8
SOCIAL NETWORK MODELS
   A. Using formal methods to show Social Networks
       在社群網路分析使用數學和圖像技術,能表現出網路的緊密和
        系統化。

       數學的表示法也能讓我們使用電腦來分析網路資料。

       使用正規方法能讓我們從資料中找出圖像處理的技術和數學的
        規則。

   分析完整個網路,可以得到一些差別:
       描述方法也可以透過圖像表達。

       分析過程常建構於分解相鄰矩陣。
                                                      9
       統計模型建構於機率分布。
SOCIAL NETWORK MODELS
   B. Using Graphs to Represent Social Relations
       網路分析使用的圖像表達是由點(使用者)和線(使用者間的關係)
        組成。

       社會學家將這種圖示重新命名為sociograms(社會關係圖)。

       透過顯示社會關係圖來視覺化,提供一個社群網路資料的描述
        方法。

       對一個小圖形來說是足夠的,但是通常資料或研究的問題都太
        複雜而不能簡單達成。


                                                    10
SOCIAL NETWORK MODELS
   C. Using Matrices to Represent Social Relations
       最簡單且常見的矩陣是二元矩陣。

       這是所有網路分析的起始點,也稱為相鄰矩陣。

       根據習慣,傳送端是行,目標是列。




                                                      11
SOCIAL NETWORK MODELS
   D. Statistical Models for Social Network Analysis
       將彼此間有互動的個體的機率做成模型。

       兩個最著名的方向是Markov Random Fields(MRFs)和
        Exponential Random Graphical Models(ERGMs),又
        稱為     。

       統計模型假設有n個使用者,再將使用者間的二元關係表示成
             的 的矩陣Y。

       使用者i與j之間有關係的話           為1,否則為0。

            也可以在使用者i、j之間加上強度。
                                                        12
SOCIAL NETWORK MODELS
   D. Statistical Models for Social Network Analysis
       另外每個個體也可以有特性集合              。

       n次向量                 是被完整觀測的共變量。

       現有的模型有許多問題,像是衰退分析和延展性。




                                                        13
SOCIAL NETWORK PROPERTIES
   A. Maximum flow
       詢問許多相鄰的使用者從來源到目標的路徑,便能了解如何完
        全連結兩個使用者。

       如果我需要傳給目標訊息,但是我只能透過一個使用者轉傳,
        即使轉傳的使用者有很多路徑可以傳給目標,這個連線還是很
        弱。

       如果我有4個人可以轉傳,而且每個轉傳的使用者都有1個或多
        個路徑能傳給目標,則這個連線是很強的。


                                   14
SOCIAL NETWORK PROPERTIES
   B. Hubbell and Katz cohesion
       maximum flow是集中在兩個使用者間連線的弱點或是重複連線。

       我們可以將連線定義為所有線路的強度。

       如果我們想知道兩個使用者如何互相影響,則必須考慮他們全
        部範圍的連線。

       即使包含了所有的連線,也不能認為長度10的路徑會跟長度1的
        路徑一樣重要。

       Hubbell和Katz計算了使用者間所有的連線,並且根據長度加權
        後發現,距離越長,連線越弱。
                                       15
SOCIAL NETWORK PROPERTIES
   C. Centrality and Power
       社會學家都認為動力是社群結構的基本屬性。




                               16
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   許多了解網路的人都著重在混合的連線有多密集以及發展
    較大的派系或小團體。

   將使用者分成小團體,在社群結構中是很重要的概念,在
    了解整個網路可能發生的行為時是很重要的。

   假設有一個使用者在兩個不同的網路各組成2個不重疊的小
    團體,其中一些成員是重疊的。

   有重疊的團體間,發生的衝突會比沒有重疊的團體少。
                               17
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   當團體有重疊時,動員和擴散會很快的傳遍整個網路;但
    是沒有重疊的團體,團體的特性就不會傳給其他團體。

   圖形的主要特徵
       如何分割小團體?

       小團體有多大?

       是否有部分使用者在扮演網路角色?



                               18
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   A. Cliques
       派系是一群網路中彼此關係比其他網路成員更緊密的人所組成的
        團體。

       派系的嚴格定義,每個成員彼此間都有直接的關係。

       普遍的定義是在團體裡與任何一個路徑距離大於1的人有連結,
        而通常距離都是2,也就是朋友的朋友。

       這種基礎定義的團體,稱為N-clique,N是由允許連接到其他成
        員的路徑長度決定。
                                       19
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   B. N-Clans
       N-clique想找出長且連續的團體,而不是緊密但是不連續的團體。

       但是N-clique有一個不受歡迎的特性,不是團體中的使用者也可
        以連接到團體中的成員。

       分析家建議N-cliques限制兩個使用者間的延展和路徑距離。

       這種限制也影響了N-clique裡的成員彼此間的路徑。




                                          20
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   C. K-Plexes
       一個替代的方法是即使使用者只與其他k個成員有連結,仍然允
        許他是團體中的成員。

       如果他直接連結團體中n-k個成員,可以稱為是大小為n的團體。

       相較於n-clique分析產生大且連續的團體,k-plex分析傾向找出
        數量多且較小的團體




                                          21
GROUPS AND SUBSTRUCTURES IN
SOCIAL NETWORKS
   C. K-Plexes




                              22
THE WEB AS A SOCIAL NETWORK
   社群網路是由網頁超連結至其他網頁所組成的。

   將網路作成模型,頂點是網頁,邊緣就是超連結。

   可以發布和收集個人資訊是網路一開始成功的主要原因。

   在2003年,網路開始成為多數使用者在社群方面的活動空
    間。

   網站快速的成長,幾乎可以成為社群網路服務(social
    networking services,SNS)。

   最早出現的Friendster吸引了超過500萬人註冊,隨後
                                     23
    Google和Microsoft也開始類似的服務。
THE WEB AS A SOCIAL NETWORK
   雖然網站的內容都很類似,但是提供了一個存取的中心點,
    也帶來處理個人資訊分享和線上社會化的結構。

   網站也允許使用者張貼有基本資訊的個人簡介、邀請其他
    人來註冊以及連結到朋友的個人簡介。

   系統也可以視覺化,並透過瀏覽網路發現共同的朋友,或
    是有相同興趣,未來可能變成朋友的人。




                              24
THE WEB AS A SOCIAL NETWORK
   A. Applying social network analysis to the Web
    1)   PageRank in Google:假設一個人無限次的亂逛網路,隨機
         連出每個網頁的機率是1 – p,隨機跳進一個網頁的機率是p,
         所以每個網頁被瀏覽的比例會不同,也就能看出哪些網頁比較
         熱門。




         Google依照這公式模擬每個網頁的瀏覽量來評分,當使用者輸
         入關鍵字搜尋時,符合的項目便按照評分的高低來排序。
                                                     25
THE WEB AS A SOCIAL NETWORK
   A. Applying social network analysis to the Web
    2)       Hyperlink induced topic search(HITS):超連結引誘標題搜
             尋有一點不同,他不是預先處理網頁,而是依靠搜尋引擎。
             一個給HITS的詢問會先往前傳給搜尋引擎,再從網路上得到與詢問相
              符的網頁。

             每個節點u在延展的圖片中有兩個相關的分數            和      ,初始成
              1。然後HITS再開始疊代計算




                   和        在疊代完後會標準化成1。
                                                         26
             但是因為HITS是詢問-依賴的結構,所以速度會比Google慢。
INFERRING COMMUNITIES IN WEB
   社群的組成是網路上一個重要的活動。

   已知大量的網頁,我們的目標就是從網路上找出更多潛在
    的社群。

   在這節用兩種方法來驗證社群的連接拓墣。




                               27
INFERRING COMMUNITIES IN WEB
   A. Bibliographic Metrics
       圖2表示兩個互補的標準,書目對(bibiographic coupling)和共
        被引(co-citation)。




                                               28
INFERRING COMMUNITIES IN WEB
   B. Bipartite Cores
       目錄學在描述兩個網頁間的相似性時是有效的。

       一個完整的雙邊圖可以被分成兩個集合,L和R。

                ,       。

       L的每一個頂點都有一個邊緣到R的頂點。

       使用    來表示完整的雙邊圖,其中    、   。

       雙邊的子圖因為有兩個互有關係的原因,所以與網路社群有關
        係

                                      29
INFERRING COMMUNITIES IN WEB
   雙邊核心   有一個屬性,L上的所有頂點都有書目對的下
    限值r,而所有R上的頂點都有共被引的下限值l。

   所以雙邊子圖組成的頂點在書目學上有最小程度的相似。

   第二個原因是他們很有經驗的在網路社群的核心結構中簽
    名。




                               30
BLOGSPHERE AS SOCIAL NETWORKS
   最近,BLOG成為網路上新興的社群媒介,他可以讓使用
    者快速且容易的發布他個人的想法。

   由於BLOG可以超連結到網頁或其他BLOG,所以看成是
    多樣團體的網路。

   部落客可以在部落格串聯中列出其他人的部落格,而且可
    以閱讀跟評論其他人發表的文章。

   部落格是網路中的子集合,所以可以看成是社群網路,但
    是如果考慮評論和部落格間的連結,它連接的結構又有一
    些不同。                      31
BLOGSPHERE AS SOCIAL NETWORKS
   為了測量部落格的流行,Gilad Mishne和Natalie Glance
    採用兩種指標:
       連入部落格的連結數。

       瀏覽過的網頁數。

   Ko Fujimura提出一個新的演算法“EigenRumor”,將每
    個部落格加權後再來評分。

   在EigenRumor的模型中,相鄰矩陣是由代理人-物件的連
    結所構成,而不是網頁-網頁或物件-物件。

   EigenRumor演算法是以代理人的特性來計算分數。           32
SEMANTIC WEB AND SOCIAL
NETWORKS
   現在無論是內部網路、外部網路或是網際網路,都在發生
    一場革命,也就是讓網路能有具有意義,可以理解,也可
    以讓機器處理。

   這就稱為語意網,他將會讓我們轉變成對任何事物都是知
    識中心的觀點。

   語意網是一種新興的概念,他能讓網路上的資料被定義,
    方便人類使用也可以讓機器處理。

   語意網和社群網路模型彼此間可以互相支援。    33
SEMANTIC WEB AND SOCIAL
NETWORKS
   要實現這些事情,會遇到許多挑戰:
       知識的表達:如何讓許多共同的東西能夠有相同的名稱。
       知識的管理:相對於整個網路,語意網可以公正的連結到RDF
         的圖片等級,但是連結到RDF的檔案等級就比較弱。所以需
        要更有效的存取知識,尤其是社群網路上的語意網。
       社群網路的摘錄、整合以及分析:即使許多東西都已經被定義
         的很好,但是要從網路上的雜訊或是不完整的知識中正確的
         摘錄出社群網路仍然是非常困難的。
       起源和信任分散的推論:如何利用信任模型中的知識的起源來
                                    34
        管理和減少分散推論的複雜度。
SEMANTIC WEB AND SOCIAL
NETWORKS
   儘管他很早開始流行,但是使用者卻很晚才發現集中社群
    網路服務的缺點。

   首先,資訊是掌控在資料庫擁有者的手上,存在系統中的
    個人資訊是不能被輸出的,所以也就不能從一個系統轉移
    到下一個系統。

   第二,集中的系統不允許使用者控制他們自己提供的資訊,
    而這在語意網的技術中也有被提出來。

                            35
CONCLUSIONS
   本篇paper複習了社群網路的正式表現方法和社群網路的
    屬性。

   網路本身也可以算是一種社群網路。

   在網路的社群網路中,檔案是社會關係圖的節點,檔案間
    的連結則是社會關係圖的邊緣。

   部落格是網路的子集合,也可以當成是社群網路。

   語意網是新興的概念,他可以讓網路上的資料被定義而被
    使用者和機器使用。
                              36
   語意網和社群網路彼此互相支援。
CONCLUSIONS




              37
REFERENCES




             38
REFERENCES




             39
REFERENCES




             40
REFERENCES




             41
REFERENCES




             42
REFERENCES




             43

								
To top