本書(shū)介紹了指數(shù)*圖模型的基本概念和原理,展示了該模型的建模和使用方法以及在實(shí)踐中應(yīng)當(dāng)如何運(yùn)用該模型。指數(shù)*圖模型主要用于社會(huì)網(wǎng)絡(luò)分析。相比傳統(tǒng)的描述性方法,指數(shù)*圖模型作為一種統(tǒng)計(jì)方法能夠更好地構(gòu)建社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)模型。雖然指數(shù)*圖模型是為了應(yīng)對(duì)網(wǎng)絡(luò)數(shù)據(jù)中內(nèi)在的非獨(dú)立性,但是該模型的結(jié)果通常都以類(lèi)似于邏輯回歸的方式進(jìn)行展示和闡釋?zhuān)瑥亩蛊涑蔀闄z驗(yàn)社會(huì)系統(tǒng)的有用方法。近年來(lái)統(tǒng)計(jì)軟件的開(kāi)發(fā)和進(jìn)步幫助社會(huì)科學(xué)家也能輕松地使用指數(shù)*圖模型,但關(guān)于該模型的使用卻還沒(méi)有一個(gè)簡(jiǎn)明清晰的指導(dǎo)。因此,本書(shū)旨在填補(bǔ)這一空缺,帶領(lǐng)讀者通過(guò)使用R統(tǒng)計(jì)軟件和statnet軟件包,學(xué)習(xí)指數(shù)*圖模型的建模和使用操作。
本書(shū)介紹了指數(shù)*圖模型(ERGM)的發(fā)展歷程、基本概念和原理,展示了該模型的建模和使用方法以及在實(shí)踐中應(yīng)當(dāng)如何運(yùn)用該模型,有助于讀者了解和初步掌握社會(huì)網(wǎng)絡(luò)分析方法和統(tǒng)計(jì)網(wǎng)絡(luò)模型。在模型建構(gòu)部分,本書(shū)從R軟件和statnet軟件包的獲取與準(zhǔn)備、數(shù)據(jù)獲取與探索、模型建構(gòu)和曲線(xiàn)指數(shù)族模型等幾個(gè)步驟入手,詳細(xì)解說(shuō)了指數(shù)*圖模型的建模方法。本書(shū)作為指數(shù)*圖模型建構(gòu)和使用方法的指導(dǎo)書(shū)籍,不僅填補(bǔ)了此前沒(méi)有該模型系統(tǒng)的建構(gòu)和使用指南的空缺,而且也具有很高的可操作性,幫助讀者學(xué)習(xí)指數(shù)*圖模型。
自20世紀(jì)初喬治·齊美爾(GeorgSimmel)首次論述社會(huì)網(wǎng)絡(luò)相關(guān)問(wèn)題以來(lái)(Simmel&Wolff,1950),社會(huì)科學(xué)家對(duì)于個(gè)體之間、組織之間以及其他實(shí)體之間相互關(guān)聯(lián)的網(wǎng)絡(luò)問(wèn)題一直保持高度的關(guān)注(參見(jiàn)例如Fienberg,2012)。20世紀(jì)30年代,心理醫(yī)生雅各布·莫雷諾(JacobMoreno,1934)的工作為社會(huì)網(wǎng)絡(luò)研究奠定了基礎(chǔ),并將此領(lǐng)域命名為社會(huì)計(jì)量學(xué)(sociometry)。在莫雷諾的諸多重要成果中,核心成果便是發(fā)明了社群圖(sociogram)方法,通過(guò)將個(gè)體圖形化表示為節(jié)點(diǎn),個(gè)體之間聯(lián)系圖形化表示為連線(xiàn)的形式,社群圖方法就能夠用來(lái)解釋社會(huì)結(jié)構(gòu)問(wèn)題。
在社會(huì)網(wǎng)絡(luò)分析發(fā)展的歷程中,社群圖方法被證明是十分重要的,原因之一是社群圖方法將圖論的基礎(chǔ)理論引入到了社會(huì)網(wǎng)絡(luò)分析中來(lái)。圖論是一個(gè)專(zhuān)門(mén)處理由節(jié)點(diǎn)(點(diǎn))以及相連的邊(連線(xiàn))所組成的數(shù)學(xué)分支,其中,網(wǎng)絡(luò)圖既可以是有向的,即網(wǎng)絡(luò)中的邊通常由從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的箭頭所表示,從而展現(xiàn)節(jié)點(diǎn)之間潛在的非對(duì)稱(chēng)聯(lián)系;網(wǎng)絡(luò)圖也可以是無(wú)向的,直接用線(xiàn)段來(lái)表示網(wǎng)絡(luò)中的邊。大多數(shù)研究社會(huì)網(wǎng)絡(luò)的傳統(tǒng)方法都是來(lái)源于圖論的,社會(huì)科學(xué)中的定量研究方法應(yīng)用系列叢書(shū)(QASS)中,有一本較早的著作,是由諾克和楊(Knoke&Yang,2008)撰寫(xiě)的《社會(huì)網(wǎng)絡(luò)分析》,該書(shū)就主要是采用這種(傳統(tǒng))方法。
傳統(tǒng)的網(wǎng)絡(luò)分析方法主要是描述性的,并不采用具有統(tǒng)計(jì)學(xué)意義上的隨機(jī)變量模型構(gòu)建方法。明確提出以網(wǎng)絡(luò)結(jié)構(gòu)為中心建立概率模型的思想可以追溯到20世紀(jì)中葉,即吉爾伯特、艾多斯以及瑞尼(Gilbert,1959;Erdos&Renyi,1959)解釋了網(wǎng)絡(luò)結(jié)構(gòu)中最為基礎(chǔ)的零模型(nullmodel)。在零模型中,所有的節(jié)點(diǎn)對(duì)都是以同等的概率建立連線(xiàn),無(wú)論是在有向網(wǎng)絡(luò)還是無(wú)向網(wǎng)絡(luò)中,簡(jiǎn)單圖模型都是被最廣泛采用的模型。
20年之后,霍蘭德和萊因哈特(Holland&Leindardt,1981)引入了一種針對(duì)有向圖的Gilbert-Erdos-Renyi零模型的變種。其中,關(guān)系形成(tieformation)的概率受到個(gè)體的群集性(gregariousness,個(gè)體對(duì)外與他人建立聯(lián)系的屬性)以及受歡迎程度(popularity,他人與該個(gè)體建立聯(lián)系的屬性)的影響。在此之后不久,1981年,芬博格和沃瑟曼(Fienberg&Wasserman,1981)將霍蘭德和萊因哈特的p1模型改造為對(duì)數(shù)線(xiàn)性模型,對(duì)數(shù)線(xiàn)性模型是一種為統(tǒng)計(jì)學(xué)家和社會(huì)科學(xué)家所熟知的模型,這樣一來(lái),學(xué)者們就可以方便對(duì)模型的參數(shù)進(jìn)行最大似然估計(jì)了。此外,芬博格和沃瑟曼還對(duì)p1模型進(jìn)行了擴(kuò)展,將網(wǎng)絡(luò)的互惠性(reciprocity)特征納入到模型中來(lái),并以互惠性特征作為網(wǎng)絡(luò)連線(xiàn)概率增強(qiáng)的機(jī)制例如,在一個(gè)朋友網(wǎng)絡(luò)中,如果A選擇B,那么,B選擇A的概率就會(huì)提升。
正如詹寧·哈瑞斯(JenineHarris)在本書(shū)中所解釋的,吉爾伯特等人的零模型,霍蘭德和萊因哈特的p1模型,以及芬博格和沃瑟曼(1981)的擴(kuò)展模型都是指數(shù)隨機(jī)圖模型(exponentialrandomgraphmodels,EGRMs)家族的成員。過(guò)去30年里,指數(shù)隨機(jī)圖模型的研究取得了長(zhǎng)足的進(jìn)展,而且已經(jīng)成為了目前社會(huì)網(wǎng)絡(luò)分析中最重要的統(tǒng)計(jì)工具。在這個(gè)進(jìn)程中,指數(shù)隨機(jī)圖模型不斷彰顯著自己在展現(xiàn)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)特征分析方面的洞察力,例如對(duì)聚類(lèi)或聚簇的分析。
近年來(lái),面對(duì)大數(shù)據(jù)分析所帶來(lái)的挑戰(zhàn)與激勵(lì),計(jì)算機(jī)科學(xué)家和統(tǒng)計(jì)物理學(xué)家,與統(tǒng)計(jì)學(xué)家、社會(huì)科學(xué)家并肩作戰(zhàn),對(duì)社會(huì)網(wǎng)絡(luò)分析的發(fā)展起到了直接推動(dòng)作用。源于社會(huì)生活中的大型網(wǎng)絡(luò)數(shù)據(jù)尤為龐大與復(fù)雜,如Facebook的數(shù)據(jù),這也促使研究人員必須不斷研究更為復(fù)雜的網(wǎng)絡(luò)模型,不斷改進(jìn)統(tǒng)計(jì)軟件的計(jì)算能力,以確保研究的模型能夠適應(yīng)大數(shù)據(jù)的環(huán)境。哈瑞斯在其書(shū)中介紹了由statnet團(tuán)隊(duì)所研發(fā)的最先進(jìn)的網(wǎng)絡(luò)分析軟件(Handcocketal.,2003),該軟件是針對(duì)R的統(tǒng)計(jì)計(jì)算環(huán)境而開(kāi)發(fā)的(RCoreTeam,2013),是一款廣泛使用的、免費(fèi)且開(kāi)源的統(tǒng)計(jì)分析平臺(tái)。
本書(shū)介紹了如何建立指數(shù)隨機(jī)圖模型,并解釋了如何在實(shí)踐中使用該模型,詹寧·哈瑞斯的工作對(duì)于采用社會(huì)網(wǎng)絡(luò)分析的社會(huì)學(xué)家而言十分重要。我希望她的這本著作將會(huì)有較廣泛的讀者群,同時(shí),期待該書(shū)能夠?qū)ι鐣?huì)科學(xué)中社會(huì)網(wǎng)絡(luò)分析質(zhì)量的提升產(chǎn)生實(shí)質(zhì)性的影響。
約翰·?怂梗↗ohnFox)
詹寧·K.哈瑞斯(Jenine K. Harris),美國(guó)圣路易斯華盛頓大學(xué)布朗學(xué)院副教授,教授公共衛(wèi)生和社會(huì)工作研究生課程。主要研究領(lǐng)域?yàn)楣残l(wèi)生和社會(huì)工作。目前的研究主要采用復(fù)雜統(tǒng)計(jì)網(wǎng)絡(luò)模型,以更好地理解和解釋美國(guó)地方衛(wèi)生部門(mén)的溝通網(wǎng)絡(luò)聯(lián)系,尤其是社交媒體聯(lián)系。
序
第1章 網(wǎng)絡(luò)分析方法的希望與挑戰(zhàn)
第1節(jié) 歷史與概念
第2節(jié) 網(wǎng)絡(luò)術(shù)語(yǔ)
第2章 統(tǒng)計(jì)網(wǎng)絡(luò)模型
第1節(jié) 簡(jiǎn)單隨機(jī)圖
第2節(jié) ERGM的發(fā)展
第3節(jié) 本章小結(jié)
第3章 建立一個(gè)有效的指數(shù)隨機(jī)圖模型
第1節(jié) 軟件獲取與準(zhǔn)備
第2節(jié) 數(shù)據(jù)獲取
第3節(jié) 數(shù)據(jù)探索
第4節(jié) 模型構(gòu)建
第5節(jié) 曲線(xiàn)指數(shù)族模型
第4章 面向有向網(wǎng)絡(luò)及二元組屬性的應(yīng)用
第1節(jié) 針對(duì)有向網(wǎng)絡(luò)的研究
第2節(jié) 將二元組和網(wǎng)絡(luò)協(xié)變量作為預(yù)測(cè)變量
第5章 結(jié)論與建議
附錄
參考文獻(xiàn)
譯名對(duì)照表
譯后記