本書主要針對網(wǎng)絡(luò)計量分析中普遍存在的問題,例如開放獲取網(wǎng)絡(luò)資源的技術(shù)門檻較高、網(wǎng)絡(luò)內(nèi)容提取和分析技術(shù)繁多且復(fù)雜、定量分析的結(jié)果解讀困難等,提出具體解決方案和技術(shù)實踐路徑,尤其是利用R語言編程的方法解決上述問題,包括網(wǎng)頁數(shù)據(jù)自動抓取、網(wǎng)絡(luò)鏈接分析和網(wǎng)絡(luò)文本內(nèi)容分析等,以便相關(guān)專業(yè)的師生掌握網(wǎng)絡(luò)計量分析的方法和技能,并依據(jù)統(tǒng)計分析的原理和方法解釋定量分析的結(jié)果。
現(xiàn)在網(wǎng)絡(luò)計量學(xué)已經(jīng)被廣泛理解為研究基于網(wǎng)絡(luò)內(nèi)容和網(wǎng)絡(luò)現(xiàn)象,以實現(xiàn)社會科學(xué)研究目標的定量研究方法。該方法通常研究與傳統(tǒng)文獻計量學(xué)相關(guān)的問題,研究范圍包括網(wǎng)站鏈接、網(wǎng)站引用和搜索引擎評估分析方法等。網(wǎng)絡(luò)計量學(xué)利用更廣泛的學(xué)術(shù)對象,如專利、網(wǎng)頁、社交媒體等。網(wǎng)絡(luò)計量學(xué)已被廣泛用于研究學(xué)科的學(xué)術(shù)交流結(jié)構(gòu)。本書內(nèi)容是在“網(wǎng)絡(luò)計量分析”的教學(xué)實踐中使用的教學(xué)內(nèi)容,這些內(nèi)容包含了部分開放的網(wǎng)絡(luò)資源,如網(wǎng)絡(luò)數(shù)據(jù)、R語言代碼以及使用手冊等。
楊孟輝:人民大學(xué)信息資源管理學(xué)院教授,主持國家自然科學(xué)基金重大項目、面上項目、中國博士后科學(xué)基金項目等多項。在國際SCI學(xué)術(shù)期刊和國內(nèi)重要學(xué)報等以第一作者發(fā)表論文40余篇;授權(quán)國家發(fā)明專利2項。國家自然科學(xué)基金項目評審專家,國家認監(jiān)委檢驗檢測機構(gòu)(教育組)資質(zhì)認定評審員(國家級)。
第1章
網(wǎng)絡(luò)計量分析
1.1 大數(shù)據(jù)理論
1.2 Web超鏈接分析
1.3 計算文本分析
1.4 網(wǎng)絡(luò)分析
第2章 如何找到合適的網(wǎng)絡(luò)數(shù)據(jù)
2.1 Google Books Ngram Viewer
2.2 Google Trends
2.3 Google Search
2.4 Google Scholar
第3章 網(wǎng)頁數(shù)據(jù)自動抓取
3.1 下載并安裝Data Miner到Google
Chrome中
3.2 開啟Data Miner
3.3 打開Data Miner
3.4 注冊并登錄Data Miner
3.5 創(chuàng)建Recipe
3.6 設(shè)置待爬取網(wǎng)頁的類型
3.7 設(shè)置待爬取網(wǎng)頁中行的信息
3.8 設(shè)置待爬取網(wǎng)頁中列的信息
3.9 設(shè)置爬取時自動翻頁
3.10 設(shè)置爬取動作
3.11 設(shè)置腳本
3.12 保存設(shè)置
3.13 開始爬取
3.14 本章小結(jié)
第4章 網(wǎng)絡(luò)鏈接分析
4.1 URL提取
4.2 URL分析
4.3 Domain分析
4.4 Site分析
4.5 頂級域名TLD分析
4.6 本章小結(jié)
第5章 網(wǎng)絡(luò)文本內(nèi)容分析
5.1 R語言文本分析框架
5.2 數(shù)據(jù)準備
5.3 數(shù)據(jù)分析
5.4 高級主題
第6章 網(wǎng)絡(luò)分析
6.1 網(wǎng)絡(luò)分析基礎(chǔ)
6.2 R語言中的網(wǎng)絡(luò)數(shù)據(jù)管理
6.3 基本網(wǎng)絡(luò)繪圖和布局
6.4 有效的網(wǎng)絡(luò)圖形設(shè)計
6.5 高級網(wǎng)絡(luò)圖形
6.6 網(wǎng)絡(luò)成員的重要性評估
6.7 割點和橋
6.8 子組(子群子圖子網(wǎng))
6.9 隨機網(wǎng)絡(luò)模型
6.10 統(tǒng)計網(wǎng)絡(luò)模型
結(jié)束語
參考文獻