這是一本從原理、算法、實現、應用4個維度詳細講解圖神經網絡的著作,在圖神經網絡領域具有重大的意義。
本書作者是圖神經網絡領域的資深技術專家,作者所在的公司極驗也是該領域的領先者。本書是作者和極驗多年研究與實踐經驗的總結,內容系統、扎實、深入淺出,得到了白翔、俞棟等多位學術界和企業(yè)界領軍人物的高度評價及強烈推薦。
全書共10章:
第1~4章全面介紹了圖、圖數據、卷積神經網絡以及表示學習等基礎知識,是閱讀本書的預備知識;
第5~6章從理論的角度出發(fā),講解了圖信號處理和圖卷積神經網絡,深入剖析了圖卷積神經網絡的性質,并提供了GCN實現節(jié)點分類的實例;
第7~9章全面講解了圖神經網絡的各種變體及范式、圖分類機制及其實踐,以及基于GNN的圖表示學習;
第10章介紹了圖神經網絡的*研究和應用。
為何寫作本書
近年來,作為一項新興的圖數據學習技術,圖神經網絡(GNN)受到了非常廣泛的關注。2018年年末,發(fā)生了一件十分有趣的事情,該領域同時發(fā)表了三篇綜述類型論文,這種不約而同體現了學術界對該項技術的認可。事實上,在2019年的各大頂級學術會議上,與圖神經網絡有關的論文也占據了相當可觀的份額。相信在未來幾年,這種流行的趨勢會只增不減。
圖神經網絡技術的出現有其必然性和重要性。在深度神經網絡技術興起的前幾年,圖像、語音、文本等形式的數據都能在深度學習中被很好地應用,并獲得了十分好的效果。這促使大量的相關應用進入了實用階段,如人臉識別、語音助手、機器翻譯等。盡管如此,深度學習一直無法很好地對另一類形式的數據圖數據(或稱網絡數據)進行有效的適配。作為一類主要用來描述關系的通用數據表示方法,圖數據在產業(yè)界有著更加廣闊的應用場景,在諸如社交網絡、電子購物、物聯網、生物制藥等場景中,都可以找到圖數據的影子。將深度學習技術的成功經驗遷移到圖數據的學習中來,是一種十分自然且必要的需求。
在這樣的背景下,圖神經網絡的出現很好地填補了上述技術空白,實現了圖數據與深度學習技術的有效結合,使得深度學習能夠在圖數據的相關應用場景中繼續(xù)攻城略地。事實上,縱觀這三年,圖神經網絡技術的相關應用和研究已經拓展到了極其廣泛的領域,從視覺推理到開放的閱讀理解問題,從藥物分子的研發(fā)到5G芯片的設計,從交通流量預測到3D點云數據的學習,該項技術都展示出了極其重要且極具滲透性的應用能力,這種能力必將給產業(yè)界帶來極高的應用價值。
筆者所在公司極驗在業(yè)務風控的應用場景中,長期奮戰(zhàn)在網絡攻防對抗的前線,在這樣的背景下,不管是主動還是被動,都促使我們不斷努力提升數據分析與數據建模的能力,一直以來,我們都期望有一套端對端的模型來高效學習數據中的關系或結構化信息。極驗在2017年年中與圖神經網絡技術結緣,正好提供了這樣的契機,在對該項技術進行多番論證并上線到極驗的實際業(yè)務中后,取得了超出預期的效果,這極大提升了我們對該項技術的熱情。同時,為了更好地對這項新技術進行討論和學習,我們組織了相應的學習社群,大家都表現出了高昂的熱情,這份熱情激勵筆者將更多精力投入到該項技術上,也正因如此,寫一本關于圖神經網絡的書籍的想法應運而生。期望通過本書,讓讀者朋友對該項技術的來龍去脈有更清晰、全面的認識。如果能產生更大的知識分享成果,那么本書的價值就更高了,這將是對我們的最好回報。
本書讀者對象
想學習并初步實踐圖神經網絡技術的讀者
想較系統且深入理解圖神經網絡技術的讀者
本書主要內容
本書分為三大部分:
第一部分為基礎篇,包括第1~4章,其中第1章由筆者撰寫,第2~4章由李彥霖撰寫。主要介紹學習圖神經網絡所需的基礎知識,包括圖的基本概念、卷積神經網絡以及表示學習,幫助初學者更加清晰地認識到圖神經網絡技術與深度學習技術是一脈相承的。
第二部分為高級篇,包括第5~9章。這部分是本書的重點,主要講解圖卷積神經網絡的理論基礎和性質、圖神經網絡的各種變體和框架范式、圖分類以及基于GNN的圖表示學習。該部分的各章節(jié)都有相關的實踐案例,為讀者規(guī)劃了完整的從理論到實踐的學習路線,幫助讀者系統全面地學習圖神經網絡。這部分有兩位作者,理論部分由筆者撰寫,實踐案例的代碼由李彥霖提供。
第三部分為應用篇,即第10章,主要介紹了圖神經網絡目前的一些應用。圖神經網絡的應用非常廣泛,現實應用場景非常多,但鑒于本書的規(guī)劃,這里只是略著筆墨,旨在拋磚引玉,讓讀者對應用場景有一定的認知。這部分由周洋撰寫。
最后,每個章節(jié)都附有相關的參考文獻。
本書特色
本書有如下特色:
(1)詳細闡述了圖卷積模型的由來,以及什么是頻域圖卷積和空域圖卷積,這是很多初學者學習該技術的第一只攔路虎;
(2)集中闡述了圖卷積模型的性質,這些性質的解讀對讀者深入地理解圖神經網絡技術有著重要的作用;
(3)給出了關鍵部分的代碼,希望能輔助讀者清晰理解書中的一些公式里的變量的具體含義。
(4)本書為了幫助讀者理解圖神經網絡的相關概念和技術,提供了很多示意圖。
勘誤和支持
由于作者的水平有限,編寫時間倉促,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。如果你遇到任何問題,可以訪問我們專門為本書創(chuàng)建的技術主頁 https://github.com/FighterLYL/GraphNeuralNetwork,我們將盡量為讀者提供滿意的解答。如果你有更多寶貴的意見,也歡迎發(fā)送郵件至郵箱yfc@hzbook.com,期待能夠得到你們的真摯反饋。
致謝
首先要感謝這個開放的時代,深度學習技術的爆發(fā)離不開產、學、研的緊密結合,在信息開放、知識分享的大背景下,我們每一個人都是其中的受益者。
感謝筆者所在公司極驗科技,對本書的寫作提供了大力支持,特別是同事謝永芬,完成了書稿所有章節(jié)的初排工作,為其中大量的公式和插圖付出了許多精力。
感謝機械工業(yè)出版社華章公司的編輯楊福川和張錫鵬,在這段時間始終支持我們的寫作,他們的耐心和專業(yè)引導我們順利完成了撰寫工作。
最后,感謝我的妻子,她理解并支持我這段時間的挑燈寫作,家人的關懷是我前進的動力!
劉忠雨
劉忠雨
畢業(yè)于華中科技大學,資深圖神經網絡技術專家,極驗科技人工智能實驗室主任和首席技術官。在機器學習、深度學習以及圖學習領域有6年以上的算法架構和研發(fā)經驗,主導研發(fā)了極驗行為驗證、深知業(yè)務風控、疊圖等產品,極驗科技目前服務于全球 26萬家企業(yè)。
李彥霖
畢業(yè)于武漢大學,極驗人工智能實驗室技術專家。一直從事機器學習、深度學習、圖學習領域的研究工作。在深度神經網絡算法研發(fā)、圖神經網絡在計算機視覺以及風控中的應用等領域實踐經驗豐富。
周洋
工學博士,畢業(yè)于武漢大學,目前在華中師范大學任教。曾受邀到北卡羅萊納大學訪學,長期在大數據挖掘前沿領域進行探索和研究,并應用于地理時空大數據、交通地理等諸多方向,已發(fā)表SCI&SSCI及核心期刊論文10余篇。