本書在系統(tǒng)調(diào)研已有文本表示研究的基礎(chǔ)上,基于深度神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)和前沿應(yīng)用,針對各異的隱晦文本的特征因場景,構(gòu)建了側(cè)重不同隱晦文本特征的深度神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了更精準(zhǔn)和魯棒的識別效果;ヂ(lián)網(wǎng)對青少年兒童來說并非絕對安全之地,其觸手可及和信息爆炸增長的特性使得隱晦信息可以更容易地傳播和擴(kuò)散。為了躲避已有的信息審核系統(tǒng),隱晦文本傾向使用比喻、借代等修辭手法,避免應(yīng)用與主題直接相關(guān)的常用敏感詞,使尋常的文本可以傳達(dá)隱晦的言外之意。目前,互聯(lián)網(wǎng)內(nèi)容提供平臺和電子商務(wù)平臺常出現(xiàn)以隱晦文本為載體,傳播辱罵、諷刺、色情和涉政等不良信息的情況。本書理論研究和技術(shù)實現(xiàn)相結(jié)合,全面系統(tǒng)地描述了隱晦文本識別研究進(jìn)展。
編寫本書的初衷是為了 深人探討互聯(lián)網(wǎng)內(nèi)容的隱晦 文本的審核問題.并提出創(chuàng) 新的解決方案;ヂ(lián)網(wǎng)的快 速發(fā)展給青少年帶來了許多 潛在的安全隱患,其中隱晦 信息的傳播和擴(kuò)散成為一個 不可忽視的問題。為了規(guī)避 傳統(tǒng)信息審核系統(tǒng)的過濾, 隱晦文本通常使用比喻、借 代等修辭手法,避免直接使 用常見的敏感詞匯。通過言 外之意來傳達(dá)隱晦信息,這 也給互聯(lián)網(wǎng)內(nèi)容提供平臺和 電子商務(wù)平臺針對不良信息 的審核帶來了挑戰(zhàn)。 本書的取材范圍涵蓋了 隱晦文本在不同場景中的多 樣性特征。通過系統(tǒng)調(diào)研已 有的文本表示研究。我們基 于深度神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ) 和前沿應(yīng)用,構(gòu)建了適用于 不同場景、側(cè)重不同隱晦文 本特征的深度神經(jīng)網(wǎng)絡(luò)模型 ,以實現(xiàn)更加精準(zhǔn)、魯棒的 識別效果。本書包括了理論 研究和技術(shù)實現(xiàn)兩個方面, 系統(tǒng)地描述了隱晦文本識別 研究的進(jìn)展。本書的主要特 點在于將隱晦文本的語言特 性與關(guān)聯(lián)用戶行為特征相結(jié) 合。提升了模型的表達(dá)能力 和魯棒性,不僅關(guān)注隱晦文 本本身的特點,還探索了用 戶在互聯(lián)網(wǎng)場景中的行為模 式,從而更好地理解和識別 隱晦文本。這種綜合考慮使 得審核模型在不同場景下都 能取得良好的效果。 本書的應(yīng)用范圍廣泛, 適合互聯(lián)網(wǎng)內(nèi)容智能審核從 業(yè)人員和文本理解領(lǐng)域?qū)I(yè) 人員閱讀參考.讀者可了解 隱晦文本識別領(lǐng)域的最新進(jìn) 展和方法,并掌握應(yīng)對互聯(lián) 網(wǎng)巾隱晦信息傳播的技術(shù)。 編寫本書的過程充滿了 挑戰(zhàn)。在研究過程中,面對 隱晦文本的多樣復(fù)雜特點. 需要通過不斷探索,努力尋 找解決方案。同時,我也深 感隱晦文本審核領(lǐng)域的困難 ,包括數(shù)據(jù)標(biāo)注和模型訓(xùn)練 等方面的挑戰(zhàn)。盡管本書提 供了一些創(chuàng)新的解決思路。 但對于不同場景和新興形式 的隱晦文本,仍需要進(jìn)一步 的研究和實踐來不斷改進(jìn)模 型的準(zhǔn)確性和適應(yīng)性。 在本書的編寫過程中, 我得到了許多人的幫助和支 持,尤其是出版社的編輯。 在此向所有給予我支持和鼓 勵的人表示衷心感謝。另外 ,特別感謝我的導(dǎo)師和同事 ,他們提供了寶貴的建議和 指導(dǎo),使本書得以順利完成 。同時·我也要感謝那些為 本書提供數(shù)據(jù)和資源的機(jī)構(gòu) 和個人,沒有他們的貢獻(xiàn), 我無法進(jìn)行深入的研究和實 驗。最后,要特別感謝我的 家人.正是他們的包容和提 醒,才使本書得以順利出版 。 我南衷地希望本書能為 讀者提供有關(guān)隱晦文本審核 領(lǐng)域的全面知識和啟發(fā),并 在實際應(yīng)用中發(fā)揮積極的作 用。相信通過不斷的研究和 創(chuàng)新,我們可以共同構(gòu)建一 個更加安全和健康的互聯(lián)網(wǎng) 環(huán)境。 謝謝大家的支持和關(guān)注 !祝閱讀愉快,從本書中獲 得所需的知識和見解。 2024年4月19日
賀國秀,華東師范大學(xué)經(jīng)管部信息管理系講師,晨暉學(xué)者,武漢大學(xué)情報學(xué)博士(2016-2021),新加坡南洋理工大學(xué)聯(lián)合培養(yǎng)博士(2019-2020),阿里達(dá)摩院研究型實習(xí)生(2018-2021)。
0 緒論
0.1 研究背景與研究意義
O.1.1 研究背景
O.1.2 研究意義
0.2 國內(nèi)外研究現(xiàn)狀
0.2.1 隱晦文本表示研究
O.2.2 用戶行為分析研究
O.2.3 相關(guān)研究總結(jié)與評述
O.3 研究方法與研究思路
O.3.1 研究方法
0.3.2 研究思路與研究方案設(shè)計
O.4 研究內(nèi)容與創(chuàng)新點
0.4.1 研究內(nèi)容
0.4.2 研究創(chuàng)新點
1 相關(guān)概念與理論基礎(chǔ)
1.1 本研究相關(guān)概念
1.1.1 互聯(lián)網(wǎng)內(nèi)容提供平臺中的隱晦文本
1.1.2 電子商務(wù)平臺中的隱晦文本
1.1.3 小結(jié)
1.2 深度神經(jīng)網(wǎng)絡(luò)的相關(guān)理論和方法
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)
1.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
1. 2.3注意力機(jī)制
1.2.4 小結(jié)
1.3 基于深度學(xué)習(xí)的自然語言處理
1.3.1 語言模型和詞嵌入
1.3.2 文本分類
1.3.3 文本生成
1.3.4 小結(jié)
2 基礎(chǔ)文本表示模型
2.1 著眼于上下文信息高度依賴的模型
2.1.1 背景介紹
2.1.2 專注整體信息的門控循環(huán)單元
2.1.3 實驗
2.1.4 結(jié)果和討論
2.1.5 小結(jié)
2.2 局限性
3 基于隱晦文本內(nèi)容特征的識別模型
3.1 針對比喻詞的隱晦文本識別模型
3.1.1 場景簡述
3.1.2 通瀆精讀模型
3.1.3 實驗
3.1.4 結(jié)果和討論
3.1.5 小結(jié)
3.2 面向漢字形變和音變的隱晦文本識別模型
3.2.1 場景簡述
3.2.2 打水漂模型
3.2.3 實驗
3.2.4 結(jié)果和討論
3.2.5 小結(jié)
3.3 局限性
4 結(jié)合隱晦文本內(nèi)容特征和關(guān)聯(lián)用戶行為特征的識別模型
4.1 結(jié)合用戶閱讀行為的隱晦小說識別模型
4.1.1 場景簡述
4.1.2 內(nèi)容和人類注意力的聯(lián)合學(xué)習(xí)模型
4.1.3 實驗
4.1.4 結(jié)果和討論
4.1.5 小結(jié)
4.2 結(jié)合用戶搜尋行為的隱晦商品識別模型
4.2.1 場景簡述
4.2.2 BIRD模型
4.2.3 實驗
4.2.4 結(jié)果和討論
4.2.5 小結(jié)
4.3 局限性
5 基于臨時額外交互特征的識別模型
5.1 基于循環(huán)交互的隱晦商品識別模型
5.1.1 場景簡述
5.1.2 循環(huán)滲透機(jī)
5.1.3 實驗
5.1.4 結(jié)果和討論
5.1.5 小結(jié)
5.2 局限性
6 總結(jié)與展望
6.1 研究總結(jié)
6.2 研究局限
6.3 未來研究方向
參考文獻(xiàn)