隨著數(shù)字音樂內(nèi)容的迅速增長以及人們對音樂鑒賞需求的日益提升,音樂信息的分類檢索及個性化推薦受到廣大網(wǎng)民和有關(guān)從業(yè)人員越來越廣泛的關(guān)注,并成為研究及應(yīng)用的新熱點。 本書系統(tǒng)地闡述了機器學習中的常用分類與推薦方法,介紹了網(wǎng)絡(luò)音樂自動分類與推薦的理論基礎(chǔ),重點探討了SVM 和KNN 分類算法的改進,以及協(xié)同過濾推薦算法和基于馬爾可夫模型推薦算法的改進,并對改進后的算法應(yīng)用到音樂自動分類和個性化推薦領(lǐng)域進行了探索性研究。
本書展現(xiàn)了機器學習常用算法的原理、改進及應(yīng)用案例,適合機器學習、數(shù)據(jù)挖掘及大數(shù)據(jù)等領(lǐng)域的專業(yè)人員閱讀。
機器學習(MachineLearningML)是一門多領(lǐng)域交叉學科,涉及概率論、統(tǒng)計學、逼近論凸分析和算法復雜度理論等多門學科。機器學習專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能,它是人工智能的核心,是使計算機具有智能的根本途徑,其應(yīng)用遍及人工智能的各個領(lǐng)域。
網(wǎng)絡(luò)音樂現(xiàn)在已成為僅次于即時通信、搜索引擎的第三大互聯(lián)網(wǎng)應(yīng)用。隨著數(shù)字音樂內(nèi)容的迅速增長以及人們對音樂鑒賞需求的增強,音樂信息的分類檢索受到了越來越多的關(guān)注,人工分類標注已經(jīng)遠遠跟不上網(wǎng)絡(luò)數(shù)據(jù)的更新速度,無法滿足互聯(lián)網(wǎng)對海量音樂數(shù)據(jù)存儲、傳輸、欣賞、研究的新要求,越來越龐大的數(shù)字音樂數(shù)據(jù)庫需要智能化的分類管理和存儲,音樂分類系統(tǒng)受到了廣大網(wǎng)民和有關(guān)從業(yè)人員越來越廣泛的關(guān)注。面對網(wǎng)絡(luò)音樂資源的爆炸式增長,如何從海量數(shù)字音樂資源中準確、高效地為用戶推送其感興趣的高質(zhì)量音樂內(nèi)容,并為其構(gòu)建滿足個人喜好的播放列表已成為國內(nèi)外學術(shù)界關(guān)注的熱點問題。音樂分類系統(tǒng)和個性化音樂推薦系統(tǒng)已經(jīng)逐漸成為理論研究和實際應(yīng)用的一個新熱點。
將機器學習算法應(yīng)用于網(wǎng)絡(luò)音樂自動分類,不僅可以節(jié)省大量的人力和物力,而且不會由于人的主觀因素造成分類不準確的情況,從而提高分類的準確率。將機器學習算法應(yīng)用于音樂推薦,可以使用戶從海量的網(wǎng)絡(luò)音樂中快速找到自己感興趣的音樂,并且有著不錯的準確率和召回率。
本書主要可以分為兩大部分:第1部分( 第1~4章)為基礎(chǔ)部分,第2部分(第5~8章)為應(yīng)用部分,各章主要內(nèi)容如下:
第1章機器學習簡介。介紹了機器學習的概念、機器學習的發(fā)展及研究現(xiàn)狀;機器學習的分類,并從學習方式的維度將機器學習分為有監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習和強化學習4類,介紹了各類的特點、適用問題以及學習過程;最后列舉了常用的機器學習算法。
第2章音樂、數(shù)字音樂與網(wǎng)絡(luò)音樂。介紹了音樂的藝術(shù)形式、產(chǎn)生、發(fā)展及音樂的要素,數(shù)字音樂的存儲與表示,網(wǎng)絡(luò)音樂的發(fā)展與特征。
第3章網(wǎng)絡(luò)音樂的分類與推薦基礎(chǔ)。介紹了音樂信息檢索的幾大要素,音樂不同維度的分類方式,網(wǎng)絡(luò)音樂自動分類與推薦的研究現(xiàn)狀。
第4章機器學習中的分類與推薦算法。介紹了機器學習中的分類算法,主要包括樸素貝葉斯、決策樹、K-近鄰、支持向量機和人工神經(jīng)網(wǎng)絡(luò),具體介紹了每種算法的概念、原理及學習過程,介紹了機器學習中的推薦方法,包括基于內(nèi)容的推薦、協(xié)同過濾推薦、基于馬爾可夫模型的推薦和混合推薦,具體介紹了每種推薦方法的原理及優(yōu)缺點,以及推薦算法評價指標。
第5章基于支持向量機的音樂流派分類,提出了一種基于SVM分類器的音樂流派自動分類方法。該方法在特征選擇的過程中將過濾式特征選擇(Relif F) 法和封裝式特征選擇(SFS) 算法兩種算法結(jié)合在一起,結(jié)合SVM分類器進行音樂流派分類,可以獲得較高的分類準確率以及計算效率。
第6章基于K-近鄰的音樂流派自動分類,提出了一種DW-KNN算法進行音樂流派自動分類。該算法在傳統(tǒng)KNN算法上進行了兩方面的改進,可以有效地解決傳統(tǒng)KNN算法在分類過程中忽略屬性與類別的相關(guān)程度的問題,以及在類別判斷過程中只考慮近鄰樣本的個數(shù)而忽略了近鄰樣本與待分類樣本之間存在的相似性差異的問題。
第7章基于社交網(wǎng)絡(luò)與協(xié)同過濾的推薦算法,提出了一種將社交網(wǎng)絡(luò)與協(xié)同過濾相結(jié)合的音樂推薦算法,該算法將社交網(wǎng)絡(luò)中社交關(guān)系屬性融入了推薦系統(tǒng)中,彌補了傳統(tǒng)的協(xié)同過濾中沒有考慮社交屬性的缺陷,可以有效緩解無歷史行為數(shù)據(jù)用戶的冷啟動問題。
第8章基于用戶即時興趣的推薦算法,提出了一種基于用戶即時興趣的歌曲推薦算法,該算法基于用戶的即時行為進行在線推薦,將一階馬爾可夫模型與協(xié)同過濾推薦思想相結(jié)合,構(gòu)造歌曲間的轉(zhuǎn)移概率矩陣用于生成推薦,同時考慮了時間因素對推薦結(jié)果的影響。
最后,值此書稿完成之際謹向所有給予我?guī)椭呐笥押图胰吮硎局孕牡母兄x!感謝機械工業(yè)出版社為本書付出不懈努力的工作人員和相關(guān)人士,是你們的專業(yè)使得本書順利出版!感謝朋友們提供無私的支持和幫助,與你們的探討與交流總是不斷地給我啟發(fā)和激勵!感謝家人對我的支持、理解、包容和鼓勵,你們無私的愛給予我最大的支持和動力!最后特別感謝我的女兒暄暄,感謝你在媽媽整天埋頭寫書沒有太多時間陪伴你的情況下,仍然最愛媽媽。寶貝,媽媽也最愛你!
吳梅梅
吳梅梅(1980—),工學博士,中國傳媒大學數(shù)據(jù)科學與智能媒體學院副教授,碩士生導師。長期致力于大數(shù)據(jù)分析、機器學習算法及網(wǎng)絡(luò)新媒體技術(shù)研究。近年來主持并參與了多項和省部級研究課題,發(fā)表過多篇SCI、EI論文,并擁有多項發(fā)明專利。
前言
第1章 機器學習簡介1
。.1 機器學習的概念1
。.2 機器學習的發(fā)展2
1.3 機器學習的研究現(xiàn)狀3
1.3.1 傳統(tǒng)機器學習的研究現(xiàn)狀4
1.3.2 大數(shù)據(jù)環(huán)境下機器學習的研究現(xiàn)狀5
。.4 機器學習的分類5
1.4.1 有監(jiān)督學習6
。.4.2 無監(jiān)督學習7
1.4.3 半監(jiān)督學習8
1.4.4 強化學習9
1.5 本章小結(jié)11
第2章 音樂、數(shù)字音樂與網(wǎng)絡(luò)音樂12
。.1 音樂的藝術(shù)形式12
。.2 音樂的產(chǎn)生及發(fā)展14
。.3 音樂的要素15
。.4 音樂的存儲與表示17
2.4.1 數(shù)字音樂及其特點17
2.4.2 數(shù)字音樂文件的特點和格式19
。.5 網(wǎng)絡(luò)音樂的發(fā)展20
。.6 網(wǎng)絡(luò)音樂的特征22
2.7 本章小結(jié) 23
第3章 網(wǎng)絡(luò)音樂的分類與推薦基礎(chǔ) 24
。.1 基于內(nèi)容的音樂信息檢索24
3.1.1 音高與旋律25
3.1.2 音樂節(jié)奏26
。.1.3 音樂和聲 28
。.2 音樂的分類 29
3.2.1 按表達方式分類 30
。.2.2 按旋律風格分類 31
。.2.3 從音樂的歷史角度分類 32
3.2.4 按音樂流派分類 36
。.3 網(wǎng)絡(luò)音樂的自動分類 40
3.4 網(wǎng)絡(luò)音樂推薦算法綜述 42
。.5 本章小結(jié) 44
第4章 機器學習中的分類與推薦算法 45
。.1 樸素貝葉斯 45
。.2 決策樹 47
。.3 k ̄近鄰 50
。.4 支持向量機 51
4.5 人工神經(jīng)網(wǎng)絡(luò) 53
。.6 基于內(nèi)容的推薦 57
4.7 協(xié)同過濾推薦 60
。.8 基于馬爾可夫模型的推薦 62
。.9 混合推薦64
。.10 推薦算法評價 64
。.11 本章小結(jié) 66
第5章 基于支持向量機的音樂流派分類 67
。.1 音樂的數(shù)字描述 68
5.2 特征提取 70
。.2.1 數(shù)據(jù)預處理 71
。.2.2 聲學特征量 72
5.3 特征選擇77
。.3.1 ReliefF78
5.3.2 順序前進法79
5.3.3。遥澹欤椋澹妫婆cSFS相結(jié)合的特征選擇算法80
。.4。樱郑头诸惼鳎福
5.4.1 線性可分支持向量機82
5.4.2 線性支持向量機83
5.4.3 非線性支持向量機85
5.4.4 數(shù)值求解87
5.4.5 ReliefF-SFSSVM分類實現(xiàn)88
。.5 實驗結(jié)果與分析88
5.5.1 實驗工具88
。.5.2 數(shù)據(jù)集89
5.5.3 評價標準及驗證方法89
。.5.4 實驗方法89
。.5.5 實驗結(jié)果及分析90
。.6 可擴展性分析94
。.7 本章小結(jié)95
第6章 基于k-近鄰的音樂流派自動推薦分類96
。.1 k-近鄰算法的理論基礎(chǔ)96
。.1.1。-近鄰算法96
6.1.2 k-近鄰算法模型97
。.2 算法的實現(xiàn)步驟及復雜度分析99
6.3。模-KNN算法99
6.3.1。耍危嗡惴ǖ母倪M100
6.3.2 二次加權(quán)KNN (DW-KNN)分類算法102
。.4 實驗結(jié)果與分析103
。.4.1 實驗方法103
6.4.2 實驗結(jié)果及分析104
。.5 可擴展性分析107
。.6。遥澹欤椋澹妫-SFSSVM與DW-KNN的對比108
。.7 本章小結(jié)108
第7章 基于社交網(wǎng)絡(luò)與協(xié)同過濾的音樂推薦110
。.1 協(xié)同過濾推薦算法110
7.1.1 基于用戶的協(xié)同過濾推薦算法111
。.1.2 基于項目的協(xié)同過濾推薦算法111
7.1.3 基于用戶與基于項目的協(xié)同過濾推薦算法比較112
。.1.4 協(xié)同過濾中存在的問題113
。.2。樱椋恚遥幔睿胨惴ǎ保保
。.2.1。樱椋恚遥幔睿胨惴ㄋ枷耄保保
7.2.2。樱椋恚遥幔睿胨惴鞒蹋保保
7.3 社交網(wǎng)絡(luò)的形成機制與表示方法116
7.4 構(gòu)建用戶的信任集合進行推薦116
7.5 實驗結(jié)果及分析118
7.5.1 數(shù)據(jù)獲取和數(shù)據(jù)集118
。.5.2 評價指標119
。.5.3 實驗結(jié)果分析120
7.6 本章小結(jié)121
第8章 基于用戶即時興趣的音樂推薦96
。.1 相關(guān)研究122
8.2 馬爾可夫模型理論基礎(chǔ)123
。.3 基于用戶即時行為的改進一階馬爾可夫音樂推薦模型124
。.3.1 問題描述124
。.3.2 指數(shù)衰減125
。福常场≈笖(shù)衰減的馬爾可夫模型125
。.3.4 協(xié)同過濾的一階馬爾可夫推薦126
。.4 實驗結(jié)果與分析129
。.5 可擴展性分析131
。.6 本章小結(jié)131
附錄132
附錄A ReliefF-SFSSVM分類參考代碼132
附錄B。模-KNN算法參考代碼134
附錄C 各分類算法的比較參考代碼140
參考文獻 145