在金融領(lǐng)域中,時(shí)間序列是非常重要的一種數(shù)據(jù)類型,例如證券市場(chǎng)中的股票價(jià)格和交易量、外匯市場(chǎng)上的匯率、期貨和黃金的交易價(jià)格等,這些數(shù)據(jù)都形成了持續(xù)不斷的時(shí)間序列。金融市場(chǎng)中的時(shí)間序列主要使用基礎(chǔ)分析和技術(shù)分析方法進(jìn)行分析,這兩種方法使用簡(jiǎn)單,但是無法對(duì)數(shù)據(jù)中隱含的更深層次的規(guī)律和特征進(jìn)行挖掘。數(shù)理統(tǒng)計(jì)分析方法是目前金融時(shí)間序列分析中比較常用的方法,隨著數(shù)據(jù)量的不斷增加,這種方法的分析能力存在一定的缺陷,各種數(shù)理統(tǒng)計(jì)分析方法都無法有效地處理較大規(guī)模的數(shù)據(jù)集,也不適合從大量數(shù)據(jù)中主動(dòng)地發(fā)現(xiàn)各種潛在的規(guī)則。因此面對(duì)金融行業(yè)不斷涌現(xiàn)的海量數(shù)據(jù),需要尋找新的數(shù)據(jù)分析和挖掘的方法。
《金融時(shí)間序列的分析與挖掘》將數(shù)據(jù)挖掘技術(shù)運(yùn)用到金融時(shí)間序列研究中,使用關(guān)聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法對(duì)金融時(shí)間序列中的隱含模式進(jìn)行挖掘,本文的創(chuàng)新點(diǎn)主要基于以下幾個(gè)方面:
(1)針對(duì)金融時(shí)間序列需要保留形態(tài)特征與趨勢(shì)特征的特點(diǎn),提出了適合金融時(shí)間序列的多層次極值點(diǎn)分段表示法(MEPS),此方法能在多個(gè)層次上很大限度地保留關(guān)鍵特征點(diǎn)信息,從而能更好地捕捉和表示時(shí)間序列的形態(tài)和走勢(shì)。
。2)針對(duì)金融時(shí)間序列需要保留形態(tài)特征與趨勢(shì)特征的特點(diǎn),在MEPS算法的基礎(chǔ)上提出了分層的動(dòng)態(tài)時(shí)間彎曲相似性度量方法(HDTW)及其改進(jìn)方法IHDTW,將時(shí)間序列在不同層次上進(jìn)行分段,然后計(jì)算對(duì)應(yīng)分段層次中子序列間的相似性,最后匯總得到序列間的相似度,在算法中對(duì)動(dòng)態(tài)時(shí)間彎曲算法(DTW)進(jìn)行了改進(jìn),并且考慮到了分層的均勻因素及趨勢(shì)因素,實(shí)驗(yàn)結(jié)果證明能大大提高相似性度量的效果和效率。
(3)金融市場(chǎng)的運(yùn)行非常復(fù)雜,其中人的因素也非常重要,為了在金融時(shí)間序列挖掘的過程中更好地體現(xiàn)用戶的實(shí)際需求,提出了基于事件的時(shí)間序列相似性度量方法(SMBE),此算法通過對(duì)事件的定義引入用戶在相似性度量時(shí)的偏好與需求,并設(shè)計(jì)了基于SMBE的層次聚類算法,完全以事件的相似性為中心進(jìn)行聚類,定義了類間相似度和類間一般距離兩個(gè)參數(shù),并以它們之間的比較作為判斷類間距離的依據(jù),使得時(shí)間序列相似性度量及其聚類的結(jié)果更加符合實(shí)際金融市場(chǎng)的狀態(tài)與需求。
在金融領(lǐng)域中,時(shí)間序列是非常重要的一種數(shù)據(jù)類型,例如證券市場(chǎng)中的股票價(jià)格和交易量、外匯市場(chǎng)上的匯率、期貨和黃金的交易價(jià)格等,這些數(shù)據(jù)都形成了持續(xù)不斷的時(shí)間序列。金融市場(chǎng)中的時(shí)間序列主要使用基礎(chǔ)分析和技術(shù)分析方法進(jìn)行分析,這兩種方法使用簡(jiǎn)單,但是無法對(duì)數(shù)據(jù)中隱含的更深層次的規(guī)律和特征進(jìn)行挖掘。數(shù)理統(tǒng)計(jì)分析方法是目前金融時(shí)間序列分析中比較常用的方法,隨著數(shù)據(jù)量的不斷增加,這種方法的分析能力存在一定的缺陷,各種數(shù)理統(tǒng)計(jì)分析方法都無法有效地處理較大規(guī)模的數(shù)據(jù)集,也不適合從大量數(shù)據(jù)中主動(dòng)地發(fā)現(xiàn)各種潛在的規(guī)則。因此面對(duì)金融行業(yè)不斷涌現(xiàn)的海量數(shù)據(jù),需要尋找新的數(shù)據(jù)分析和挖掘的方法。本書將數(shù)據(jù)挖掘技術(shù)運(yùn)用到金融時(shí)間序列研究中,使用關(guān)聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法對(duì)金融時(shí)間序列中的隱含模式進(jìn)行挖掘,本文的創(chuàng)新點(diǎn)主要基于以下幾個(gè)方面:
。1)針對(duì)金融時(shí)間序列需要保留形態(tài)特征與趨勢(shì)特征的特點(diǎn),提出了適合金融時(shí)間序列的多層次極值點(diǎn)分段表示法(MEPS),此方法能在多個(gè)層次上最大限度地保留關(guān)鍵特征點(diǎn)信息,從而能更好地捕捉和表示時(shí)間序列的形態(tài)和走勢(shì)。
。2)針對(duì)金融時(shí)間序列需要保留形態(tài)特征與趨勢(shì)特征的特點(diǎn),在MEPS算法的基礎(chǔ)上提出了分層的動(dòng)態(tài)時(shí)間彎曲相似性度量方法(HDTW)及其改進(jìn)方法IHDTW,將時(shí)間序列在不同層次上進(jìn)行分段,然后計(jì)算對(duì)應(yīng)分段層次中子序列間的相似性,最后匯總得到序列間的相似度,在算法中對(duì)動(dòng)態(tài)時(shí)間彎曲算法(DTW)進(jìn)行了改進(jìn),并且考慮到了分層的均勻因素及趨勢(shì)因素,實(shí)驗(yàn)結(jié)果證明能大大提高相似性度量的效果和效率。
(3)金融市場(chǎng)的運(yùn)行非常復(fù)雜,其中人的因素也非常重要,為了在金融時(shí)間序列挖掘的過程中更好地體現(xiàn)用戶的實(shí)際需求,提出了基于事件的時(shí)間序列相似性度量方法(SMBE),此算法通過對(duì)事件的定義引入用戶在相似性度量時(shí)的偏好與需求,并設(shè)計(jì)了基于SMBE的層次聚類算法,完全以事件的相似性為中心進(jìn)行聚類,定義了類間相似度和類間一般距離兩個(gè)參數(shù),并以它們之間的比較作為判斷類間距離的依據(jù),使得時(shí)間序列相似性度量及其聚類的結(jié)果更加符合實(shí)際金融市場(chǎng)的狀態(tài)與需求。
第一章 引言
第一節(jié) 金融市場(chǎng)信息化的發(fā)展
第二節(jié) 金融市場(chǎng)的傳統(tǒng)分析方法
一、基礎(chǔ)分析與技術(shù)分析
二、數(shù)理統(tǒng)計(jì)分析
第三節(jié) 數(shù)據(jù)挖掘技術(shù)的興起與發(fā)展
第四節(jié) 本書的研究目的與內(nèi)容
一、本書的研究對(duì)象
二、本書的研究?jī)?nèi)容
第二章 時(shí)間序列數(shù)據(jù)挖掘研究及其應(yīng)用
第一節(jié) 時(shí)間序列的分段與表示
一、基于時(shí)域的分段與表示
二、基于變換域的分段與表示
三、其他方法
第二節(jié) 時(shí)間序列的相似性度量
一、歐式距離
二、動(dòng)態(tài)時(shí)間彎曲距離
三、其他方法
第三節(jié) 時(shí)間序列的關(guān)聯(lián)規(guī)則挖掘
一、關(guān)聯(lián)分析概述
二、時(shí)態(tài)關(guān)聯(lián)規(guī)則挖掘
三、動(dòng)態(tài)關(guān)聯(lián)規(guī)則挖掘
第四節(jié) 時(shí)間序列的聚類分析
一、時(shí)間序列的模式發(fā)現(xiàn)與聚類
二、數(shù)據(jù)流聚類
第五節(jié) 時(shí)間序列挖掘在金融行業(yè)的應(yīng)用
第三章 金融時(shí)間序列的分段與表示
第一節(jié) 時(shí)間序列的分段與表示方法
第二節(jié) 金融時(shí)間序列的特性
第三節(jié) 基于重要極值點(diǎn)特征的分段表示法
一、絕對(duì)極值點(diǎn)分段表示法
二、均勻極值點(diǎn)分段表示法
三、多層次極值點(diǎn)分段表示法
四、距離的度量
第四節(jié) 三種極值點(diǎn)分段法的實(shí)驗(yàn)對(duì)比與分析
一、實(shí)驗(yàn)對(duì)比方案與框架
二、實(shí)驗(yàn)結(jié)果分析與評(píng)價(jià)
第五節(jié) 本章小結(jié)
第四章 金融時(shí)間序列的相似性度量
第一節(jié) 時(shí)間序列的相似性度量方法
一、歐式距離
二、動(dòng)態(tài)時(shí)間彎曲距離
三、最長(zhǎng)公共子串
第二節(jié) 分層的動(dòng)態(tài)時(shí)間彎曲相似性度量方法
一、分層動(dòng)態(tài)時(shí)間彎曲相似性度量(HDTW)算法的主要思想
二、分層動(dòng)態(tài)時(shí)間彎曲相似性度量(HDTW)算法的具體描述
三、DTW算法與HDTW算法的實(shí)驗(yàn)對(duì)比與分析
第三節(jié) 改進(jìn)的分層動(dòng)態(tài)時(shí)間彎曲相似性度量方法
一、對(duì)HDTW算法改進(jìn)的主要思想
二、對(duì)HTDW算法的具體改進(jìn)方法
三、改進(jìn)的HTDW算法(IHDTW)的具體描述
四、HTDW算法與IHDTW算法的實(shí)驗(yàn)對(duì)比與分析
第四節(jié) 基于事件的時(shí)間序列相似性度量方法
一、相關(guān)定義
二、基于事件的時(shí)間序列相似性度量(SMBE)算法的具體描述
三、DTW算法與SMBE算法的實(shí)驗(yàn)對(duì)比與分析
第五節(jié) 本章小結(jié)
第五章 金融時(shí)間序列的關(guān)聯(lián)規(guī)則分析
第一節(jié) 關(guān)聯(lián)規(guī)則的基本知識(shí)
一、關(guān)聯(lián)規(guī)則的基本概念
二、時(shí)間序列關(guān)聯(lián)規(guī)則分析
三、關(guān)聯(lián)規(guī)則的方法
第二節(jié) 基于0-Aproiri算法的多元時(shí)間序列跨事務(wù)關(guān)聯(lián)規(guī)則挖掘
一、0-Apriori算法的相關(guān)定義與具體描述
二、基于可變支持度的0-Apriori算法
三、0-Apriori算法在時(shí)間序列跨事務(wù)關(guān)聯(lián)分析中的應(yīng)用
四、0-Apriori算法與VSO-Apriori算法的實(shí)驗(yàn)對(duì)比與分析
第三節(jié) 基于滑動(dòng)挖掘區(qū)間的動(dòng)態(tài)關(guān)聯(lián)規(guī)則挖掘算法
一、算法的主要思想與具體描述
二、在多元時(shí)間序列關(guān)聯(lián)分析中的應(yīng)用
三、SI-DARM算法和DSAT算法的實(shí)驗(yàn)對(duì)比與分析
第四節(jié) 本章小結(jié)
第六章 金融時(shí)間序列的聚類分析
第一節(jié) 聚類方法介紹
一、K均值聚類算法
二、層次聚類算法
三、基于SNN密度的聚類
第二節(jié) 基于改進(jìn)的分層動(dòng)態(tài)時(shí)間彎曲技術(shù)的聚類
一、基于IHDTW的聚類算法的主要思想
二、基于IHDTW的聚類算法的具體描述
三、基于IHDTW的聚類算法的實(shí)驗(yàn)分析與評(píng)價(jià)
第三節(jié) 基于事件相似性度量的層次聚類
一、基于SMBE的層次聚類算法的具體描述
二、基于SMBE的層次聚類算法的實(shí)驗(yàn)分析與評(píng)價(jià)
第四節(jié) 基于形態(tài)特征的數(shù)據(jù)流聚類
一、基于形態(tài)特征的數(shù)據(jù)流聚類算法的主要思想
二、初始化階段
三、在線更新階段
四、用戶觸發(fā)的聚類
五、實(shí)驗(yàn)分析與評(píng)價(jià)
第五節(jié) 本章小結(jié)
第七章 金融股票時(shí)間序列的預(yù)測(cè)
第一節(jié) 預(yù)測(cè)算法描述
一、股票時(shí)間序列的價(jià)格區(qū)間預(yù)測(cè)
二、股票時(shí)間序列的短期趨勢(shì)預(yù)測(cè)
第二節(jié) 股票時(shí)間序列的預(yù)測(cè)實(shí)例
一、股票數(shù)據(jù)集
二、股票時(shí)間序列價(jià)格的預(yù)測(cè)
三、股票時(shí)間序列短期趨勢(shì)的預(yù)測(cè)
第三節(jié) 股票時(shí)間序列的預(yù)測(cè)效果評(píng)價(jià)
第四節(jié) 本章小結(jié)
第八章 結(jié)論
參考文獻(xiàn)
附錄