久久国产精品久久久久久,狠狠色噜噜狠狠狠狠五月婷,欧美又粗又大aaaaa在线公司

本書介紹在嵌入式系統(tǒng)中的機(jī)器學(xué)習(xí)算法優(yōu)化原理、設(shè)計(jì)方法及其實(shí)現(xiàn)技術(shù)。內(nèi)容涵蓋通用嵌入式優(yōu)化技術(shù)，包括基于SIMD指令集的優(yōu)化、內(nèi)存訪問模式優(yōu)化、參數(shù)量化等。并在此基礎(chǔ)上介紹了信號(hào)處理層面的優(yōu)化，包括AI推理算法及基于神經(jīng)網(wǎng)絡(luò)的AI算法訓(xùn)練-推理聯(lián)合的優(yōu)化理論與方法。其中信號(hào)處理層面優(yōu)化包括了基于線性代數(shù)的快速近似算法、基于多項(xiàng)式的快速卷積構(gòu)造技術(shù)、基于數(shù)據(jù)二進(jìn)制結(jié)構(gòu)的快速乘法算法等；在AI推理層面，介紹了機(jī)器學(xué)習(xí)推理模型共性結(jié)構(gòu)、運(yùn)算圖中各個(gè)算子的計(jì)算優(yōu)化途徑；另外對(duì)基于神經(jīng)網(wǎng)絡(luò)AI算法，闡述了如何將推理階段的運(yùn)算量約束以及底層數(shù)據(jù)量化約束加入訓(xùn)練代價(jià)函數(shù)，從算法訓(xùn)練端減少運(yùn)算量以提升AI嵌入式系統(tǒng)的運(yùn)行效率；此外本書還通過多個(gè)自動(dòng)搜索優(yōu)化參數(shù)并生成C代碼的例子介紹了通用的嵌入式環(huán)境下機(jī)器學(xué)習(xí)算法自動(dòng)優(yōu)化和部署工具開發(fā)的基本知識(shí)；本書通過應(yīng)用例子和大量代碼說明AI算法在通用嵌入式系統(tǒng)中的實(shí)現(xiàn)方法，力求讓讀者在理解算法的基礎(chǔ)上，通過實(shí)踐掌握高效的AI嵌入式系統(tǒng)開發(fā)的知識(shí)與技能。

隨著人工智能（AI）技術(shù)在各個(gè)行業(yè)的普及，將AI技術(shù)和嵌入式系統(tǒng)相結(jié)合，構(gòu)建AI嵌入式系統(tǒng)成為當(dāng)前技術(shù)熱點(diǎn)之一。本書介紹AI領(lǐng)域多種機(jī)器學(xué)習(xí)算法在嵌入式系統(tǒng)上的底層實(shí)現(xiàn)和優(yōu)化技術(shù)�，F(xiàn)在很多機(jī)器學(xué)習(xí)算法基于海量存儲(chǔ)和運(yùn)算，對(duì)功耗、體積、計(jì)算能力和存儲(chǔ)容量有較高要求，而不同領(lǐng)域的嵌入式系統(tǒng)受限于各自的應(yīng)用需求，難以滿足所有條件。目前在嵌入式系統(tǒng)中實(shí)現(xiàn)復(fù)雜機(jī)器學(xué)習(xí)算法有多條途徑，包括基于通用GPU多處理器架構(gòu)的方案、基于專用運(yùn)算加速引擎的定制化方案，以及基于現(xiàn)有處理器對(duì)算法進(jìn)行深度優(yōu)化的方案等。這些技術(shù)方案各有優(yōu)缺點(diǎn)，并且在不同領(lǐng)域得到了應(yīng)用�；贕PU的通用多處理器架構(gòu)的方案通用性強(qiáng)、算力高，但代價(jià)是硬件成本高、功耗大�；趯Ｓ眠\(yùn)算加速引擎的定制化方案運(yùn)算效率高，功耗可控，但運(yùn)算結(jié)構(gòu)相對(duì)固定，靈活性差�；诂F(xiàn)有處理器對(duì)算法進(jìn)行深度優(yōu)化的方案成本低，不需要專用或者定制化硬件，通用性強(qiáng)，但代價(jià)是需要手動(dòng)對(duì)各案例逐個(gè)進(jìn)行優(yōu)化，開發(fā)難度高。本書中關(guān)注的是基于現(xiàn)有的嵌入式處理器系統(tǒng)和架構(gòu)，通過不同層次的優(yōu)化實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法。雖然書中所介紹的方法以通用嵌入式處理器為例，但也能夠應(yīng)用于GPU或者硬件加速引擎架構(gòu)，比如基于變換域的快速卷積算法在GPU的底層運(yùn)算庫中得到應(yīng)用，基于加減圖的常數(shù)乘法運(yùn)算能夠方便地在芯片硬件設(shè)計(jì)中實(shí)現(xiàn)。

機(jī)器學(xué)習(xí)涉及多個(gè)不同領(lǐng)域的算法，其中包括基于統(tǒng)計(jì)學(xué)習(xí)的方法和基于神經(jīng)網(wǎng)絡(luò)的方法�；诮y(tǒng)計(jì)學(xué)習(xí)的算法理論模型設(shè)計(jì)精巧，泛化性能好，運(yùn)算量相對(duì)較低，容易在存儲(chǔ)量和運(yùn)算量受限的嵌入式系統(tǒng)中實(shí)現(xiàn)，但它依賴較強(qiáng)的概率假設(shè)，模型上的偏差限制了它在實(shí)際應(yīng)用中的性能。近年來，隨著GPU算力的增加以及海量標(biāo)注數(shù)據(jù)的積累，基于神經(jīng)網(wǎng)絡(luò)的灰盒式機(jī)器學(xué)習(xí)算法得到應(yīng)用，神經(jīng)網(wǎng)絡(luò)訓(xùn)練使用反向梯度傳播算法，能夠自動(dòng)地從訓(xùn)練數(shù)據(jù)中學(xué)到特征提取方法，擺脫人工特征設(shè)計(jì)的效率約束。很多現(xiàn)有神經(jīng)網(wǎng)絡(luò)性能優(yōu)越，但龐大的參數(shù)存儲(chǔ)量限制了其在嵌入式系統(tǒng)上的實(shí)現(xiàn)。近年來的研究發(fā)現(xiàn)，很多神經(jīng)網(wǎng)絡(luò)架構(gòu)中存在大量冗余的運(yùn)算和參數(shù)，通過運(yùn)算的簡化和架構(gòu)裁剪能夠大大降低神經(jīng)網(wǎng)絡(luò)對(duì)計(jì)算性能和內(nèi)存的需求，使得在嵌入式系統(tǒng)上實(shí)現(xiàn)它成為可能。本書中討論的內(nèi)容覆蓋基于統(tǒng)計(jì)學(xué)習(xí)和基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法在嵌入式系統(tǒng)上的實(shí)現(xiàn)，通過算法和例程介紹具體的優(yōu)化手段。

書中給出了通過詳細(xì)的手工優(yōu)化步驟以說明嵌入式機(jī)器學(xué)習(xí)算法的優(yōu)化過程，但隨著機(jī)器學(xué)習(xí)算法復(fù)雜度的增加和規(guī)模的擴(kuò)大，手動(dòng)優(yōu)化效率顯得較低。對(duì)部分優(yōu)化過程，我們給出了軟件輔助優(yōu)化的介紹，比如通過軟件自動(dòng)搜索加減圖實(shí)現(xiàn)多常數(shù)乘法，使用軟件控制神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程，消除網(wǎng)絡(luò)參數(shù)和架構(gòu)上的冗余，以及通過軟件自動(dòng)從訓(xùn)練得到的模型中提取參數(shù)并自動(dòng)生成C語言源代碼。讀者可以基于這些代碼進(jìn)一步拓展，構(gòu)建自動(dòng)化的嵌入式機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)工具。在撰寫本書期間，出現(xiàn)了多種嵌入式機(jī)器學(xué)習(xí)算法框架和算法部署工具，大大提高了機(jī)器學(xué)習(xí)算法在嵌入式系統(tǒng)中的部署效率。從長遠(yuǎn)看，使用更高層的機(jī)器學(xué)習(xí)算法來訓(xùn)練和優(yōu)化當(dāng)前機(jī)器學(xué)習(xí)算法會(huì)是研究趨勢(shì)。

書中介紹的部分底層算法代碼以Python語言形式給出，這考慮了Python語言的表達(dá)能力和程序簡潔性，在實(shí)際應(yīng)用中需要讀者在理解算法原理的基礎(chǔ)上改成C程序?qū)崿F(xiàn)。另外，書中列舉的機(jī)器學(xué)習(xí)問題集中在基本的手寫識(shí)別數(shù)據(jù)或者簡單圖像分類問題上，選擇這些機(jī)器學(xué)習(xí)問題，是考慮到它們的訓(xùn)練速度快，模型構(gòu)建代碼量小，能夠在有限篇幅內(nèi)解釋清楚，但所介紹的方法能夠應(yīng)用于更復(fù)雜的機(jī)器學(xué)習(xí)算法和模型。

機(jī)器學(xué)習(xí)涉及建模、訓(xùn)練和推理這幾個(gè)部分，本書的重點(diǎn)在于嵌入式系統(tǒng)中的機(jī)器學(xué)習(xí)算法推理過程的實(shí)現(xiàn)，對(duì)機(jī)器學(xué)習(xí)本身的理論模型介紹相對(duì)較少，因此需要讀者在閱讀之前了解基本的機(jī)器學(xué)習(xí)算法知識(shí)。另外，要掌握本書介紹的近似算法，需要讀者提前了解一些線性代數(shù)的知識(shí)。

本書的撰寫工作得到了Arm中國大學(xué)計(jì)劃的幫助和支持，在此表示感謝！

應(yīng)忍冬

2021年6月于上海

你還可能感興趣

我要評(píng)論