一個萬物互聯(lián)的數(shù)字化世界正在悄然形成,不知不覺中,我們已經(jīng)進入到了一個前所未有的數(shù)字化與智能化時代。
數(shù)智化時代對人類社會的改變是顛覆性的。半導體芯片技術的突飛猛進,使得萬物皆可“數(shù)”;寬帶泛在網(wǎng)絡的普及應用,使得萬物皆可“連”;云計算(算力)與人工智能(算法)的并行發(fā)展,使得萬事皆可“算”。數(shù)據(jù)已成為新的生產(chǎn)要素,算法和算力已成為新的生產(chǎn)動力,機器智能將成為新的生產(chǎn)工具,數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字生活和數(shù)字治理都將成為智能革命廣闊的主戰(zhàn)場。我們該如何認識并適應這個時刻變化中的世界?
《圖解數(shù)據(jù)智能》是一本為數(shù)字資源的對接方、分配方以及廣大的入門學習者提供相關數(shù)據(jù)智能概念的科普讀物。書中各個概念之間相對獨立,讀者可以將其作為一本檢索用的工具書籍,也可以根據(jù)自己的興趣靈活查閱相關篇章。
無論你是數(shù)智化領域的專業(yè)從業(yè)人員,還是剛剛畢業(yè)想要進入該領域的技術小白,抑或是正面臨著數(shù)字化轉型的政府或企業(yè)人員,或者是千千萬萬個生活在這個數(shù)智化社會中的普通人,都可以閱讀此書,你將從酣暢淋漓的技術釋疑和輕松有趣的漫畫解讀中,找到自己的答案。
這是一本人人都能讀懂、趣味十足的技術科普書。
近百個核心技術概念,為你深度解讀數(shù)據(jù)智能時代背后的邏輯。
酣暢淋漓的技術釋義,輕松有趣的漫畫解讀,帶你輕松認知這個時刻變化中的世界
1、通俗易懂
生動鮮活的生活示例+幽默風趣的行文插畫,對數(shù)據(jù)智能領域的核心概念進行演繹呈現(xiàn)。
2、技術科普
近百個數(shù)據(jù)智能概念,高頻、熱門、有用,助你快速掃除對數(shù)據(jù)智能時代的認知障礙。
3、貼近時代、貼近應用
所有技術概念均來自當前數(shù)字化生活中你每天能聽到/看到/刷到/聊到的詞匯,掌握這些概念,便能輕松暢游數(shù)據(jù)智能世界。
本書適合——
想進入數(shù)據(jù)智能領域的技術小白
面臨數(shù)字化轉型的政府及企業(yè)人員
技術功底薄弱的產(chǎn)品經(jīng)理/市場營銷人員/……
千千萬萬個處于數(shù)智化時代中的普通人
幾十年前的我們可能無法相信,我們生活在一個多么令人難以置信的時代。互聯(lián)網(wǎng)的飛速發(fā)展讓我們以光速躍進了信息時代,信息大爆炸又讓我們跌入了大數(shù)據(jù)時代,緊接著大數(shù)據(jù)等新一代信息技術的進一步發(fā)展和應用讓人工智能時代迎面撞來。曾經(jīng)的我們還處在人類棋手被人工智能擊敗的錯愕之中,短短幾年,我們的生活場景就逐漸被人工智能這個新物種占據(jù)。
2021 年10 月28 日,F(xiàn)acebook 宣布將更名為Meta,從此轉向以虛擬現(xiàn)實為主的新興計算平臺。公司CEO 扎克伯格表示,F(xiàn)acebook 數(shù)年內將從“一家社交媒體公司變成一家元宇宙公司”。
一石激起千層浪。業(yè)界在驚呼:“元宇宙”真的要來了嗎?盡管學術界和工業(yè)界半信半疑,但似乎也沒有鮮明的反對聲音。人類社會發(fā)展到今天,人們已經(jīng)開始習慣了科技大佬們的“未卜先知”。今天,我們就奔跑在《未來之路》(比爾·蓋茨,1995)所描繪的信息高速公路上,我們就沉浸在《數(shù)字化生存》(尼古拉·尼葛洛龐帝,1996)所預言的數(shù)字化虛擬空間中。本以為是游戲世界中的場景,沒想到有可能真的要照進人類社會的現(xiàn)實中。
一個萬物互聯(lián)的數(shù)字化世界正在悄然形成,不知不覺中,我們已經(jīng)進入了一個前所未有的數(shù)字化與智能化時代了。
與以往的任何時代都迥然不同,今天的數(shù)智化時代對人類社會的改變將是顛覆性的。我們得益于半導體芯片技術的突飛猛進,使得萬物皆可“數(shù)”;我們得益于寬帶泛在網(wǎng)絡的普及應用,使得萬物皆可“連”;我們得益于云計算(算力)與人工智能(算法)的并行發(fā)展,使得萬事皆可“算”。數(shù)據(jù)已成為新的生產(chǎn)要素,算法和算力已成為新的生產(chǎn)動力,機器智能將成為新的生產(chǎn)工具,數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字生活和數(shù)字治理都將成為智能革命廣闊的主戰(zhàn)場。
一個個橫空出世的新興概念,一場場新概念下的資本狂歡,乃至一瞬間筑起高樓的新興行業(yè)。然而,我們在享受著數(shù)智化時代便利性的同時,也感受到了技術飛速演進所帶來的困惑及裹挾。我們仿佛剛剛理解了什么是“信息化”,它就升級為了“數(shù)字化”,剛剛才適應了“智能化”社會,現(xiàn)在又面臨著“數(shù)智化”轉型;蛟S我們還未曾意識到,新時代意義下的“數(shù)字鴻溝”并非只存在于代際或城鄉(xiāng)之間,實則廣泛存在于主動的概念創(chuàng)造者(掌握著數(shù)字話語權的知名企業(yè)、大型機構、意見領袖等)與被動的概念接受者(普羅大眾)之間。
面對著這些從新行業(yè)中衍生出的一個個新崗位,被新崗位倒逼出的一個個新專業(yè)……作為普通人,我們到底應該選擇躬身入局還是應等待潮水退盡?
無論你是正面臨著數(shù)字化轉型的政府或企業(yè)相關負責人,還是數(shù)智化領域的專業(yè)從業(yè)人員,抑或是剛剛畢業(yè)想要進入該領域的技術小白,或者是我們千千萬萬生活在這個數(shù)智化社會中的普通人。我們都面臨著一個亟需解決的迫切問題:我們應該如何認識并適應如今所處的這個時刻變化中的世界。
在世界百年未有之大變局的今日,這既是巨大的機遇,也意味著艱難的挑戰(zhàn)。在面對未知的恐懼時,本書或可稍稍弭平我們與這些專業(yè)技術之間的數(shù)字鴻溝,幫助我們形成在數(shù)智化時代下尋求問題解決路徑的專業(yè)化思維模式,讓新技術更好地服務于我們的美好生活,而非成為被模糊不清的技術概念操縱的提線木偶。
這也正是我們編著本書的初衷,一方面是為了向政府或者企業(yè)中的非專業(yè)人士科普數(shù)據(jù)智能的相關概念,促進專業(yè)與非專業(yè)人士之間實現(xiàn)更高效、順暢的溝通協(xié)作;另一方面也為即將踏出校門的高校畢業(yè)生們打開數(shù)據(jù)智能領域的大門,畢竟數(shù)智化思維已逐漸成為我們生活和工作中的必備思維。
如上所述,《圖解數(shù)據(jù)智能》是一本為數(shù)字資源的對接方、分配方以及廣大的入門學習者提供相關數(shù)據(jù)智能概念的科普讀物。書中各個概念之間相對獨立,讀者可以將其作為一本檢索用的工具書籍,也可以根據(jù)自己的興趣靈活查閱相關篇章。作為本書的編著團隊,我們基于在零點有數(shù)從事相關領域工作的有限經(jīng)驗,借助數(shù)智化視野,以“數(shù)據(jù)”“算力”“算法”“技術”和“應用”為主線,為大家將其間涉及的通識性概念進行通俗化的轉譯,并以故事化和漫畫化的事例加以呈現(xiàn),力求將晦澀、專業(yè)的概念深入淺出地呈現(xiàn)給大家。
在本書中,我們分為五個篇章為大家解答如下問題。
一、什么是數(shù)據(jù)?我們經(jīng)常接觸到的數(shù)據(jù)類型有哪些?我們如何對這些數(shù)據(jù)進行處理、存放和計算?
二、什么是算法?算法如何賦予機器以智能(智慧)?為什么算法會存在偏見?我們應該如何讓算法對自己的偏見行為負責?
三、什么是算力?我們該如何提升計算能力,以應對大數(shù)據(jù)的快速增長?
四、新一代信息技術有哪些?它們如何從技術層面徹底顛覆了我們的日常生活?
五、人工智能是如何應用于各行各業(yè),作為普惠科技照亮千家萬戶,甚至成為各國必爭之地的?
張燕玲,四川大學文學碩士,零點有數(shù)營銷總監(jiān),歷任研究總監(jiān),具有10余年數(shù)據(jù)研究工作經(jīng)驗,兩次榮獲中國市場研究行業(yè)專業(yè)論文“寶潔獎”一等獎,發(fā)表文章數(shù)百篇。在推動數(shù)據(jù)智能和算法產(chǎn)業(yè)應用的科普傳播方面具有豐富經(jīng)驗。
許正軍,博士,高級通信工程師,零點有數(shù)技術副總裁。從事信息通信技術、互聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、“互聯(lián)網(wǎng)+政務服務”和數(shù)據(jù)智能行業(yè)應用開發(fā)20余年,在各類學術刊物上發(fā)表過40多篇論文。在數(shù)字政府、數(shù)字社會和數(shù)字經(jīng)濟建設領域具有豐富的理論與實踐經(jīng)驗。
張軍,中國人民大學經(jīng)濟學碩士,零點有數(shù)董事、首席執(zhí)行官,兼任中國信息協(xié)會市場研究業(yè)分會(CMRA)副會長、歐洲民意與市場研究協(xié)會(ESOMAR)中國代表、全球移動通信系統(tǒng)協(xié)會(GSMA)評委等職,多年來致力于公共管理和商業(yè)服務領域的數(shù)據(jù)挖掘與咨詢服務。
第1章 算量 /001
本章導讀 /001
大數(shù)據(jù) /004
結構化數(shù)據(jù) /014
非結構化數(shù)據(jù) /021
特征工程 /026
多源數(shù)據(jù) /034
網(wǎng)絡爬蟲 /038
行為數(shù)據(jù) /042
元數(shù)據(jù) /048
數(shù)據(jù)倉庫 /054
集群系統(tǒng) /059
分布式系統(tǒng) /063
中臺 /068
數(shù)據(jù)加密 /076
第2章 算法 /085
本章導讀 /085
人工智能 /089
算法 /096
模糊計算 /103
機器學習 /108
監(jiān)督學習 /111
無監(jiān)督學習 /116
強化學習 /121
人工神經(jīng)網(wǎng)絡 /127
深度學習 /134
集成學習算法 /139
圖像識別 /148
人臉識別 /155
計算機視覺 /158
無人駕駛 /163
開源算法平臺 /168
算法偏見 /173
算法責任 /179
第3章 算力 /184
本章導讀 /184
算力 /186
DPU /192
AI 芯片 /204
云、云計算、云存儲 /213
公有云、私有云、混合云 /223
邊緣計算 /231
第4章 新一代信息技術 /237
本章導讀 /237
新一代信息技術 /239
數(shù)字新基建 /244
5G /252
物聯(lián)網(wǎng) /260
消費互聯(lián)網(wǎng) /268
產(chǎn)業(yè)互聯(lián)網(wǎng) /273
工業(yè)互聯(lián)網(wǎng) /278
IPv6 /284
集成電路 /290
芯片 /296
傳感器 /301
人機交互 /308
下一代操作系統(tǒng) /311
智聯(lián)網(wǎng) /317
AR/VR /323
數(shù)字孿生 /328
第5章 數(shù)字化轉型 /334
本章導讀 /334
網(wǎng)絡強國 /335
數(shù)字中國 /340
智慧城市 /346
城市大腦 /351
數(shù)字底座 /358
數(shù)字化轉型 /362
數(shù)智化 /366
數(shù)字政府 /374
數(shù)字經(jīng)濟 /382
數(shù)字化治理 /387
數(shù)字民生 /391
城市生命體征 /395
智能制造 /400
商業(yè)智能 /405
數(shù)字貨幣 /410
強化學習
【導讀】強化學習、監(jiān)督學習和半監(jiān)督學習屬于機器學習的三個大類。強化學習(Reinforcement Learning)又被稱為再勵學習、評價學習或增強學習,是除了監(jiān)督學習和無監(jiān)督學習之外的第三種機器學習方法。
強化學習指的是機器選擇一個動作用于環(huán)境,環(huán)境接受該動作后狀態(tài)發(fā)生變化,同時產(chǎn)生一個強化信號(獎或懲)反饋給機器,機器根據(jù)強化信號和環(huán)境當前狀態(tài)再選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。
接下來,將圍繞小美養(yǎng)狗的故事,告訴你什么是強化學習,以及強化學習與監(jiān)督學習、無監(jiān)督學習的區(qū)別。
什么是強化學習
小美家里新養(yǎng)了一只寵物小狗狗,但是初來乍到的狗狗并不懂家里的規(guī)矩,于是,小美想要給它訓訓家規(guī)。
此處,我們請把小狗狗看作機器主體,“它不懂家里規(guī)矩”對應強化學習中的“數(shù)據(jù)無標簽,機器在沒有嘗試前不知道什么是對什么是錯!
第一天,狗狗在家里亂尿尿了,小美打了它,并且罰它半天不能吃狗糧。下午,狗狗去廁所尿尿,小美摸了摸它,并且獎勵了狗狗好吃的。不斷循環(huán)往復,狗狗明白了:在廁所尿尿=主人高興+有好吃的;四處在客廳尿尿=主人不開心+會被打一頓+沒有吃的。慢慢地,狗狗再也不會在家里四處亂尿尿了,變成了一只愛干凈的狗狗。
上述例子中的“狗狗在家里亂尿尿了”對應著強化學習中的“行為”,只有有了行為才有行為所對應的外界的反饋,而這個反饋就是“小美打它,并且不給他吃的”。而后面的“狗狗去廁所尿尿后,小美獎勵食物”對應的是強化學習的“(正)強化信號”。
狗狗(機器)在循環(huán)往復地試錯后,明白了什么是對的,什么是錯的,并且不斷地去趨向對的行為,尋求最佳的表現(xiàn)結果。
強化學習與監(jiān)督學習的區(qū)別
可能有人會疑問,感覺強化學習和之前咱們提過的監(jiān)督學習很相似呀,都有一個“訓練導師”。
是的,雖然如此,但不同的是:監(jiān)督學習的數(shù)據(jù)有標簽,通過“帶有答案”的數(shù)據(jù)來訓練(例如,你拎著狗狗,去整個屋子的四處全都走一遍,告訴它這是可以尿尿的,而那里是不可以尿尿的)。
而強化學習的數(shù)據(jù)無標簽,只有嘗試了,才能得到反饋(例如,在客廳尿尿了,被打了;在廁所尿尿,被表揚了,并且獎勵了好吃的),從反饋中,調整之前的行為(狗狗知道了什么是會被表揚的,就會去做,知道了做什么會被打,就不做了),就這樣不斷地調整,機器能夠學習到在什么樣的情況下選擇什么樣的行為可以得到最好的結果(狗狗以后都到廁所去尿尿了)。
強化學習與無監(jiān)督學習的區(qū)別
可能還有人會說,數(shù)據(jù)都是無標簽的,那么強化學習和無監(jiān)督學習不是很像嗎?
不同的是,無監(jiān)督學習是從無標簽的數(shù)據(jù)集中發(fā)現(xiàn)隱藏的結構(例如,狗狗觀察了下家里的環(huán)境,知道了馬桶、垃圾桶和地毯都是圓的,衣柜、電視機、抽屜都是有棱角的)。而強化學習的目標是獲得最大化獎勵的結果(狗狗內心os:我知道在廁所以外的地方尿尿,會被打,在廁所尿尿會被夸,我以后要做一只被獎勵的狗狗)。
總而言之,強化學習就是讓計算機從什么都不懂,通過不斷嘗試,在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,在規(guī)律中學習的一種方法。強化學習的應用很廣泛,無論是日常社交平臺中的推薦、優(yōu)化、猜你喜歡等,還是游戲、自動駕駛,甚至是大家所熟知的蘋果智能語音助手Siri或者是戰(zhàn)勝世界第一圍棋手的阿爾法圍棋(AlphaGo),都有著強化學習的相應嘗試與實踐。