ChatGPT一經(jīng)問(wèn)世,在全球范圍內(nèi)引起巨大轟動(dòng),GPT-4接入未來(lái)辦公軟件更是讓人震驚,而且技術(shù)正在以前所未有的速度快速迭代。那么,以這些技術(shù)為代表的生成式人工智能(AIGC)是否為新一輪的技術(shù)革命?它到底能做什么,具有哪些優(yōu)勢(shì)和場(chǎng)景應(yīng)用趨勢(shì)?面對(duì)新技術(shù),未來(lái)商業(yè)的機(jī)會(huì)在哪里,對(duì)我們個(gè)人又有著什么樣的影響?這些問(wèn)題對(duì)于我們理解當(dāng)下,面向未來(lái)都十分重要。本書(shū)基于作者的專(zhuān)業(yè)背景和長(zhǎng)期實(shí)踐,系統(tǒng)介紹生成式人工智能的內(nèi)在邏輯與應(yīng)用,并將其與產(chǎn)業(yè)發(fā)展,理論和實(shí)際相結(jié)合,幫助讀者從本源了解生成式人工智能,結(jié)合未來(lái)趨勢(shì)和發(fā)展為讀者指明方向。
1.一本書(shū)帶你讀懂生成式人工智能,從技術(shù)、功能、邏輯到前景商業(yè)應(yīng)用。幫 助我們了解未來(lái)趨勢(shì)、尋找個(gè)人發(fā)展機(jī)會(huì)。
2、作者丁磊,擁有雄厚專(zhuān)業(yè)背景(美國(guó)俄亥俄州立大學(xué)人工智能專(zhuān)業(yè)博士,人工智能商業(yè)化落地先行者,曾為硅谷明星公司PayPal創(chuàng)立了人工智能平臺(tái)并擔(dān)任負(fù)責(zé)人,后在百度、騰訊均任高級(jí)職務(wù)),分析視角專(zhuān)業(yè),兼顧通俗易懂。
3、香港科技大學(xué)講席教授,加拿大皇家科學(xué)院、加拿大工程院院士楊強(qiáng),加拿大圭爾夫大學(xué)教授、先進(jìn)機(jī)器人及智能系統(tǒng)實(shí)驗(yàn)室主任楊先一,微軟中國(guó)CTO韋青,戴爾原全球副總裁、大中華區(qū)總裁楊超,富士康科技集團(tuán)首席數(shù)字官、智能制造平臺(tái)負(fù)責(zé)人史喆,從知名教授到科技企業(yè)高管、人工智能技術(shù)踐行者,聯(lián)袂推薦。
人類(lèi)從出生開(kāi)始,就在不斷通過(guò)視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué)、觸覺(jué)等各種方式認(rèn)識(shí)這個(gè)世界。我們通過(guò)不停地與外界接觸、學(xué)習(xí),逐漸長(zhǎng)大成人,再通過(guò)專(zhuān)業(yè)課程的學(xué)習(xí)在某些方面獲得一技之長(zhǎng)從而立足于社會(huì),并試圖改造世界。
硅基的AI(人工智能)也按照類(lèi)似的模式成長(zhǎng),但是在速度方面極具優(yōu)勢(shì)。人工智能經(jīng)歷了從最初的機(jī)器學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò),再到Transformer模型的發(fā)展,2022年底ChatGPT以及2023年初GPT4橫空出世,引燃了公眾對(duì)生成式AI的關(guān)注,其中最讓人激動(dòng)的就是AI大模型已經(jīng)初步具備了人類(lèi)的通識(shí)和邏輯能力這恰恰是之前的AI所缺失的。此前,無(wú)論是AlphaGo還是AlphaFold,最多只能稱(chēng)作其各自領(lǐng)域的專(zhuān)家,而ChatGPT是通用的。
正如OpenAI首席科學(xué)家、ChatGPT背后的技術(shù)大佬伊利亞·蘇茨克維(IlyaSutskeve)所說(shuō),GPT學(xué)習(xí)的是世界模型。他將互聯(lián)網(wǎng)文本稱(chēng)作世界的映射,因此,將海量互聯(lián)網(wǎng)文本作為學(xué)習(xí)語(yǔ)料的GPT學(xué)習(xí)到的就是整個(gè)世界。在我們認(rèn)識(shí)世界的同時(shí),GPT模型也同樣以驚人的算力,快速地獲取我們數(shù)年,甚至數(shù)十年才能擁有的認(rèn)知,即將成為一位成年人所具有的認(rèn)知的世界模型。
不僅如此,已具備了世界模型能力的GPT還能夠生成萬(wàn)物。當(dāng)然,蘇茨克維所說(shuō),這里的萬(wàn)物指的是世界萬(wàn)物在數(shù)字空間的映射,包括文本、圖片、音頻、視頻、劇本、代碼、方案、設(shè)計(jì)圖等一切和我們生產(chǎn)、生活息息相關(guān)的事物。因?yàn)镚PT模型在一定程度上可能已經(jīng)具備了成年人的通識(shí)和邏輯,所以我們只需要拿特定專(zhuān)業(yè)領(lǐng)域的數(shù)據(jù)對(duì)其再做訓(xùn)練(稱(chēng)為微調(diào)),GPT模型就可以成為獨(dú)當(dāng)一面的專(zhuān)業(yè)人才,它可能成為藝術(shù)家、設(shè)計(jì)師、程序員、工程師或廣告優(yōu)化師、供應(yīng)鏈專(zhuān)家、客服人員等。這也許就是生成式AI或者說(shuō)AIGC,帶給我們的核心價(jià)值。
在AI技術(shù)大爆炸的今天,生成式AI處在高速發(fā)展階段,技術(shù)和應(yīng)用領(lǐng)域日新月異,因此我們非常有必要系統(tǒng)地了解生成式AI。在這樣的背景下,本書(shū)將系統(tǒng)介紹生成式AI的原理與模型,同時(shí)也將對(duì)其在行業(yè)場(chǎng)景中的應(yīng)用展開(kāi)論述,理論和實(shí)際相結(jié)合,讓大家從本源上了解ChatGPT里程碑式存在的意義。結(jié)合作者二十余年AI領(lǐng)域研究與工作的經(jīng)驗(yàn),本書(shū)會(huì)為讀者指明方向。尤其值得一提的是,本書(shū)既在理論上解釋了數(shù)字媒體即虛擬世界的生成式AI,又探討了生成式AI如何服務(wù)和賦能實(shí)體經(jīng)濟(jì)。在當(dāng)前的存量經(jīng)濟(jì)時(shí)代,通過(guò)生成式AI重新定義生產(chǎn)力,助力行業(yè)更新發(fā)展,在存量里促增長(zhǎng),具有尤為重要的意義。
如圖01所示,我們用圖表明本書(shū)所覆蓋的知識(shí)領(lǐng)域:X軸是生成式大模型的維度,對(duì)應(yīng)的是第二章AIGC的底層邏輯,我們將了解用什么去生成;Y軸是數(shù)字媒體形態(tài)的維度,對(duì)應(yīng)的是第三章AIGC能生成什么內(nèi)容?,我們將了解生成什么;Z軸是行業(yè)職能的維度,對(duì)應(yīng)的是第四章AIGC的產(chǎn)業(yè)應(yīng)用與前景,我們將了解用生成式AI可以做什么事。三個(gè)軸所形成的空間里的每個(gè)點(diǎn)都有其特定含義,例如:通過(guò)GPT4模型生成代碼用在生產(chǎn)上,通過(guò)StableDiffusion模型生成圖片用在營(yíng)銷(xiāo)上。除了這三章,第一章會(huì)帶領(lǐng)讀者初識(shí)生成式AI,第五章則探討生成式AI是否會(huì)取代大量的工作崗位,以及我們應(yīng)該如何主動(dòng)應(yīng)對(duì)。
希望任何一個(gè)不想在生成式AI時(shí)代落伍的人,在閱讀本書(shū)之后,都能理解生成式AI的底層邏輯和實(shí)際應(yīng)用,也希望本書(shū)對(duì)他們的工作和生活有所助益。萬(wàn)物皆可生成的時(shí)代已經(jīng)來(lái)臨,理解AI、訓(xùn)練AI、使用AI,甚至和AI一起工作,對(duì)每個(gè)人來(lái)說(shuō)或?qū)o(wú)法避免。未來(lái)已來(lái),讓我們一起出發(fā)!
丁磊
美國(guó)俄亥俄州立大學(xué)人工智能專(zhuān)業(yè)博士,美國(guó)哥倫比亞大學(xué)博士后。
人工智能商業(yè)化落地先行者,曾為PayPal創(chuàng)立人工智能平臺(tái),歷任百度金融首席數(shù)據(jù)科學(xué)家、PayPal全球消費(fèi)者數(shù)據(jù)科學(xué)部創(chuàng)始負(fù)責(zé)人等職務(wù),曾在IBM Watson研究院和美國(guó)伊利諾伊大學(xué)貝克曼研究所從事研究。在IEEE會(huì)刊等發(fā)表高質(zhì)量論文20余篇,獲授權(quán)專(zhuān)利30余項(xiàng)。
幫助企業(yè)運(yùn)用人工智能提升效益,與中國(guó)農(nóng)業(yè)銀行、中國(guó)電信、萬(wàn)科集團(tuán)、聯(lián)合利華、億客行等行業(yè)巨頭深度合作,推動(dòng)人工智能落地。領(lǐng)導(dǎo)研發(fā)的營(yíng)銷(xiāo)和風(fēng)控決策系統(tǒng)、精準(zhǔn)服務(wù)智能機(jī)器人平臺(tái)在多個(gè)行業(yè)成功應(yīng)用。2018年被第一財(cái)經(jīng)評(píng)為中國(guó)數(shù)據(jù)科學(xué)50人。
前言
第一章 初識(shí)生成式人工智能
縱觀 AI 產(chǎn)業(yè)版圖 003
聚焦 AIGC:內(nèi)容皆可生成 017
生成式 AI 的核心價(jià)值 031
里程碑式的存在ChatGPT 041
第二章 AIGC 的底層邏輯
生成式模型基礎(chǔ) 059
Transformer 和 ChatGPT 模型 073
Diffusion 模型 087
第三章 功能分析:AIGC 能生成什么內(nèi)容?
生成文字: 新聞、報(bào)告、代碼都可一鍵生成? 101
描繪圖片: 分辨率、清晰度、真實(shí)性與藝術(shù)性 111
音頻制作:精準(zhǔn)還原、實(shí)時(shí)合成 127
影視創(chuàng)作:海量場(chǎng)景任你選 137
互動(dòng)娛樂(lè):游戲中的生成式 AI 革命 149
第四章 商業(yè)落地:AIGC 的產(chǎn)業(yè)應(yīng)用與前景
研發(fā)設(shè)計(jì):設(shè)計(jì)能力樣樣俱全 163
生產(chǎn)制造: L4 級(jí)別的智能控制 179
市場(chǎng)營(yíng)銷(xiāo):營(yíng)銷(xiāo)文案不再發(fā)愁 191
供應(yīng)鏈管理: 庫(kù)存計(jì)劃可自動(dòng)編程? 201
客戶(hù)服務(wù):貼心服務(wù)打動(dòng)客戶(hù) 211
第五章 主動(dòng)還是被動(dòng)?決勝 AIGC
展望未來(lái): AIGC 是否是新一輪的技術(shù)革命? 225
智能并非萬(wàn)能:AIGC 的優(yōu)勢(shì)與瓶頸 235
我們的工作機(jī)會(huì)還在嗎? 247
后記 259
參考文獻(xiàn)