本書是“人工智能技術應用核心課程系列教材”之一,通過對人工智能基礎概念、技術分類、技術應用、開發(fā)平臺、應用場景和開發(fā)運行環(huán)境等的系統(tǒng)介紹,結合樣板程序、經典案例的上機實踐與代碼分析,使初學者快速地對人工智能的技術全貌建立起系統(tǒng)的認識,并且掌握典型應用開發(fā)環(huán)境與平臺的安裝、配置及應用編程基礎技術。本書非常適合對人工智能、機器學習、深度學習、大模型與AIGC感興趣的讀者;需要掌握人工智能通識知識的政府、企事業(yè)人員和高校學生;需要先行快速了解人工智能技術全貌、為后續(xù)深入學習奠定基礎的在校大學生;期望快速進入數(shù)據(jù)工程、圖像識別、機器視覺、智慧語音、自然語言處理、智能機器人、大語言模型與AIGC等人工智能專業(yè)應用領域從事研發(fā)工作的工程技術人員。
聶明,男,1964年生人,中共黨員,博士,三級教授, 現(xiàn)任南京信息職業(yè)技術學院人工智能學院(籌)院長,是全國工信和信息化職業(yè)教育教學指導委員會計算機專指委委員、江蘇省"333工程”中青年學術帶頭人、江蘇省"六大人才高峰”高層次人才培養(yǎng)對象。編著出版過《移動增值應用開發(fā)導論》、《Java Web應用開發(fā)項目教程》、《VC++程序設計技能教程與實訓》和《計算機應用技術導論》等多本專著和教材。
第1章 人工智能的產生與發(fā)展
1.1 引言——激動人心的AI-2016與AI-2023
1.1.1 人工智能的基本概念
1.1.2 AI-2016——無敵圍棋系統(tǒng)AlphaGo
1.1.3 AI-2023——預訓練大語言模型GPT-4凌空出世
1.1.4 計算機視覺的“世界杯”——ILSVRC
1.1.5 計算機聽覺的實現(xiàn)——智能語音處理
1.1.6 AI的綜合應用——自動駕駛汽車
1.1.7 我國新一代AI發(fā)展規(guī)劃出臺
1.2 人工智能的產生與發(fā)展
1.2.1 AI的孕育與誕生(1943——1955)
1.2.2 AI艱難發(fā)展的六十年(1956——2016)
1.2.3 AI突飛猛進的七年(2017——2023)
1.3 認識AI的賦能
1.3.1 AI賦能的含義
1.3.2 感知能力——圖像與視覺
1.3.3 語言能力——自然語言處理
1.3.4 記憶能力——知識表示與知識圖譜
1.3.5 推理能力——自動推理與專家系統(tǒng)
1.3.6 規(guī)劃能力——智能規(guī)劃
1.3.7 學習能力——機器學習
1.3.8 AI賦能實體經濟
1.4 人工智能、機器學習與深度學習
1.4.1 AI的分類
1.4.2 人工智能與機器智能
1.4.3 人工智能與模式識別
1.4.4 機器學習
1.4.5 深度學習
1.5 算法、算力與大數(shù)據(jù)
1.5.1 人工智能崛起的三大基石
1.5.2 計算能力
1.5.3 云存儲與大數(shù)據(jù)
1.5.4 人工智能算法
1.6 人工智能的產業(yè)生態(tài)
1.6.1 人工智能產業(yè)生態(tài)的三層劃分
1.6.2 基礎層
1.6.3 技術層
1.6.4 應用層
1.7 科技巨頭在AI領域的布局
1.7.1 國外科技巨頭在AI領域的布局
1.7.2 我國科技巨頭在AI領域的布局
1.8 人工智能產業(yè)人才需求與學習路徑
1.8.1 人工智能產業(yè)人才的含義
1.8.2 人工智能產業(yè)人才的技能需求
第2章 AI典型應用展現(xiàn)與體驗
2.1 科大訊飛開放平臺
2.1.1 科大訊飛開放平臺簡介
2.1.2 平臺特色
2.1.3 功能特點
2.1.4 應用領域
2.1.5 訊飛輸入法體驗
2.1.6 訊飛智能音箱體驗
2.1.7 訊飛星火認知大模型
2.2 OpenAI的GPT與ChatGPT
2.2.1 GPT與ChatGPT簡介
2.2.2 調用GPT-2進行文本生成
2.2.3 ChatGPT的基礎應用與文檔生成
2.2.4 GPT-4的編程能力與代碼生成
2.3 微軟New Bing與Copilot
2.3.1 微軟智能搜索工具New Bing
2.3.2 微軟AI工具Copilot
2.3.3 智能操作系統(tǒng):Windows 11+ Copilot
2.4 AIGC的圖像生成
2.4.1 AIGC圖像生成簡介
2.4.2 AI圖像生成的原理與應用場景
2.4.3 常用AIGC圖像生成工具
2.5 人臉識別系統(tǒng)
2.5.1 人臉識別簡介
2.5.2 人臉檢測
2.5.3 人臉對比
2.5.4 人臉查找
2.5.5 人臉識別應用體驗
2.6 智能商務
2.6.1 AI助力電子商務
2.6.2 典型電子商務AI應用
2.6.3 電子商務的大數(shù)據(jù)
2.7 智能機器人
2.7.1 蘋果Siri
2.7.2 百度機器人
2.7.3 訊飛機器人
2.7.4 漢森機器人公司Sophia
2.7.5 達闥云端智能服務機器人
2.8 智能視頻監(jiān)控
2.8.1 智能視頻監(jiān)控簡介
2.8.2 運動目標檢測
2.8.3 目標跟蹤
2.8.4 三維建模
2.8.5 行人重識別
2.8.6 行為理解和描述
2.9 智能數(shù)字人
2.9.1 智能數(shù)字人簡介
2.9.2 智能數(shù)字人解決方案
2.9.3 智能數(shù)字人的應用
第3章 Python數(shù)據(jù)處理
3.1 Python基本數(shù)據(jù)類型
3.1.1 Number(數(shù)字類型)
3.1.2 List(列表)
3.1.3 Tuple(元組)
3.1.4 Dictionary(字典)
3.1.5 String(字符串)
3.1.6 Set(集合)
3.2 常用數(shù)據(jù)處理模塊
3.2.1 NumPy
3.2.2 Pandas
3.2.3 Matplotlib庫
3.3 常見數(shù)據(jù)集簡介
3.3.1 MNIST數(shù)據(jù)集
3.3.2 CTW數(shù)據(jù)集
3.4 數(shù)據(jù)收集、整理與清洗
3.4.1 數(shù)據(jù)收集
3.4.2 數(shù)據(jù)整理
3.4.3 數(shù)據(jù)清洗
3.5 數(shù)據(jù)分析
3.5.1 CSV文件
3.5.2 Excel文件
3.6 圖像處理
3.6.1 數(shù)字圖像處理技術
3.6.2 圖像格式的轉化
3.6.3 Python圖像處理
第4章 機器學習及其典型算法應用
4.1 機器學習簡介
4.1.1 基本含義
4.1.2 應用場景
4.1.3 機器學習類型
4.1.4 機器學習的相關術語
4.1.5 scikit-learn平臺
4.2 分類任務
4.2.1 K近鄰分類算法
4.2.2 決策樹分類算法
4.2.3 貝葉斯分類算法
4.2.4 支持向量機分類算法
4.2.5 人工神經網(wǎng)絡
4.3 回歸任務
4.3.1 回歸的含義
4.3.2 線性回歸
4.3.3 邏輯回歸
4.3.4 回歸主要算法
4.4 聚類任務
4.4.1 聚類的含義
4.4.2 聚類主要算法
4.4.3 聚類任務示例
4.5 機器學習應用實例
4.5.1 手寫數(shù)字識別
4.5.2 波士頓房價預測
第5章 神經網(wǎng)絡及其基礎算法應用
5.1 神經網(wǎng)絡簡介
5.1.1 生物神經元
5.1.2 人工神經網(wǎng)絡的概念
5.1.3 人工神經元模型與神經網(wǎng)絡
5.1.4 感知器算法及應用示例
5.1.5 神經網(wǎng)絡可視化工具——PlayGround
5.2 前饋神經網(wǎng)絡
5.2.1 前饋神經網(wǎng)絡模型
5.2.2 反向傳播神經網(wǎng)絡
5.2.3 反向傳播神經網(wǎng)絡算法規(guī)則
5.2.4 反向傳播神經網(wǎng)絡應用示例
5.3 反饋神經網(wǎng)絡模型
5.3.1 反饋神經網(wǎng)絡模型簡介
5.3.2 離散Hopfield神經網(wǎng)絡
5.3.3 連續(xù)Hopfield神經網(wǎng)絡
5.4 循環(huán)神經網(wǎng)絡
5.5 卷積神經網(wǎng)絡
5.5.1 卷積與卷積神經網(wǎng)絡簡介
5.5.2 卷積神經網(wǎng)絡的結構——LeNet-5
5.5.3 卷積神經網(wǎng)絡的學習規(guī)則
5.5.4 卷積神經網(wǎng)絡應用示例
第6章 深度學習及其典型算法應用
6.1 深度學習框架簡介
6.1.1 深度學習框架社區(qū)情況
6.1.2 深度學習框架比較
6.2 TensorFlow深度學習框架
6.2.1 TensorFlow建模流程
6.2.2 TensorFlow層次結構
6.2.3 TensorFlow的高階API
6.2.4 TensorFlow開發(fā)環(huán)境搭建
6.2.5 TensorFlow組成模型
6.2.6 TensorFlow實現(xiàn)線性回歸
6.2.7 TensorFlow實現(xiàn)全連接神經網(wǎng)絡
6.3 深度學習在MNIST圖像識別中的應用
6.3.1 MNIST數(shù)據(jù)集及其識別方法
6.3.2 全連接神經網(wǎng)絡識別MNIST圖像
6.3.3 卷積神經網(wǎng)絡識別MNIST圖像
6.3.4 循環(huán)神經網(wǎng)絡識別MNIST圖像
6.4 高階API構建和訓練深度學習模型
6.4.1 導入tf.keras
6.4.2 構建簡單的模型
6.4.3 訓練和評估
6.4.4 構建高級模型
6.4.5 回調
6.4.6 保存和恢復模型
6.4.7 Eager Execution
6.4.8 分布
6.4.9 符號和命令式高階API
第7章 人工智能大模型與內容生成
7.1 AI大模型的崛起
7.2 典型大模型GPT-4的功能概述
7.3 基于開放AI模型的應用開發(fā)入門
7.3.1 搭建應用開發(fā)環(huán)境
7.3.2 典型AI模型應用開發(fā)實例
7.3.3 主流開放預訓練模型能力匯總
7.4 多模態(tài)大模型與AIGC應用
7.4.1 多模態(tài)大模型與AIGC的簡介
7.4.2 AIGC文本生成
7.4.3 AIGC圖像生成
7.4.4 AIGC音頻生成
7.4.5 AIGC視頻生成
第8章 人工智能的機遇、挑戰(zhàn)與未來
8.1 AI的行業(yè)應用日趨火爆
8.1.1 云計算、大數(shù)據(jù)助力AI
8.1.2 AI助力金融
8.1.3 AI助力電商零售
8.1.4 AI助力安防
8.1.5 AI助力教育
8.1.6 AI助力醫(yī)療健康
8.1.7 AI助力個人生活
8.1.8 AI助力自動駕駛
8.2 “智能代工”大潮來襲
8.2.1 “智能代工”的含義
8.2.2 “中國智造”的機遇
8.2.3 “智能代工”帶來的挑戰(zhàn)
8.3 新IT、智聯(lián)網(wǎng)與社會信息物理系統(tǒng)
8.3.1 AI與IT新解
8.3.2 智聯(lián)網(wǎng)
8.3.3 社會物理網(wǎng)絡系統(tǒng)
8.4 人工智能的未來
8.4.1 發(fā)展趨勢預測
8.4.2 我國的AI布局
8.4.3 全球AI的產業(yè)規(guī)模
8.5 AI面臨的挑戰(zhàn)
8.5.1 AI的人才挑戰(zhàn)
8.5.2 AI的技術挑戰(zhàn)
8.5.3 AI的法律、安全與倫理挑戰(zhàn)
8.6 擁抱人工智能的明天
8.6.1 AI產品將全面進入消費級市場
8.6.2 認知類AI產品將趕超人類專家顧問水平
8.6.3 AI將成為可復用、可購買的智能服務
8.6.4 AI人才將呈現(xiàn)井噴式的大量需求
8.6.5 人類的知識、智慧、人性或將重新定義
8.6.6 一次非凡的突破——打電話的AI通過了圖靈測試
8.6.7 2022年——AI2.0的新紀元開啟
8.6.8 步入通用人工智能AGI的大門就要開啟
附錄A 人工智能基礎開發(fā)環(huán)境搭建
附錄B 人工智能的數(shù)學基礎與工具
附錄C 公開數(shù)據(jù)集介紹與下載
附錄D 人工智能的網(wǎng)絡學習資源
附錄E 人工智能的技術圖譜
附錄F 人工智能技術應用就業(yè)崗位與技能需求
參考文獻