这里只有精品在线伦理三区,91视频色板,99热99热

內容簡介
作者介紹
目錄

本書從模型的結構和數據基礎兩個方面解構大語言模型，以便幫助讀者理解和搭建類似ChatGPT的系統(tǒng)。在模型的結構方面，大語言模型屬于深度神經網絡，其設計核心是注意力機制，因此，本書涵蓋了多層感知器、卷積神經網絡和循環(huán)神經網絡等經典模型。在模型的數據基礎方面，本書既涉及模型訓練的工程基礎，如反向傳播，又涉及數據的使用方式，如遷移學習、強化學習，以及傳統(tǒng)的監(jiān)督學習和無監(jiān)督學習。此外，本書還闡述了如何從計量經濟學和經典機器學習模型中汲取靈感，以提高模型的穩(wěn)定性和可解釋性。本書既適用于希望深入了解大語言模型、通過人工智能技術解決實際問題的讀者，也適合作為高等院校計算機及相關專業(yè)的師生參考用書。

你還可能感興趣

ChatGPT原理與實戰(zhàn)：大型語言模型的算法、技術和私有化
自然語言語義學
CATIA V5基礎教程第2版
自然語言處理入門
動手學自然語言處理

我要評論