關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
多媒體技術(shù)基礎(chǔ)
本書(shū)主要介紹多媒體壓縮編碼、多媒體光盤(pán)存儲(chǔ)和多媒體網(wǎng)絡(luò)的技術(shù)基礎(chǔ), 包括多媒體技術(shù), 數(shù)字媒體技術(shù)等先關(guān)內(nèi)容。
本版教材系統(tǒng)介紹了多媒體系統(tǒng)的核心技術(shù),在內(nèi)容上力求選用相對(duì)成熟和實(shí)用的新技術(shù),在技術(shù)原理闡述和解釋上力求清楚準(zhǔn)確。為保持多媒體技術(shù)基礎(chǔ)教材內(nèi)容的系統(tǒng)性和完整性,本教材不免與其他學(xué)科教材有交集。此外,教材中包含許多技術(shù)背景和技術(shù)細(xì)節(jié),目的是為更好地理解技術(shù)原理,細(xì)節(jié)也反映理解的深淺。在上述思想指導(dǎo)下,使本教材的篇幅比較大,但還是比國(guó)外同類(lèi)教材的篇幅小很多。
每章均附有練習(xí)和思考題,用于輔助讀者掌握本章的要點(diǎn);每章內(nèi)容的來(lái)源都列出了參考文獻(xiàn)和站點(diǎn),讀者可用于加深對(duì)教材內(nèi)容的理解和擴(kuò)大知識(shí)面。
前言
《多媒體技術(shù)基礎(chǔ)》第3版教材于2008年定稿出版發(fā)行。從技術(shù)上看,當(dāng)時(shí)許多新技術(shù)正處在開(kāi)發(fā)和試驗(yàn)過(guò)程中,如H.265/HEVC、移動(dòng)多媒體等技術(shù),現(xiàn)已趨成熟。從國(guó)外的多媒體技術(shù)課程來(lái)看,教學(xué)內(nèi)容已不再局限于多媒體本身,已經(jīng)擴(kuò)展到多媒體系統(tǒng)。
“多媒體系統(tǒng)”這個(gè)名稱(chēng)已在科學(xué)技術(shù)文獻(xiàn)中頻繁出現(xiàn),越來(lái)越多地把它作為學(xué)術(shù)雜志的名稱(chēng)、學(xué)術(shù)會(huì)議的名稱(chēng)、教科書(shū)的名稱(chēng),國(guó)外許多高等院校把它作為本科生、研究生的課程名稱(chēng)。從多媒體系統(tǒng)角度考慮,本版教材在內(nèi)容上做了較大幅度的增減,使《多媒體技術(shù)基礎(chǔ)》更趨完整,可把它理解為“多媒體系統(tǒng)的技術(shù)基礎(chǔ)”。
一、教材內(nèi)容的組織
與第3版相比,《多媒體技術(shù)基礎(chǔ)》第4版教材變動(dòng)較大的部分如下:
(1)增加了字符編碼和字體技術(shù),系統(tǒng)介紹了漢字編碼的過(guò)去和現(xiàn)在,彌補(bǔ)了過(guò)去多媒體教材沒(méi)有字符技術(shù)的遺憾。
(2)參照國(guó)外多媒體系統(tǒng)課程的教學(xué)大綱,較系統(tǒng)地介紹了多媒體互聯(lián)網(wǎng)絡(luò),包括網(wǎng)絡(luò)互聯(lián)和寬帶接入因特網(wǎng)的技術(shù)基礎(chǔ)。寬帶接入包括有線寬帶、無(wú)線寬帶和移動(dòng)寬帶接入,技術(shù)基礎(chǔ)包括有線和無(wú)線數(shù)據(jù)通信學(xué)科方面的知識(shí)。
(3)為減少教材篇幅,第3版中的不少內(nèi)容沒(méi)有保留,但仍然有參考價(jià)值,如介紹HTML和XML的多媒體內(nèi)容處理語(yǔ)言。
《多媒體技術(shù)基礎(chǔ)》第4版教材的內(nèi)容組織成如下三個(gè)部分。
第一部分:多媒體壓縮和編碼(第2~14章),介紹文字、聲音、圖像和數(shù)字電視媒體的基本知識(shí)、壓縮技術(shù)和編碼方法。
第二部分:多媒體光盤(pán)存儲(chǔ)技術(shù)(第15~17章),介紹CD、DVD、HDDVD和藍(lán)光盤(pán)的存儲(chǔ)原理和存儲(chǔ)格式。
第三部分:多媒體網(wǎng)絡(luò)(第18~32章),以多媒體網(wǎng)絡(luò)應(yīng)用和服務(wù)質(zhì)量(QoS)為中心,介紹計(jì)算機(jī)網(wǎng)絡(luò)、寬帶(有線、無(wú)線和移動(dòng))接入因特網(wǎng)的基礎(chǔ)知識(shí)。
每章均附有練習(xí)和思考題,用于輔助讀者掌握本章的要點(diǎn);每章內(nèi)容的來(lái)源都列出了參考文獻(xiàn)和站點(diǎn),讀者可用于加深對(duì)教材內(nèi)容的理解和擴(kuò)大知識(shí)面。
二、教材的使用建議
本版教材系統(tǒng)介紹了多媒體系統(tǒng)的核心技術(shù),在內(nèi)容上力求選用相對(duì)成熟和實(shí)用的新技術(shù),在技術(shù)原理闡述和解釋上力求清楚準(zhǔn)確。
為保持多媒體技術(shù)基礎(chǔ)教材內(nèi)容的系統(tǒng)性和完整性,本教材不免與其他學(xué)科教材有些交集。此外,教材中包含許多技術(shù)背景和技術(shù)細(xì)節(jié),目的是為更好地理解技術(shù)原理。在上述思想指導(dǎo)下,使本教材的篇幅較大。
對(duì)本教材的使用,編者還是建議,教師有所教有所不教,學(xué)生有所學(xué)有所不學(xué)。具體建議詳見(jiàn)本教材第3版前言。
三、衷心感謝
《多媒體技術(shù)基礎(chǔ)》由林福宗主持編寫(xiě),參加編寫(xiě)工作的教授、專(zhuān)家和高級(jí)程序員有黃民德、汪健如、黃國(guó)健、林彩榮和張哲等。特別感謝中國(guó)科學(xué)院院士、清華大學(xué)張鈸教授長(zhǎng)時(shí)期的直接指導(dǎo)和各方面給予的實(shí)質(zhì)性支持;感謝我們課題組所有老師和碩博研究生為本教材所做的貢獻(xiàn);感謝使用本教材的師生和技術(shù)人員給予我們的熱情鼓勵(lì)和提出的寶貴建議。
林福宗
退休單位:清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系
電子郵件地址:linfz@mail.tsinghua.edu.cn
2017年3月1日第3版前言
本教材第2版于2001年定稿,2002年9月第一次印刷。當(dāng)時(shí)許多新技術(shù)還沒(méi)有出現(xiàn)或正在開(kāi)發(fā)之中,如MPEG4AVC/H.264(2003年)和XML1.1(2006年)。有些當(dāng)時(shí)認(rèn)為比較有前途的技術(shù),現(xiàn)在已經(jīng)更新,如普遍認(rèn)為2002年公布的SIP(RFC3261)比1996年公布的H.323更簡(jiǎn)單。根據(jù)筆者過(guò)去幾年的科研、教學(xué)和觀察,教材中的大部分內(nèi)容都適合當(dāng)前使用,因此確定第3版教材的修改方針是保留第2版的體系結(jié)構(gòu)、更新部分章節(jié)內(nèi)容和增加新內(nèi)容。
一、教材的組織結(jié)構(gòu)
為保持多媒體技術(shù)基礎(chǔ)課程內(nèi)容的完整性,第3版教材仍由多媒體壓縮和編碼、多媒體存儲(chǔ)、多媒體傳輸和多媒體內(nèi)容處理語(yǔ)言共四個(gè)相對(duì)獨(dú)立的部分組成。
第一部分:多媒體壓縮和編碼(第2~13章),主要介紹聲音、圖像和數(shù)字電視的基本知識(shí)、壓縮與編碼方法。
第二部分:多媒體存儲(chǔ)(第14~16章),主要介紹CD、DVD、HDDVD和BD(BlurayDisc)光盤(pán)的存儲(chǔ)原理和多媒體在光盤(pán)上的存放格式。
第三部分:多媒體傳輸(第17~20章),主要介紹多媒體網(wǎng)絡(luò)應(yīng)用、服務(wù)質(zhì)量(QoS)、因特網(wǎng)、TCP/IP協(xié)議和多媒體傳輸?shù)幕A(chǔ)知識(shí)。
第四部分:多媒體內(nèi)容處理語(yǔ)言(第21~22章),主要介紹HTML和XML的基礎(chǔ)知識(shí)。
為幫助讀者加深對(duì)基礎(chǔ)知識(shí)的理解,每章后面都有練習(xí)和思考題,但這些題目沒(méi)有難度,教師可增加一些有一定深度的練習(xí)和思考題。
每章后面都有參考文獻(xiàn)和站點(diǎn),列出它們有兩個(gè)目的:(1)表示在編寫(xiě)本教材過(guò)程中訪問(wèn)過(guò)相關(guān)站點(diǎn),參考或引用了相關(guān)內(nèi)容;(2)更重要的是為讀者提供進(jìn)一步學(xué)習(xí)的指南,教師要鼓勵(lì)學(xué)生主動(dòng)上網(wǎng)查閱。雖然到本書(shū)截稿時(shí)每個(gè)網(wǎng)址都有效,但以后可能會(huì)有變化。
二、教材修改的內(nèi)容
在第2版教材基礎(chǔ)上,第3版教材做了如下修改:
(1)考慮到視像壓縮技術(shù)在多媒體產(chǎn)品和各種服務(wù)中的重要性,因此增加了一章專(zhuān)門(mén)用來(lái)介紹MPEG4AVC/H.264。此外,考慮到光盤(pán)存儲(chǔ)器在多媒體存儲(chǔ)方面的重要性,因此增加了HDDVD和BlurayDisc的內(nèi)容。
(2)考慮到網(wǎng)上多媒體應(yīng)用如火如荼,如IP電視、IP電話、即時(shí)通信和多媒體會(huì)議,因此重寫(xiě)了第三部分(第17~20章),突出了多媒體傳輸或稱(chēng)多媒體通信技術(shù)。
(3)考慮到20世紀(jì)90年代末期開(kāi)展的內(nèi)容處理已成為重要的研究方向,因此在第22章(XML語(yǔ)言)中增加了XML新版本的內(nèi)容。HTML和XML等標(biāo)準(zhǔn)已經(jīng)并將繼續(xù)對(duì)日益增長(zhǎng)的包括移動(dòng)通信在內(nèi)的多媒體網(wǎng)絡(luò)應(yīng)用和多媒體電子出版業(yè)等行業(yè)產(chǎn)生深遠(yuǎn)的影響。
(4)為降低教材篇幅,第2版中的部分內(nèi)容沒(méi)有保留,如MIDI系統(tǒng)。
(5)XHTML是用XML重寫(xiě)的HTML版本,2008年1月介紹的HTML5(也稱(chēng)XHTML5)也是用XML編寫(xiě)的。因此本版教材沒(méi)有保留第2版中的第23章(XHML語(yǔ)言)。
三、教材的使用建議
國(guó)內(nèi)許多大學(xué)開(kāi)設(shè)多媒體技術(shù)課程已有多年,在網(wǎng)上看到許多兄弟院校在教材建設(shè)和課程教學(xué)方面已有很多很好的經(jīng)驗(yàn),在學(xué)習(xí)和借鑒他們成功經(jīng)驗(yàn)的基礎(chǔ)上,為使用或打算使用本教材的老師和同學(xué)提出如下建議供參考。
1.有所教有所不教
在編寫(xiě)本教材過(guò)程中筆者注意到,國(guó)外有些信息技術(shù)學(xué)院從本科到研究生階段,每個(gè)年級(jí)都開(kāi)設(shè)內(nèi)容不同、深淺不同的多媒體課程,既有廣度又有深度。考慮到我國(guó)目前的多媒體課程教學(xué)計(jì)劃一般只安排一個(gè)學(xué)期,學(xué)時(shí)也不多,因此教師可采用有所教有所不教和有所學(xué)有所不學(xué)的策略。任課教師可根據(jù)自己的興趣和專(zhuān)長(zhǎng)、學(xué)生已有的基礎(chǔ)和專(zhuān)業(yè)方向,有的放矢地選擇其中的部分內(nèi)容。對(duì)于不作為重點(diǎn)的教學(xué)內(nèi)容,如果有需要,學(xué)生自己就會(huì)主動(dòng)去鉆研。
2.教材作為參考書(shū)
對(duì)于信息技術(shù)課程的教材來(lái)說(shuō),寫(xiě)進(jìn)正式出版的教材的內(nèi)容通常是比較成熟的,即使是剛剛出版的教材,其內(nèi)容也不一定新。據(jù)觀察,許多大學(xué)的多媒體課程內(nèi)容是當(dāng)前最新的技術(shù),教師都有自己編寫(xiě)的教學(xué)提綱和材料,而把正式出版的教科書(shū)列為必要的參考材料加以推薦。這不是說(shuō)正式出版的教材不重要,而是通過(guò)教授新技術(shù)來(lái)帶動(dòng)基本原理的學(xué)習(xí)。其結(jié)果是學(xué)的內(nèi)容先進(jìn),學(xué)的基礎(chǔ)扎實(shí)。
本教材共22章,比較系統(tǒng)地介紹多媒體技術(shù)。筆者有意使本教材覆蓋多方面的重要技術(shù),努力選取相對(duì)比較新的和實(shí)用的技術(shù),力圖對(duì)多媒體技術(shù)原理解釋清楚和準(zhǔn)確。因此可把本教材作為多媒體技術(shù)課程的起點(diǎn),在此基礎(chǔ)上教授最新的技術(shù)。
3.用課程設(shè)計(jì)驅(qū)動(dòng)
凡任課教師都很清楚,教一本書(shū)不等于開(kāi)設(shè)一門(mén)課程。為配合我校加強(qiáng)實(shí)踐教學(xué)的教學(xué)改革,更好地激勵(lì)學(xué)生學(xué)習(xí)基礎(chǔ)理論和技能的積極性,清華大學(xué)出版社出版了經(jīng)過(guò)多年實(shí)際使用的《多媒體技術(shù)課程設(shè)計(jì)與學(xué)習(xí)輔導(dǎo)》。學(xué)生對(duì)課程設(shè)計(jì)反響強(qiáng)烈,由于嚴(yán)格實(shí)施“允許參考不許抄襲”的措施,學(xué)生普遍認(rèn)為真正學(xué)到了知識(shí)。
輔助教材擬了多個(gè)難易程度不同的設(shè)計(jì)題目,每個(gè)題目都有原理介紹和示例。為便于學(xué)生撰寫(xiě)和教師評(píng)估課程設(shè)計(jì)報(bào)告,規(guī)范了課程設(shè)計(jì)報(bào)告的格式。由于設(shè)計(jì)題目的難度不大,任課教師可根據(jù)情況,從中選擇一個(gè)或兩個(gè)題目,也可在輔助教材所列的“參考選題”或其他參考選題中增加或更改設(shè)計(jì)題目。課程設(shè)計(jì)要求使用MATLAB語(yǔ)言來(lái)實(shí)現(xiàn),因?yàn)镸ATLAB是攻讀學(xué)位的大學(xué)生、碩士生和博士生必須掌握的基本工具。
4.用評(píng)估系統(tǒng)引導(dǎo)
評(píng)估系統(tǒng)是一個(gè)無(wú)形的指揮棒,可以引導(dǎo)學(xué)生的學(xué)習(xí)方向。教授本教材是多媒體技術(shù)基礎(chǔ)課程中的一個(gè)部分,而課程設(shè)計(jì)是課程的另一個(gè)重要組成部分。因此筆者的課程評(píng)估采用了“基礎(chǔ)知識(shí)書(shū)面開(kāi)卷考試約占50%,課程設(shè)計(jì)約占50%”的方法,但對(duì)不同專(zhuān)業(yè)的學(xué)生可以在評(píng)估標(biāo)準(zhǔn)或在所占分?jǐn)?shù)的比例上加以調(diào)整。
5.教學(xué)輔助材料
為本教材準(zhǔn)備的電子版的輔助材料有四個(gè)部分:(1)練習(xí)與思考題參考答案;(2)課程設(shè)計(jì)參考答案;(3)正式出版的本教材中的插圖,為制作電子版講課提綱提供方便;(4)講課提綱(PPT格式)。這些材料可在清華大學(xué)出版社的網(wǎng)站上下載,也可在http://www.csai.tsinghua.edu.cn/linfzmmc/上下載。
四、關(guān)于中文術(shù)語(yǔ)
隨著信息科學(xué)和技術(shù)日新月異,新術(shù)語(yǔ)不斷涌現(xiàn),同時(shí)也給一些老術(shù)語(yǔ)賦予了新的含義,使用準(zhǔn)確的術(shù)語(yǔ)有利于信息的交流。為使本教材中的中文術(shù)語(yǔ)盡量準(zhǔn)確,筆者查閱了許多著名的英文詞典,閱讀了許多相關(guān)的科學(xué)和技術(shù)文獻(xiàn),參考了全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)2002年公布的《計(jì)算機(jī)科學(xué)技術(shù)名詞》。
在本教材中,有幾個(gè)常用術(shù)語(yǔ)有必要在此說(shuō)明:(1)用“視頻”作為video的釋義是物理概念上的錯(cuò)誤。video的真實(shí)含義是由一系列圖像組成的(電)視(圖)像,確切的中文譯名應(yīng)該是“視像”!耙曨l(videofrequency)”是電視信號(hào)頻率的簡(jiǎn)稱(chēng),在ITURBT.601標(biāo)準(zhǔn)中,頻率范圍是0~6.75MHz。(2)不論什么場(chǎng)合,用“音頻”作為audio的釋義也是物理概念上的錯(cuò)誤。audio是指人的聽(tīng)覺(jué)系統(tǒng)可感知的聲音,是聲音(sound)的同義詞,作名詞時(shí)的確切中文術(shù)語(yǔ)應(yīng)該是“聲音”!耙纛l(audiofrequency)”是聲音信號(hào)頻率的簡(jiǎn)稱(chēng),頻率范圍通常認(rèn)為是15~20000Hz。(3)“分組交換(packetswitching)”是一個(gè)不確切的中文術(shù)語(yǔ)!皃acket”的含義是一個(gè)由收、發(fā)送地址和實(shí)際數(shù)據(jù)組成的“數(shù)據(jù)包”,確切的術(shù)語(yǔ)應(yīng)該是“包交換”。(4)“組播(multicast)”是一個(gè)容易被誤認(rèn)為“收發(fā)關(guān)系顛倒”的術(shù)語(yǔ),本教材使用“多目標(biāo)廣播”。盡管我們習(xí)慣使用2~3個(gè)字構(gòu)成的術(shù)語(yǔ),但“多目標(biāo)廣播”是顧名就可思義的術(shù)語(yǔ),即一個(gè)發(fā)送者向多個(gè)接收者(多目標(biāo))傳送(廣播)數(shù)據(jù)的意思。
五、衷心感謝
特別感謝中國(guó)科學(xué)院院士張鈸教授多年來(lái)的直接指導(dǎo)和各方面給予的實(shí)質(zhì)性支持;衷心感謝我們課題組(智能多媒體組)所有老師和碩博研究生為本教材所做的貢獻(xiàn);衷心感謝使用本教材的老師和學(xué)生給予我們的熱情鼓勵(lì)和提出的寶貴建議。
參加本教材編寫(xiě)工作的有林彩榮、朱高建、朱高東、黃民德和謝霄艷,他們?cè)诙嗝襟w語(yǔ)言、程序設(shè)計(jì)、多媒體通信、教育技術(shù)、軟件評(píng)估、科研和教學(xué)方面都有各自的專(zhuān)長(zhǎng)。
林福宗
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系
智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室
電子郵件地址:linfz@mail.tsinghua.edu.cn
2008年10月15日
林福宗 清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系退休教授,1970年畢業(yè)于清華大學(xué)自動(dòng)控制系,留校工作直至退休。從1989年開(kāi)始對(duì)多媒體產(chǎn)生興趣,其后一直從事多媒體技術(shù)基礎(chǔ)的教學(xué)和應(yīng)用研究,曾編寫(xiě)并在清華大學(xué)出版社出版《英漢多媒體技術(shù)辭典》、《多媒體技術(shù)基礎(chǔ)》教材等圖書(shū)。
第5章彩色數(shù)字圖像基礎(chǔ)
圖像是多媒體中攜帶信息的極其重要的媒體,有人發(fā)表過(guò)統(tǒng)計(jì)資料,認(rèn)為人們獲取的信息的70%來(lái)自視覺(jué)系統(tǒng)。由于圖像數(shù)字化之后的數(shù)據(jù)量非常大,在因特網(wǎng)上傳輸時(shí)很費(fèi)時(shí)間,在盤(pán)上存儲(chǔ)時(shí)很占“地盤(pán)”,因此就必須要對(duì)圖像數(shù)據(jù)進(jìn)行壓縮。壓縮的目的就是要滿足存儲(chǔ)容量和傳輸帶寬的要求,而付出的代價(jià)則是大量的計(jì)算。幾十年來(lái),許多科技工作者一直在孜孜不倦地尋找更有效的方法,用比較少的數(shù)據(jù)量表達(dá)原始的圖像。
圖像數(shù)據(jù)壓縮主要是根據(jù)下面兩個(gè)基本事實(shí)來(lái)實(shí)現(xiàn)的。一個(gè)事實(shí)是圖像數(shù)據(jù)中有許多重復(fù)的數(shù)據(jù),使用數(shù)學(xué)方法來(lái)表示這些重復(fù)數(shù)據(jù)可減少數(shù)據(jù)量;另一個(gè)事實(shí)是人的眼睛對(duì)圖像細(xì)節(jié)和顏色的辨認(rèn)有一個(gè)極限,把超過(guò)極限的部分去掉,也就達(dá)到壓縮數(shù)據(jù)的目的。利用前一個(gè)事實(shí)的壓縮技術(shù)是無(wú)損數(shù)據(jù)壓縮技術(shù),利用后一個(gè)事實(shí)的壓縮技術(shù)是有損數(shù)據(jù)壓縮技術(shù)。實(shí)際的圖像壓縮是綜合使用各種有損和無(wú)損數(shù)據(jù)壓縮技術(shù)來(lái)實(shí)現(xiàn)的。
本章將介紹表示數(shù)字彩色圖像所需要的基本知識(shí)、使用得相當(dāng)廣泛的JPEG壓縮標(biāo)準(zhǔn)和圖像文件的存儲(chǔ)格式。在介紹過(guò)程中,要涉及有關(guān)顏色的度量和顏色空間的轉(zhuǎn)換問(wèn)題,這些比較深入的問(wèn)題將在第8章“顏色度量體系”和第9章“顏色空間轉(zhuǎn)換”中介紹。
5.1視覺(jué)系統(tǒng)對(duì)顏色的感知
顏色是視覺(jué)系統(tǒng)對(duì)可見(jiàn)光的感知結(jié)果?梢(jiàn)光是波長(zhǎng)在380~780nm之間的電磁波,我們看到的大多數(shù)光不是一種波長(zhǎng)的光,而是由許多不同波長(zhǎng)的光組合成的。人們?cè)谘芯垦劬?duì)顏色的感知過(guò)程中普遍認(rèn)為,人的視網(wǎng)膜有對(duì)紅、綠、藍(lán)顏色敏感程度不同的三種錐體細(xì)胞,另外還有一種在光功率極端低的條件下才起作用的桿狀體細(xì)胞,因此顏色只存在于眼睛和大腦。在計(jì)算機(jī)圖像處理中,桿狀細(xì)胞還沒(méi)有扮演什么角色。
人的視覺(jué)系統(tǒng)對(duì)顏色的感知可歸納出如下幾個(gè)特性:
(1)眼睛本質(zhì)上是一個(gè)照相機(jī)。視網(wǎng)膜(humanretina)通過(guò)神經(jīng)元來(lái)感知外部世界的顏色,每個(gè)神經(jīng)元是一個(gè)對(duì)顏色敏感的錐體(cone)或是一個(gè)對(duì)顏色不敏感的桿狀體(rod)。
(2)紅、綠和藍(lán)三種錐體細(xì)胞對(duì)不同頻率的光的感知程度不同,對(duì)不同亮度的感知程度也不同。這就意味著,人們可以使用數(shù)字圖像處理技術(shù)來(lái)降低表示圖像的數(shù)據(jù)量,而不使人感到圖像質(zhì)量有明顯下降。
(3)自然界中的任何一種顏色都可以由R、G、B這三種顏色值之和來(lái)確定,它們構(gòu)成一個(gè)三維的RGB矢量空間。這就是說(shuō),R、G、B的數(shù)值不同,混合得到的顏色就不同,也就是光波的波長(zhǎng)不同。
5.2圖像的顏色模型
在文獻(xiàn)和教材中,用于描述顏色的常用詞有兩個(gè):顏色模型和顏色空間。顏色模型(colormodel)是用數(shù)值指定顏色的方法,顏色空間(colorspace)是用空間中點(diǎn)的集合描述顏色的方法,它們互為同義詞。RGB和CMYK是計(jì)算機(jī)系統(tǒng)使用最廣泛的兩個(gè)顏色模型。
5.2.1顯示彩色圖像用RGB相加混色模型
一個(gè)能發(fā)出光波的物體稱(chēng)為有源物體,它的顏色由該物體發(fā)出的光波決定,并且使用RGB相加混色模型。電視機(jī)和計(jì)算機(jī)顯示器使用的陰極射線管(CathodeRayTube,CRT)就是一個(gè)有源物體。CRT使用3個(gè)電子槍分別產(chǎn)生紅(red)、綠(green)和藍(lán)(blue)三種波長(zhǎng)的光,并以各種不同的相對(duì)強(qiáng)度綜合起來(lái)產(chǎn)生顏色,如圖51(a)所示。雖然當(dāng)今的電視機(jī)和計(jì)算機(jī)顯示器幾乎都使用彩色LED顯示器,但生成顏色的原理與陰極射線管(CRT)類(lèi)似。
組合這三種光波來(lái)產(chǎn)生特定顏色的方法叫作相加混色法(additivecolormixture),因?yàn)檫@種相加混色是利用R、G和B顏色分量產(chǎn)生顏色,故稱(chēng)為RGB相加混色模型。相加混色是計(jì)算機(jī)應(yīng)用中定義顏色的基本方法。
從理論上講,任何一種顏色都可用三種基本顏色按不同的比例混合得到。三種顏色的光強(qiáng)越強(qiáng),到達(dá)我們眼睛的光就越多,它們的比例不同,我們看到的顏色也就不同。沒(méi)有光到達(dá)眼睛,就是一片漆黑。當(dāng)三基色按不同強(qiáng)度相加時(shí),總的光強(qiáng)增強(qiáng),并可得到任何一種顏色。某一種顏色和這三種顏色之間的關(guān)系可用下面的式子來(lái)描述:
顏色=R(紅色的百分比)+G(綠色的百分比)+B(藍(lán)色的百分比)
當(dāng)三基色等量相加時(shí),得到白色;等量的紅綠相加而藍(lán)為0時(shí)得到黃色;等量的紅藍(lán)相加而綠為0時(shí)得到品紅色;等量的綠藍(lán)相加而紅為0時(shí)得到青色。這些三基色相加的結(jié)果如圖51(b)所示。
圖51顏色生成原理
一幅彩色圖像可以看成是由許多的點(diǎn)組成的,如圖52所示。圖像中的單個(gè)點(diǎn)稱(chēng)為像素(pixel),每個(gè)像素都有一個(gè)值,稱(chēng)為像素值,它表示特定顏色的強(qiáng)度。圖52一幅圖像由許多像素組成
一個(gè)像素值往往用R、G、B三個(gè)分量表示。如果每個(gè)像素的三個(gè)顏色分量都用二進(jìn)制的1位來(lái)表示,那么每個(gè)顏色的分量只有“1”和“0”這兩個(gè)值,這也就是說(shuō),每個(gè)顏色分量的強(qiáng)度是100%或者是0%。在這種情況下,每個(gè)像素所顯示的顏色是8種可能的顏色之一,見(jiàn)表51。
對(duì)于標(biāo)準(zhǔn)的電視圖形陣列(VideoGraphicsArray,VGA)適配卡的16種標(biāo)準(zhǔn)顏色,其對(duì)應(yīng)的R、G、B值見(jiàn)表52。在Microsoft公司的Windows操作系統(tǒng)中,用代碼0~15表示。表中的代碼1~6表示的顏色比較暗,它們是用最大光強(qiáng)值的一半產(chǎn)生的顏色;9~15是用最大光強(qiáng)值產(chǎn)生的。表51相加色RGB顏色RGB顏色000黑100紅001藍(lán)101品紅010綠110黃011青111白在表52中,每種基色的強(qiáng)度是用8位表示的,因此可產(chǎn)生224=16777216種顏色。但實(shí)際上要用1600多萬(wàn)種顏色的場(chǎng)合是很少的。在多媒體計(jì)算機(jī)中,除用RGB來(lái)表示顏色外,還用色調(diào)飽和度亮度(HueSaturationLightness,HSL)表示。
在HSL模型中,H定義顏色的波長(zhǎng),稱(chēng)為色調(diào);S定義顏色的強(qiáng)度(intensity),表示顏色的深淺程度,稱(chēng)為飽和度;L定義摻入的白光量,稱(chēng)為亮度。用HSL表示顏色的重要性,是因?yàn)樗容^容易為畫(huà)家所理解。若把S和L的值設(shè)置為1,當(dāng)改變H時(shí)就是選擇不同的純顏色;減小飽和度S時(shí),就可體現(xiàn)摻入白光的效果;降低亮度時(shí),顏色就暗,相當(dāng)于摻入黑色。因此在Windows附帶的畫(huà)圖軟件也用了HSL表示法。表5216色VGA調(diào)色板的值代碼RGBHSL相加色000016000黑(Black)10012816024060藍(lán)(Blue)2012808024060綠(Green)3012812812024060青(Cyan)412800024060紅(Red)5128012820024060品紅(Magenta)612812804024060褐色(DarkYellow)71921921921600180白(LightGray)81281281281600120深灰(DarkGray)900255160240120淡藍(lán)(LightBlue)100255080240120淡綠(LightGreen)110255255120240120淡青(LightCyan)12255000240120淡紅(LightRed)132550255200240120淡品紅(LightMagenta)14255255040240120黃(Yellow)152552552551600240高亮白(BrightWhite)5.2.2打印彩色圖像用CMY相減混色模型
一個(gè)不發(fā)光波的物體稱(chēng)為無(wú)源物體,它的顏色由該物體吸收或者反射哪些光波決定,用CMY相減混色模型。用彩色墨水或顏料進(jìn)行混合,繪制的圖畫(huà)就是一種無(wú)源物體,用這種方法生成的顏色稱(chēng)為相減色。從理論上說(shuō),任何一種顏色都可以用三種基本顏色的顏料按一定比例混合得到。這三種顏色是青色(cyan)、圖53相減混色
品紅(magenta)和黃色(yellow),通常寫(xiě)成CMY,稱(chēng)為CMY模型。用這種方法產(chǎn)生的顏色之所以稱(chēng)為相減色,是因?yàn)樗鼫p少了為視覺(jué)系統(tǒng)識(shí)別顏色所需要的反射光。
在相減混色中,當(dāng)三基色等量相減時(shí)得到黑色;等量黃色(Y)和品紅(M)相減而青色(C)為0時(shí),得到紅色(R);等量青色(C)和品紅(M)相減而黃色(Y)為0時(shí),得到藍(lán)色(B);等量黃色(Y)和青色(C)相減而品紅(M)為0時(shí),得到綠色(G)。三基色相減結(jié)果如圖53所示。
彩色打印機(jī)采用的就是這種原理,印刷彩色圖片也是采用這種原理。按每個(gè)像素每種顏色用1位表示,相減法產(chǎn)生的8種顏色如表53所示。由于彩色墨水和顏料的化學(xué)特性,用等量的三基色得到的黑色不是真正的黑色,因此在印刷術(shù)中常加一種真正的黑色(blackink),所以CMY又寫(xiě)成CMYK。表53相減色C(青色)M(品紅)Y(黃色)相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑相加色與相減色之間有一個(gè)直接關(guān)系,見(jiàn)表54所示。利用它們之間的關(guān)系,可以把顯示的顏色轉(zhuǎn)換成輸出打印的顏色。相加混色和相減混色之間成對(duì)出現(xiàn)互補(bǔ)色。例如,當(dāng)RGB為1∶1∶1時(shí),在相加混色中產(chǎn)生白色,而CMY為1∶1∶1時(shí),在相減混色中產(chǎn)生黑色。從另一個(gè)角度也可以看出它們的互補(bǔ)性,例如,RGB為0∶1∶0,對(duì)應(yīng)CMY為1∶0∶1。續(xù)表表54相加色與相減色的關(guān)系相加混色(RGB)相減混色(CMY)生成的顏色000111黑001110藍(lán)010101綠011100青100011紅101010品紅110001黃111000白5.3圖像的三個(gè)基本屬性
屬性是標(biāo)識(shí)和描述被管理對(duì)象的特性,圖像的屬性包含分辨率、像素深度、真/偽彩色、圖像的表示法和種類(lèi)等,本節(jié)將介紹前面三個(gè)特性。
5.3.1圖像分辨率
我們經(jīng)常遇到的分辨率(resolution)有兩種:屏幕分辨率和圖像分辨率。為更好地理解圖像分辨率的概念,首先介紹屏幕分辨率。
1.屏幕分辨率
屏幕分辨率也稱(chēng)顯示分辨率,它是衡量顯示設(shè)備再現(xiàn)圖像時(shí)所能達(dá)到的精細(xì)程度的度量方法。屏幕分辨率通常用水平和垂直方向所能顯示的像素?cái)?shù)目表示,寫(xiě)成“水平像素?cái)?shù)×垂直像素?cái)?shù)”,如640×480表示顯示屏分成480行,每行顯示640個(gè)像素,整個(gè)顯示屏含有307200個(gè)顯像點(diǎn)。常見(jiàn)的屏幕分辨率包括640×480、800×600、1024×768、1280×1024。水平分辨率與垂直分辨率的比例通常是4∶3,與傳統(tǒng)電視的寬高比相同,但與高清晰度電視的寬高比(16∶9)不同。
屏幕能夠顯示的像素越多,說(shuō)明顯示設(shè)備的分辨率越高,顯示的圖像質(zhì)量也就越高。顯示屏上的每個(gè)彩色像點(diǎn)由代表R、G、B三種模擬信號(hào)的相對(duì)強(qiáng)度決定,這些彩色像點(diǎn)就構(gòu)成一幅彩色圖像。
2.圖像分辨率
圖像分辨率(imageresolution)是圖像精細(xì)程度的度量方法。對(duì)同樣尺寸的一幅圖,如果像素?cái)?shù)目越多,則說(shuō)明圖像的分辨率越高,看起來(lái)就越逼真。相反,圖像顯得越粗糙。圖像分辨率也稱(chēng)空間分辨率(spatialresolution)和像素分辨率(pixelresolution)。
在圖像顯示應(yīng)用中,圖像分辨率有多種方法表示。例如:(1)物理尺寸,如“每毫米線數(shù)(或行數(shù))”;(2)行列像素,用“像素/行×行/幅”表示,如640像素/行×480行/幅;(3)像素總數(shù),如在手機(jī)的相機(jī)上標(biāo)的“1600萬(wàn)像素”;(4)單位長(zhǎng)度(面積)的像素,如像素每英寸(PixelsPerInch,PPI);(5)線對(duì)(linepair)數(shù),以黑白相鄰的兩條線為一對(duì),如“每毫米10線”表示黑線和白線相間的5對(duì)線;(6)像素深度(見(jiàn)5.3.2節(jié))。
在圖像數(shù)字化和打印應(yīng)用中,通常要指定圖像的分辨率,用每英寸多少點(diǎn)(DotsPerInch,DPI)表示。如果用300DPI來(lái)掃描一幅8″×10″的彩色圖像,就得到一幅2400×3000個(gè)像素的圖像。分辨率越高,像素就越多。
圖像分辨率與屏幕分辨率是兩個(gè)不同的概念。從行列像素角度看,圖像分辨率是構(gòu)成一幅圖像的像素?cái)?shù)目,而屏幕分辨率是顯示圖像的區(qū)域大小。例如,如果屏幕分辨率為640×480,那么一幅320×240像素的圖像只占顯示屏的1/4;相反,2400×3000像素的圖像在這個(gè)顯示屏上就不能顯示其完整的畫(huà)面。
5.3.2像素深度與阿爾法(α)通道1.像素深度像素深度是指存儲(chǔ)每個(gè)像素所用的位數(shù)。例如,在電視圖像信號(hào)數(shù)字化時(shí),記錄每個(gè)圖像樣本信號(hào)的位數(shù)為8、10、12或16位。8位表示的分辨率是1/256,10位表示的分辨率是1/1024。在這個(gè)意義上,像素深度也被認(rèn)為是圖像分辨率的一種度量方法。
像素深度決定彩色圖像的每個(gè)像素可能有的顏色數(shù),或者確定灰度圖像的每個(gè)像素可能有的灰度級(jí)數(shù)。例如,一幅彩色圖像的每個(gè)像素用R、G、B三個(gè)分量表示,若每個(gè)分量用8位,那么一個(gè)像素共用24位表示,就說(shuō)像素的深度是24,每個(gè)像素可以是224=16777216種顏色中的一種。在這個(gè)意義上,往往把像素深度說(shuō)成是圖像深度。表示一個(gè)像素的位數(shù)越多,它能表達(dá)的顏色數(shù)目就越多,而它的深度就越深。
雖然像素深度或圖像深度可以很深,但各種VGA的顏色深度卻受到限制。例如,標(biāo)準(zhǔn)VGA支持4位16種顏色的彩色圖像,多媒體應(yīng)用中通常推薦用8位256種顏色。由于設(shè)備的限制,加上人眼分辨率的限制,一般情況下,不一定要追求特別深的像素深度。此外,像素深度越深,所占用的存儲(chǔ)空間也越大。相反,如果像素深度太淺,那也影響圖像的質(zhì)量,圖像看起來(lái)讓人覺(jué)得很粗糙和很不自然。
2.α通道
在用二進(jìn)制數(shù)表示彩色圖像的像素時(shí),除R、G、B分量用固定位數(shù)表示外,往往還增加1位或幾位作為屬性(attribute)位。例如,RGB5∶5∶5表示一個(gè)像素時(shí),用2個(gè)字節(jié)共16位表示,其中R、G、B各占5位,剩下最高1位(b15)作為屬性位,用來(lái)指定該像素應(yīng)具有的性質(zhì),并把它稱(chēng)為透明(transparency)位,記為T(mén)。T的含義可以這樣來(lái)理解:假如顯示屏上已經(jīng)有一幅圖存在,如果要把另一幅圖重疊在它上面,就可用T位來(lái)控制原圖是否能看得見(jiàn)。例如,可定義T=1,原圖完全看不見(jiàn);T=0,原圖能完全看見(jiàn)。在這種情況下,屬性位T稱(chēng)為1位α通道(alphachannel),像素深度為16位,而圖像深度為15位。
在每個(gè)像素用32位的圖像表示法中,最高8位稱(chēng)為8位α通道,用于表示像素在對(duì)象中的透明度,其余24位是顏色通道,紅色、綠色和藍(lán)色分量各占8位通道。這個(gè)由8位構(gòu)成的α通道可看作是一個(gè)預(yù)乘數(shù)通道。因此,例如,一個(gè)像素(A,R,G,B)的四個(gè)分量都用規(guī)一化的數(shù)值表示,當(dāng)像素值為(1,1,0,0)時(shí)顯示紅色,當(dāng)像素值為(0.5,1,0,0)時(shí),使用α通道中的預(yù)乘數(shù)0.5與R、G、B相乘的結(jié)果就為(0.5,0.5,0,0),表示原來(lái)該像素顯示的紅色強(qiáng)度為1,而現(xiàn)在顯示的紅色的強(qiáng)度為0.5。又如,用兩幅圖像A和B混合成一幅新圖像(New),它的像素為:Newpixel=(alpha)(pixelAcolor)+(alpha)(pixelBcolor)。
用α通道描述像素屬性在實(shí)際中很有用。例如,在一幅彩色圖像上疊加文字說(shuō)明,而又不想讓文字把圖覆蓋掉,就可用α通道,而又有人把該像素顯示的顏色稱(chēng)為混合色(keycolor)。在視像產(chǎn)品生產(chǎn)過(guò)程中,也往往把數(shù)字電視圖像和計(jì)算機(jī)生產(chǎn)的圖像混合在一起,這種技術(shù)稱(chēng)為視圖混合(videokeying)技術(shù),它也采用α通道。
5.3.3真?zhèn)尾噬椭苯由?
了解真彩色、偽彩色與直接色的含義,對(duì)于編寫(xiě)圖像顯示程序、理解圖像文件的存儲(chǔ)格式都有很大幫助,對(duì)“本來(lái)是用真彩色表示的圖像,但在VGA顯示器上顯示的顏色卻不是原來(lái)圖像的顏色”這類(lèi)現(xiàn)象也不會(huì)感到困惑。
1.真彩色
真彩色(truecolor)是指每個(gè)像素的顏色值用紅(R)、綠(G)和藍(lán)(B)表示的顏色。例如,用RGB5∶5∶5表示圖像顏色,R、G、B各用5位,其值大小直接確定三個(gè)基色的強(qiáng)度,這樣得到的彩色是真實(shí)的原圖彩色。真彩色通常用24位表示,因此也稱(chēng)24位顏色(24bitcolor)或全彩色(fullcolor),其顏色數(shù)目為224=16777216種。
2.偽彩色
偽彩色(pseudocolor)是指每個(gè)像素的顏色不是由每個(gè)基色分量的數(shù)值直接決定的顏色,而是把像素值當(dāng)作彩色查找表(ColorLookUpTable,CLUT)的表項(xiàng)入口地址,去查找顯示圖像時(shí)使用的R、G、B值,用查找出的R、G、B值產(chǎn)生的彩色稱(chēng)為偽彩色。
彩色查找表(CLUT)是一個(gè)事先做好的表,表項(xiàng)入口地址也稱(chēng)為索引號(hào)。例如,在有256種顏色的查找表中,0號(hào)索引對(duì)應(yīng)黑色……255號(hào)索引對(duì)應(yīng)白色。彩色圖像本身的像素?cái)?shù)值和彩色查找表的索引號(hào)有一個(gè)變換關(guān)系,這個(gè)關(guān)系可以使用Windows定義的變換關(guān)系,也可以使用你自己定義的變換關(guān)系。使用查找得到的數(shù)值顯示的彩色是真的,但不是圖像本身真正的顏色,它沒(méi)有完全反映原圖的顏色。
3.直接色
每個(gè)像素值由R、G、B分量構(gòu)成,每個(gè)分量作為單獨(dú)的索引值對(duì)它做變換,也就是通過(guò)相應(yīng)的彩色變換表找出基色強(qiáng)度,用變換后的R、G、B強(qiáng)度值產(chǎn)生的顏色稱(chēng)為直接色(directcolor)。它的特點(diǎn)是對(duì)每個(gè)基色進(jìn)行變換。
5.4圖像的種類(lèi)[4/5]5.4.1矢量圖與位圖在計(jì)算機(jī)中,表示圖像的常用方法有兩種,一種稱(chēng)為矢量圖法,生成的圖像叫作矢量圖(vectorgraphics),另一種稱(chēng)為位圖法,生成的圖像叫作位圖(bitmap或bitmappedimage)。雖然這兩種圖像的表示方法不同,但在顯示器上顯示的結(jié)果幾乎沒(méi)有差別。
1.矢量圖
矢量圖是用一系列計(jì)算機(jī)指令描繪的圖,如點(diǎn)、線、面、曲線、圓、矩形以及它們的組合,如圖54(a)所示。這種方法實(shí)際上是用許多數(shù)學(xué)表達(dá)式描述一幅圖,再用計(jì)算機(jī)語(yǔ)言來(lái)表達(dá),在顯示圖像時(shí),還可看到畫(huà)圖的過(guò)程。繪制和顯示這種圖的軟件通常稱(chēng)為繪圖程序(drawprograms),存放這種圖的存儲(chǔ)格式稱(chēng)為矢量圖格式,存儲(chǔ)的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述。
矢量圖有許多優(yōu)點(diǎn)。例如,目標(biāo)圖像的移動(dòng)、縮小或放大、旋轉(zhuǎn)、拷貝、屬性(如線條變寬變細(xì)、顏色)變更都很容易做到;相同的或類(lèi)似的圖可以把它們當(dāng)作圖的構(gòu)造塊,并把它們存到圖庫(kù)中,這樣不僅可加速矢量圖的生成,而且可減小矢量圖的文件大小。
然而,對(duì)于真實(shí)世界的彩照,恐怕就很難用數(shù)學(xué)方法來(lái)描述,這就要用位圖法表示。
……
你還可能感興趣
我要評(píng)論
|