《數(shù)字媒體及應用》PPT課件.ppt
《《數(shù)字媒體及應用》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《數(shù)字媒體及應用》PPT課件.ppt(100頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第五章數(shù)字媒體及應用,,1、簡單文本(純文本)2、豐富格式文本3、超文本,5.1文本的分類與表示,簡單文本(plaintext):是由一連串用于表達正文內(nèi)容的字符(包括漢字)的編碼所組成,它幾乎不包含任何其他的格式信息和結(jié)構(gòu)信息。這種文本通常稱為純文本或ASCII文本,在PC機中的文件后綴名是.txt特性:呈現(xiàn)為一種線性結(jié)構(gòu),以行、字為單位,順序?qū)懽髋c閱讀是最通用的文本文件格式,文件體積小,閱讀不受限制,幾乎所有的文字處理軟件都能識別和處理,不能插入圖片、表格等,不能建立超鏈接,1、簡單文本(純文本),5.1.3文本的分類與表示,,1、簡單文本(純文本)2、豐富格式文本3、超文本,5.1.3文本的分類與表示,豐富格式文本:經(jīng)過排版處理后,純文本中就增加了許多格式控制和機構(gòu)說明信息,這樣的文本就稱為“豐富格式文本”。RTF格式:為了便于豐富格式文本能在不同的軟件和系統(tǒng)中互換使用,提出的一種公用中間格式。多媒體文檔(MultimediaDocument):含有聲音和視頻信息的文本。,2、豐富格式文本,5.1.3文本的分類與表示,,1、簡單文本(純文本)2、豐富格式文本3、超文本,5.1.3文本的分類與表示,線性文本:其內(nèi)容組織是線性的,讀者總是按照順序閱讀的文本結(jié)構(gòu)。超文本:采用網(wǎng)狀結(jié)構(gòu)來組織信息,文本中的各個部分按照其內(nèi)容的關(guān)系互相鏈接。超文本(hypertext)的閱讀方式傳統(tǒng)的順序式閱讀通過鏈接、跳轉(zhuǎn)、導航、回溯等操作實現(xiàn)跳躍式閱讀,3、超文本,5.1.3文本的分類與表示,超文本結(jié)構(gòu),超鏈(hyperlink)-有向的鏈源:超鏈的起點位置,可以是文本塊中一個標題、句子、圖標等鏈宿:超鏈的目的地,可是另一個文本塊,也可是同一文本塊中的其他部分。,5.1.3文本的分類與表示,超媒體(Hypermedia):以上所說的文本塊可以是文字,也可是圖形、圖像甚至聲音或視頻,就把超文本推廣到了多媒體形式,有時也稱為“超媒體”超文本的應用Windows等一些軟件中的“幫助”文件使用瀏覽器從Web服務器上下載的網(wǎng)頁(html或htm文件),5.1.3文本的分類與表示,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,文本編輯的主要功能對字、詞、句、段落進行添加、刪除、修改等操作字的處理:設置字體、字號、字的排列方向、間距、顏色、效果等段落的處理:設置行距、段間距、段縮進、對稱方式等表格制作和繪圖定義超鏈頁面布局:設置頁邊距、每頁行列數(shù)、分欄、頁眉、頁腳等“所見即所得”:一方面所有的編輯操作效果立即可以在屏幕上看到,另一方面在屏幕上看到的效果與打印機的輸出結(jié)果相同。,1、文本編輯,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,5.1.4文本編輯、排版與處理,文本處理內(nèi)容:字數(shù)統(tǒng)計,字頻統(tǒng)計,簡/繁體相互轉(zhuǎn)換,漢字/拼音相互轉(zhuǎn)換詞語排序,詞語錯誤檢測,文句語法檢查自動分詞,詞頻統(tǒng)計,詞性標注,詞義辨識,大陸/臺灣術(shù)語轉(zhuǎn)換文本壓縮,文本加密,文本著作權(quán)保護關(guān)鍵詞提取,文摘自動生成,文本分類文本檢索(關(guān)鍵詞檢索、全文檢索),文本過濾文語轉(zhuǎn)換(語音合成),文種轉(zhuǎn)換(機器翻譯)篇章理解,自動問答,自動寫作等,2、文本處理,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,5.1.4文本編輯、排版與處理,(1)面向通信的文本處理軟件計算機網(wǎng)絡上最普及的應用是用電子郵件進行通信。大多數(shù)情況下電子郵件正文的內(nèi)容一般都是簡單文本,因此電子郵件內(nèi)嵌的文本編輯器功能比較簡單,操作使用方便。典型軟件:微軟公司的OutlookExpress,具有文字的增、刪、改以及字體、字號的設置功能,也可以設定一些簡單的格式和插入一些圖片。當然郵件所帶的附件并不受此限制。,3、常用文本處理軟件,5.1.4文本編輯、排版與處理,(2)面向辦公的文本處理軟件功能要求:文本制作的高效率、高質(zhì)量軟件面向非專業(yè)用戶,易學好用文本處理能力,既功能豐富,又操作簡單排版功能典型軟件:MS-OfficeWPS2000,5.1.4文本編輯、排版與處理,(3)面向出版的文本處理軟件排版軟件的主要功能:將文字、圖形和圖像等合理地安排在頁面內(nèi)典型排版軟件:方正集團公司的“飛騰”排版軟件美國Adobe公司的PageMaker和PDFWriter,5.1.4文本編輯、排版與處理,(4)面向網(wǎng)絡信息發(fā)布和電子出版的文本處理軟件面向電子出版的軟件美國Adobe公司的AcrobatPDF格式文件將文字、字型、格式、顏色、圖形、圖像、超文本鏈接、聲音和視頻等信息都封裝在一個文件中,不僅適合于網(wǎng)絡和電子出版,也適合于印刷出版,實現(xiàn)紙張印刷和網(wǎng)絡出版的統(tǒng)一。,5.1.4文本編輯、排版與處理,文本輸出:在屏幕上進行閱讀、瀏覽打印輸出等操作。文本展現(xiàn)過程:首先要對文本的格式描述進行解釋,然后生成文字和圖、表的映像(bitmap),最后再傳送到顯示器或打印機輸出。文本閱讀器:承擔上述文本輸出任務的軟件,也稱為瀏覽器。它們可以嵌入在文本處理軟件中,如微軟的Word,也可以是獨立的軟件,如Adobe公司的AcrobatReader,微軟公司的IE等。,5.1.5文本的展現(xiàn),第五章數(shù)字媒體及應用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應用5.4數(shù)字視頻及應用,5.2圖像與圖形,本節(jié)重點:圖像的數(shù)字化圖像的表示方法圖像的屬性信息圖像的壓縮編碼常用圖像文件格式數(shù)字圖像處理計算機合成圖像的應用,從現(xiàn)實世界中通過數(shù)字化設備獲取的圖像,稱為:取樣圖像、也稱點陣圖像、位圖圖像——簡稱圖像。計算機合成的圖像(syntheticimage),稱為:矢量圖形(vectorgraphics),簡稱圖形(graphics),數(shù)字圖像按生成方法分類:,5.2圖像與圖形,圖像的獲?。簭默F(xiàn)實世界中獲得數(shù)字圖像的過程圖像獲取的過程實質(zhì)上是模擬信號的數(shù)字化過程,它的處理步驟:掃描分色取樣量化,1、圖像的數(shù)字化,5.2.1數(shù)字圖像的獲取,圖像的數(shù)字化過程,,注:通過上述方法所獲取的數(shù)字圖像稱為取樣圖像,它是靜止圖像的數(shù)字化表示形式,通常簡稱為”圖像“。,5.2.1數(shù)字圖像的獲取,設備:圖像獲取所使用的設備通稱為圖像獲取設備設備的功能:將現(xiàn)實的景物輸入到計算機內(nèi)并以取樣圖像的形式表示例:2D圖像獲取設備(如掃描儀、數(shù)碼相機等)只能對圖片或景物的2D投影進行數(shù)字化3D掃描儀能獲取包括深度信息在內(nèi)的3D景物的信息,2、數(shù)字圖像獲取設備,5.2.1數(shù)字圖像的獲取,從取樣圖像的獲取過程可以知道,一幅取樣圖像由M(列)*N(行)個取樣點組成,每個取樣點是組成取樣圖像的基本單位,稱為像素(pictureelement,簡寫為pel)。彩色圖像的像素是矢量,它由3個彩色分量組成,灰色圖像的像素只有1個亮度分量。,1、圖像的表示方法與主要參數(shù),5.2.2圖像的表示與壓縮編碼,彩色圖像的表示,230,227,220,220,226,229,231,233,229,224,220,219,223,226,233,240,225,222,215,214,220,221,224,225,227,223,218,216,217,219,225,225,183,187,182,177,174,175,175,168,188,180,168,156,162,158,153,147,178,177,158,156,166,159,154,150,176,175,151,150,170,159,156,155,,,,,,,,,,,,,,,,,,,217,210,197,202,220,233,231,228,220,213,196,197,214,224,227,224,210,207,194,198,210,212,212,211,218,207,196,192,202,215,210,212,225,216,197,193,196,208,203,208,224,217,189,181,184,178,175,174,231,223,200,177,180,175,178,179,226,216,205,176,176,176,176,178,,,,,,,,,,,,,,,,,,,220,212,206,200,225,230,230,228,230,216,200,197,214,226,225,222,238,214,192,194,210,213,214,217,234,212,195,192,202,218,214,211,237,220,205,198,198,218,215,219,235,229,207,194,191,190,185,182,233,239,217,192,188,179,184,182,231,225,220,190,190,187,177,180,,,,,,,,,,,,,,,,,,,紅色分量,綠色分量,藍色分量,,,5.2.2圖像的表示與壓縮編碼,取樣圖像在計算機中的表示方法:灰色圖像用一個矩陣來表示彩色圖像用一組(一般是3個)矩陣來表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示,一般是8位至12位,5.2.2圖像的表示與壓縮編碼,圖像的屬性信息圖像大小,也稱圖像分辨率(垂直分辨率*水平分辨率)顏色空間的類型,指彩色圖像所使用的顏色描述方法,也叫顏色模型。常用顏色模型:RGB(紅、綠、藍)、CMYK(青、品紅、黃、黑)、HSV(色彩、飽和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有顏色分量的二進制位數(shù)之和,它決定了不同顏色(亮度)的最大數(shù)目。,5.2.2圖像的表示與壓縮編碼,練習:,某一彩色圖像有R、G、B三基色組成,若三個分量的像素位數(shù)分別為2,4,8,則該圖像的像素深度為?最大顏色數(shù)目為?,一幅圖像的數(shù)據(jù)量可按下面的公式進行計算(以字節(jié)為單位):圖像數(shù)據(jù)量=圖像水平分辨率圖像垂直分辨率像素深度/8幾種常用圖像的數(shù)據(jù)量,2、圖像的壓縮編碼,從表中可看出,即使是單幅(靜止的)數(shù)字圖像,其數(shù)據(jù)量也很大。,5.2.2圖像的表示與壓縮編碼,圖像數(shù)據(jù)壓縮的可能性:由于數(shù)字圖像中的數(shù)據(jù)相關(guān)性很強,數(shù)據(jù)的冗余度很大,因此對數(shù)字圖像進行大幅度的數(shù)據(jù)壓縮是完全可能的。而且,人眼的視覺有一定的局限性,即使壓縮前后的圖像有一定失真,只要限制在人眼允許的誤差范圍之內(nèi),也是允許的。,5.2.2圖像的表示與壓縮編碼,數(shù)據(jù)壓縮類型無損壓縮:壓縮以后的數(shù)據(jù)進行圖像還原(也稱為解壓縮)時,重建的圖像與原始圖像完全相同例如:行程長度編碼(RLE)、哈夫曼(Huffman)編碼有損壓縮:使用壓縮后的數(shù)據(jù)進行圖像重建時,重建后的圖像與原始圖像雖有一定的誤差,但不影響人們對圖像含義的正確理解。如變換編碼、矢量編碼等,5.2.2圖像的表示與壓縮編碼,圖像壓縮方法很多,不同方法適用于不同的應用,在計算機中常常是多種壓縮方法的綜合使用。為得到較高的數(shù)據(jù)壓縮比,一般都采用有損壓縮。壓縮編碼方法優(yōu)劣的評價壓縮倍數(shù)的大小重建圖像的質(zhì)量(有損壓縮時)壓縮算法的復雜程度,5.2.2圖像的表示與壓縮編碼,圖像壓縮編碼方法的國際標準和工業(yè)標準:ISO和IEC兩個國際機構(gòu)聯(lián)合組成了一個專家組,制定了一個靜止圖像數(shù)據(jù)壓縮編碼的國際標準,稱為JPEG標準。JPEG標準的特點:適用范圍廣、能處理各種連續(xù)色調(diào)的彩色或灰度圖像、算法復雜度適中、既可用硬件實現(xiàn),也可用軟件實現(xiàn)圖像的壓縮比可控制(壓縮比越低,圖像質(zhì)量越好;壓縮比越高,圖像質(zhì)量越差),5.2.2圖像的表示與壓縮編碼,3、常用圖像文件格式,5.2.2圖像的表示與壓縮編碼,BMP圖像:微軟公司在Windows操作系統(tǒng)下使用的一種標準圖像文件格式,一個文件存放一幅圖像,可以使用行程長度編碼(RLE)進行無損壓縮,也可不壓縮。不壓縮的BMP文件是一種通用的圖像文件格式,幾乎所有Windows應用軟件都能支持。,5.2.2圖像的表示與壓縮編碼,TIFF(TaggedImageFileFormat)圖像文件格式:用于掃描儀和桌面出版,能支持多種壓縮方法和多種不同類型的圖像,有許多應用軟件支持這種文件格式。,5.2.2圖像的表示與壓縮編碼,GIF:互聯(lián)網(wǎng)上廣泛使用的一種圖像文件格式,它的顏色數(shù)目較少(不超過256色),文件特別小,適合網(wǎng)絡傳輸。由于顏色數(shù)目有限,GIF適用于插圖、剪貼畫等色彩數(shù)目不多的應用場合。GIF格式能夠支持透明背景,具有在屏幕上漸進顯示的功能。尤為突出的是,它可以將許多張圖像保存在同一個文件中,顯示時按預先規(guī)定的時間間隔逐一進行顯示,從而形成動畫的效果,因而在網(wǎng)頁制作中大量使用。,5.2.2圖像的表示與壓縮編碼,5.2.3數(shù)字圖像處理與應用,1、數(shù)字圖像處理數(shù)字圖像處理:使用計算機對來自照相機、攝像機、傳真機、掃描儀、醫(yī)用CT機、X光機等的圖像,進行去噪、增強、復原、分割、提取特征、壓縮、存儲、檢索等操作處理,對圖像進行處理的主要目的提高圖像的視感質(zhì)量圖像復原與重建圖像分析圖像數(shù)據(jù)的變換、編碼和數(shù)據(jù)壓縮,用以更有效地進行圖像的存儲和傳輸圖像的存儲、管理、檢索,以及圖像內(nèi)容與知識產(chǎn)權(quán)的保護,5.2.3數(shù)字圖像處理與應用,與應用領域密切相關(guān),通常具有很強的專業(yè)性,如遙感圖像處理軟件、醫(yī)學圖像處理軟件等。使用較多的是面向辦公、出版與信息發(fā)布的圖像處理軟件,也稱為圖像修飾(imageretouching)或圖像編輯軟件,支持多種不同的圖像文件格式,提供多種圖像編輯處理功能,可制作出生動形象的圖像。如美國Adobe公司的PhotoShop,它集圖像掃描、圖像編輯、繪圖、圖像合成及圖像輸出等多種功能于一體,是一個流行的圖像處理工具。,2、圖像處理軟件,5.2.3數(shù)字圖像處理與應用,圖像的顯示控制圖像區(qū)域的選擇圖像的編輯操作圖像的濾鏡操作繪圖功能文字編輯功能圖層操作,PhotoShop的主要功能包括,5.2.3數(shù)字圖像處理與應用,圖像通信遙感醫(yī)療診斷工業(yè)生產(chǎn)中的應用機器人視覺軍事、公安、檔案管理,3、數(shù)字圖像的應用,5.2.3數(shù)字圖像處理與應用,景物的模型(model):景物在計算機內(nèi)的描述景物的建模(modeling):人們進行景物描述的過程繪制(rendering):也稱圖像合成(imagesynthesis),根據(jù)景物的模型生成圖像的過程,所產(chǎn)生的數(shù)字圖像稱為計算機合成圖像計算機圖形學(ComputerGraphics):研究如何使用計算機描述景物并生成其圖像的原理、方法與技術(shù),1、景物形狀的計算機表示,5.2.4計算機圖形,幾何模型:景物建模的方法與景物的類型有關(guān)。普通工業(yè)產(chǎn)品(如電視機、電話機、汽車、飛機等),使用基本的幾何元素(如點、線、面、體等)及表面材料的性質(zhì)等進行描述所建立的模型幾何模型應用:工業(yè)產(chǎn)品的計算機輔助設計/制造過程模型/算法模型:根據(jù)景物的生成規(guī)律,并使用相應的算法來描述其規(guī)律所建立的模型,5.2.4計算機圖形,使用計算機合成圖像的主要優(yōu)點:能生成實際存在的具體景物的圖像,還能生成假想或抽象景物的圖像能生成靜止圖像,還能生成各種運動、變化的動態(tài)圖像,2、計算機合成圖像的繪制,5.2.4計算機圖形,3、計算機合成圖像的應用,計算機合成圖像的應用:計算機輔助設計和輔助制造(CAD/CAM)利用計算機生成各種地形圖、交通圖、天氣圖、海洋圖、石油開采圖等作戰(zhàn)指揮和軍事訓練計算機動畫和計算機藝術(shù)其他:電子出版、數(shù)據(jù)處理、工業(yè)監(jiān)控、輔助教學(CAI)、軟件工程等,5.2.4計算機圖形,矢量圖形:計算機合成圖像矢量繪圖軟件:制作矢量圖形的軟件如:AutoCAD、MAPInfo、ARCInfo等2D的矢量繪圖軟件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微軟公司的MicrosoftVisio微軟公司Office辦公套件中的Word和PowerPoint,4、矢量繪圖軟件,5.2.4計算機圖形,第五章數(shù)字媒體及應用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應用5.4數(shù)字視頻及應用,5.3數(shù)字聲音及應用,本節(jié)重點:聲音信號數(shù)字化的過程波形聲音的獲取設備波形聲音的主要參數(shù)第2代全頻帶聲音壓縮編碼標準計算機合成聲音,5.3數(shù)字聲音及應用,數(shù)字聲音是一種在時間上連續(xù)的媒體,數(shù)據(jù)量大,對存儲和傳輸?shù)囊蟊容^高。,5.3.1波形聲音的獲取與播放,1、聲音信號的數(shù)字化聲音:由振動而產(chǎn)生,通過空氣進行傳播。它由許多不同頻率的諧波所組成,諧波的頻率范圍稱為聲音的帶寬(bandwidth),帶寬是聲音的一項重要參數(shù)。,多媒體技術(shù)處理的聲音信號主要是人耳可聽到的20~20kHz的音頻信號(audio)言語(speech)/語音:人說話的聲音,其頻率范圍約為300~3400Hz全頻帶聲音:音樂聲、風雨聲、汽車聲等其他聲音,其帶寬可達到20~20kHz,5.3.1波形聲音的獲取與播放,聲音信號的數(shù)字化:將模擬聲音信號轉(zhuǎn)換成二進制數(shù)字編碼形式以便于計算機進行處理的過程聲音信號數(shù)字化的過程:取樣量化編碼,模擬聲音信號,,取樣,,量化,,編碼,,數(shù)字聲音,011010011101……,5.3.1波形聲音的獲取與播放,模擬的聲音信號轉(zhuǎn)變成數(shù)字形式進行處理的優(yōu)點:以數(shù)字形式存儲的聲音重放性能好,復制時沒有失真數(shù)字聲音的可編輯性強,易于進行效果處理數(shù)字聲音能進行數(shù)據(jù)壓縮,傳輸時抗干擾能力強數(shù)字聲音容易與其他媒體相互結(jié)合(集成)數(shù)字聲音為自動提取“元數(shù)據(jù)”和實現(xiàn)基于內(nèi)容的檢索創(chuàng)造了條件,5.3.1波形聲音的獲取與播放,麥克風:將聲波轉(zhuǎn)換為電信號,然后由聲卡進行數(shù)字化聲卡(soundcard):進行數(shù)字化,主要功能包括:波形聲音的獲取與數(shù)字化:把模擬的聲音信號轉(zhuǎn)換為數(shù)字形式。波形聲音的重建與播放MIDI(MusicalInstrumentDigitalInterface)聲音的輸入MIDI聲音的合成與播放,2、波形聲音的獲取設備,5.3.1波形聲音的獲取與播放,聲卡組成與工作原理原理:聲卡以數(shù)字信號處理器(DSP)為核心,DSP在完成數(shù)字聲音的編碼、解碼及聲音編輯操作中起著重要的作用。它利用PCI總線與主機進行數(shù)據(jù)交換,混音器(mixer)的將不同的聲音信號進行混音,并提供音量控制功能。(圖)PC機的聲卡較多的已經(jīng)與主板集成在一起,不再做成獨立的插卡。利用聲卡可在線(on-line)獲取聲音;使用數(shù)碼錄音筆可離線(off-line)獲取聲音,然后再通過USB接口直接將已經(jīng)數(shù)字化的聲音數(shù)據(jù)送入計算機中。,5.3.1波形聲音的獲取與播放,聲音播放:計算機輸出聲音的過程,通常為兩步:1、聲音重建:把聲音從數(shù)字形式轉(zhuǎn)換成模擬信號形式,也由聲卡完成。(圖)解碼:把壓縮編碼的數(shù)字聲音恢復為壓縮編碼前的狀態(tài)數(shù)模轉(zhuǎn)換:把聲音樣本以數(shù)字量轉(zhuǎn)換為模擬量。插值處理:通過插值把時間上離散的一組樣本轉(zhuǎn)換成在時間上連續(xù)的模擬聲音信號。2、將模擬聲音信號經(jīng)過處理和放大送到揚聲器發(fā)出聲音,3、聲音的播放,聲音的重建由什么完成的?,5.3.1波形聲音的獲取與播放,數(shù)字聲音,,解碼,,數(shù)模轉(zhuǎn)換,,插值,,重建的模擬聲音信號,011010011101……,波形聲音的重建,5.3.1波形聲音的獲取與播放,5.3.2波形聲音的表示與壓縮編碼,1、波形聲音的主要參數(shù)取樣頻率量化位數(shù)聲道數(shù)目使用的壓縮編碼方法數(shù)碼率(bitrate):指的是每秒鐘的數(shù)據(jù)量,也稱比特率、碼率數(shù)字聲音未壓縮前,其計算公式為:波形聲音的碼率=取樣頻率量化位數(shù)聲道數(shù)壓縮編碼以后的碼率=壓縮前的碼率/壓縮倍數(shù),幾種常見數(shù)字聲音的主要參數(shù),5.3.2波形聲音的表示與壓縮編碼,第2代全頻帶聲音壓縮編碼標準,5.3.2波形聲音的表示與壓縮編碼,MPEG-1聲音壓縮編碼是國際上第一個高保真聲音數(shù)據(jù)壓縮的國際標準,它分為三個層次:層1(Layer1):編碼簡單,用于數(shù)字盒式錄音磁帶層2(Layer2):算法復雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等層3(Layer3):編碼復雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸。如MP3音樂——一種采用MPEG-1層3編碼的高質(zhì)量數(shù)字音樂,它能以10倍左右的壓縮比降低高保真數(shù)字聲音的存儲量。,5.3.2波形聲音的表示與壓縮編碼,杜比數(shù)字AC-3(DolbyDigitalAC-3):美國杜比公司開發(fā)的多聲道全頻帶聲音編碼系統(tǒng),它提供的環(huán)繞立體聲系統(tǒng)由5個或7個全頻帶聲道加一個超低音聲道組成,所有聲道的信息在制作和還原過程中全部數(shù)字化,信息損失很少,細節(jié)豐富,具有真正的立體聲效果,在數(shù)字電視、DVD和家庭影院中廣泛使用。,5.3.2波形聲音的表示與壓縮編碼,流媒體:一方面要求數(shù)字聲音壓縮后數(shù)據(jù)量要小,另一方面還要使聲音數(shù)據(jù)的組織適合于流式傳輸。聲音流媒體產(chǎn)品RealNetworks公司的RA(RealAudio)數(shù)字音頻微軟公司的WMA(WindowsMediaAudio)數(shù)字音頻蘋果公司的QuickTime,5.3.2波形聲音的表示與壓縮編碼,語音:空氣通過聲道引起聲門振動產(chǎn)生語音帶寬只有300~3400Hz壓縮方法:采用波形編碼(基于感覺模型的壓縮方法)PCM(脈沖編碼)和ADPCM(自適應差分脈沖編碼)特點:碼率較高(64kb/s、32kb/s)、語音質(zhì)量高、算法簡單、易實現(xiàn)應用:固定電話通信系統(tǒng)、多媒體文檔,3、數(shù)字語音的壓縮編碼,5.3.2波形聲音的表示與壓縮編碼,5.3.3波形聲音的編輯,聲音編輯軟件的功能錄制聲音編輯聲音聲音的效果處理格式轉(zhuǎn)換播放聲音,5.3.4計算機合成聲音,計算機合成聲音,,語音合成,音樂合成,語音合成(Speechsynthesis):根據(jù)語言學和自然語言理解的知識,使計算機模仿人把一段文字朗讀出來,這個過程稱為文語轉(zhuǎn)換(Text-To-Speech,簡稱TTS)。計算機合成語音的應用:股票交易、航班動態(tài)查詢、電話報稅等業(yè)務有聲E-mail服務CAI課件或游戲解說詞的自動配音文稿校對、語言學習、語音秘書、自動報警、殘疾人服務等,5.3.4計算機合成聲音,音樂合成音樂是使用樂器演奏而成的音源:也稱為音樂合成器(musicsynthesizer),它能模仿許多樂器生成各種不同音色的音符。PC機的聲卡一般都帶有音源樂譜在計算機中采用一種叫MIDI的音樂描述語言來表示MIDI是樂譜的數(shù)字表示方法,使用MIDI描述的音樂稱為MIDI音樂一首樂曲對應一個MIDI文件,其文件擴展名為.MID,5.3.4計算機合成聲音,MIDI文件在Windows系統(tǒng)中可以使用媒體播放器進行播放。播放MIDI音樂的過程(圖):媒體播放器軟件從磁盤上讀入MID文件把其中的一個個MIDI消息發(fā)送給聲卡上的音樂合成器由音樂合成器解釋并執(zhí)行MIDI消息所規(guī)定的操作合成出各種音色的音符,通過揚聲器播放出樂曲來,5.3.4計算機合成聲音,MIDI音樂的播放:,5.3.4計算機合成聲音,MIDI音樂與高保真的波形聲音相比:缺點:音質(zhì)方面較差無法合成出所有各種不同的聲音(例如語音)優(yōu)點:數(shù)據(jù)量很少(比CD-DA少3個數(shù)量級,比MP3少2個數(shù)量級)易于編輯修改可以與波形聲音同時播放,5.3.4計算機合成聲音,第五章數(shù)字媒體及應用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應用5.4數(shù)字視頻及應用,5.4數(shù)字視頻及應用,本節(jié)重點:視頻采集卡視頻壓縮編碼的標準及其應用,5.4數(shù)字視頻及應用,視頻(video):指的是內(nèi)容隨時間變化的一個圖像序列,也稱為活動圖像(motionpicture)。常見的視頻有電視和計算機動畫。電視:能傳輸和再現(xiàn)真實世界的圖像與聲音,是當代最有影響力的信息傳播工具。數(shù)字視頻:數(shù)字化的電視信號稱為數(shù)字視頻。計算機動畫:是計算機制作的圖像序列,是一種計算機合成的視頻。,基本概念:,電視畫面:一種由光點自左向右、自上向下而掃描形成的光柵掃描圖像,一般采用隔行掃描方式,即圖像由奇數(shù)場和偶數(shù)場兩部分組成,合起來組成一幀圖像,1、電視基本知識,5.4.1數(shù)字視頻基礎,PAL制式(中國采用)幀頻25幀/s,場頻50場/s,遠距離傳輸時用亮度信號Y和兩個色度信號U、V來表示優(yōu)點:能與黑白電視接收機保持兼容,Y分量由黑白電視機直接顯示而無需做進一步處理可以利用人眼對兩個色度信號不太靈敏的視覺特性來節(jié)省電視信號的帶寬和發(fā)射功率,5.4.1數(shù)字視頻基礎,彩色信號的YUV表示與RGB表示的轉(zhuǎn)換:亮度分量Y=0.3R+0.59G+0.11B色度分量U=0.493(B-Y)色度分量V=0.877(R-Y),,5.4.1數(shù)字視頻基礎,數(shù)字視頻與模擬視頻相比的優(yōu)點:復制和傳輸時不會造成質(zhì)量下降容易進行編輯修改有利于傳輸(抗干擾能力強,易于加密)可節(jié)省頻率資源,2、視頻信號的數(shù)字化,5.4.1數(shù)字視頻基礎,以一幀幀畫面為單位進行由于采用YUV彩色空間,人眼對顏色信號的敏感度遠不如對亮度信號靈敏,所以色度信號的取樣頻率可以比亮度信號的取樣頻率低,以減少數(shù)字視頻的數(shù)據(jù)量,5.4.1數(shù)字視頻基礎,視頻采集卡:PC機中用于視頻信號數(shù)字化的插卡,簡稱視頻卡它能將輸入的模擬視頻信號(及伴音信號)進行數(shù)字化后存儲在硬盤中。數(shù)字化的同時,視頻圖像經(jīng)過彩色空間轉(zhuǎn)換(從YUV轉(zhuǎn)換為RGB),然后與計算機圖形顯示卡產(chǎn)生的圖像疊加,用戶可在顯示器屏幕上指定窗口中監(jiān)看(聽)其內(nèi)容。,5.4.1數(shù)字視頻基礎,數(shù)字攝像頭:在線獲取數(shù)字視頻的設備。通過光學鏡頭采集圖像,然后直接將圖像轉(zhuǎn)換成數(shù)字信號并輸入到PC機,不再需要視頻采集卡進行模數(shù)轉(zhuǎn)換。最高分辨率:640480,一般:352288,速度:30幀/s左右,鏡頭視角:45~60度光傳感器:大多采用CCD,部分采用CMOS類型,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394(火線)接口。,5.4.1數(shù)字視頻基礎,數(shù)字攝像機:一種離線的數(shù)字視頻獲取設備。原理:與數(shù)碼相機類似,功能更多壓縮編碼:視頻圖像及伴音使用MPEG記錄介質(zhì):磁帶,硬盤接口:USB,IEEE1394,5.4.1數(shù)字視頻基礎,數(shù)字視頻的數(shù)據(jù)量很大解決上述問題的出路是對數(shù)字視頻信息進行數(shù)據(jù)壓縮。由于視頻信息中畫面內(nèi)部有很強的信息相關(guān)性,相鄰畫面的內(nèi)容又有高度的連貫性,再加上人眼睛的視覺特性,所以數(shù)字視頻的數(shù)據(jù)量可壓縮幾十倍甚至幾百倍。,數(shù)字視頻壓縮的可行性,5.4.2數(shù)字視頻的壓縮編碼,視頻壓縮編碼的標準及其應用,5.4.2數(shù)字視頻的壓縮編碼,數(shù)字視頻的編輯,是在非線性編輯器的軟件支持下進行的使用模式:把電視節(jié)目素材存入硬盤中,根據(jù)需要對不同長短、不同順序的素材進行剪輯,同時配上字幕、特技和各種動畫,再進行配音、配樂,最終制作成高質(zhì)量的電視節(jié)目核心軟件:數(shù)字視頻編輯器,如AdobePremiere,5.4.3數(shù)字視頻的編輯,概念:采用計算機制作可供實時演播的一系列連續(xù)畫面的一種技術(shù)?;A:計算機圖形學制作過程:先在計算機中生成場景和形體的模型→描述它們的運動→生成圖像并轉(zhuǎn)換為視頻信號輸出,5.4.4合成視頻——計算機動畫,創(chuàng)作軟件:二維動畫軟件如AnimatorPro三維動畫軟件如3DStudioMAX等動畫網(wǎng)頁類型:GIF動畫:目前WEB網(wǎng)頁上最常用的動畫表現(xiàn)形式之一。Adobe的ImageReady工具,在使用時只要先將圖片制作好,保存成gif、bmp或jpg格式文件,然后再按序?qū)雊if文件即可。FLASH動畫:廣泛使用的WEB網(wǎng)頁動畫制作軟件。制作的的動畫是矢量圖形,不管放大縮小都清晰可見。.swf很小,便于傳輸且有交互性。,5.4.4合成視頻——計算機動畫,CD(CompactDisc):小型光盤,最早應用于數(shù)字音響領域,代表產(chǎn)品是CD唱片。每張CD唱片的存儲容量是650MB左右,可存放1小時的立體聲高保真音樂。,1、VCD與DVD,5.4.5數(shù)字視頻的應用,VideoCD(簡稱VCD):1994年由JVC、Philips等公司聯(lián)合定義的一種以數(shù)字技術(shù)在CD光盤上存儲視頻和音頻信息的規(guī)范。規(guī)定了將MPEG-1音頻/視頻數(shù)據(jù)記錄在CD光盤上的文件系統(tǒng)的標準,使一張普通的CD光盤可記錄約60分鐘的音視頻數(shù)據(jù),圖像質(zhì)量達到家用錄放像機的水平,可播放立體聲。VCD播放機體積小,價格便宜,音視頻質(zhì)量較好。VCD的一個派生產(chǎn)品是KaraokeCD光盤,它同VCD保持兼容。,5.4.5數(shù)字視頻的應用,DVD(DigitalVersatileDisk):數(shù)字多用途光盤。有多種規(guī)格,用途廣泛。其中的DVD-Video(日常簡稱為DVD)就是一種類似于LD或VideoCD的家用影碟。,5.4.5數(shù)字視頻的應用,DVD-Video的特點和功能:提供32種文字或卡拉OK字幕,最多可錄放8種語言的聲音具有多結(jié)局、多角度(從9個角度選擇觀看圖像)、變焦和家長鎖定控制等功能畫面的長寬比有三種方式:全景掃描、4:3普通屏幕、16:9寬屏幕方式伴音具有5.1聲道(左、右、中、左環(huán)繞、右環(huán)繞和超重低音),實現(xiàn)三維環(huán)繞立體音響效果,5.4.5數(shù)字視頻的應用,DVD影碟與VCD相比:存儲容量大得多。CD光盤容量650MB,存放74分鐘VHS質(zhì)量(352240)的視頻圖像;單面單層DVD容量4.7GB,以平均碼率4.69Mb/s播放視頻圖像,能存放133分鐘的接近于廣播級圖像質(zhì)量(720480)的整部電影壓縮編碼:MPEG-2畫面品質(zhì)比VCD高,5.4.5數(shù)字視頻的應用,2、可視電話與視頻會議,可視電話在打電話同時還可以互相看見對方的圖像。分為靜態(tài)圖像和動態(tài)圖像兩種??梢曤娫挼慕K端是集攝像、顯示、聲音與圖像的編/解碼等功能于一體的,內(nèi)置高質(zhì)量的數(shù)字變焦鏡頭及MODEM,可連接到普通的電話線上。編碼標準是H.263,圖像格式為360*288或180*144,幀頻不小于10幀每秒,音頻碼率是5.3kbit/s和6.3kbit/s兩種。,5.4.5數(shù)字視頻的應用,視頻會議通過數(shù)字音視頻數(shù)據(jù)實時傳送聲音、圖像,使得分散在兩個或多個地點的用戶就地參加會議的一種多媒體通信應用。利用計算機網(wǎng)絡進行可視電話和視頻會議具有使用方便、成本較低的優(yōu)點。,5.4.5數(shù)字視頻的應用,數(shù)字電視:將電視信號進行數(shù)字化,然后以數(shù)字形式進行編輯、制作、傳輸、接收和播放。數(shù)字電視的特點:頻道利用率高、圖像清晰度好可以開展交互式數(shù)據(jù)業(yè)務,包括電視購物、電視銀行、電視商務、電視通信、電視游戲、實時點播電視、電視網(wǎng)上游覽、觀眾參與的電視競賽等,3、數(shù)字電視,5.4.5數(shù)字視頻的應用,數(shù)字電視系統(tǒng)的構(gòu)成:信源編碼、業(yè)務復用、信道傳輸與發(fā)送美國的DTV、歐洲的DVB和日本的ISDB這幾種標準中:信源編碼中,視頻都采用MPEG-2標準,音頻采用MPEG-2或DolbyAC-3業(yè)務復用采用的都是MPEG-2系統(tǒng)層規(guī)范或其擴展形式信道及發(fā)送部分各不相同數(shù)字電視接收機(簡稱DTV接收機)的三種形式:數(shù)字電視接收機——傳統(tǒng)模擬電視接收機的換代產(chǎn)品傳統(tǒng)模擬電視機外加一個數(shù)字機頂盒可以接收數(shù)字電視的PC機,5.4.5數(shù)字視頻的應用,VOD(VideoOnDemand):視頻點播(也稱為點播電視)技術(shù)的簡稱,即用戶可以根據(jù)自己的需要收看電視節(jié)目。,4、點播電視(VOD),5.4.5數(shù)字視頻的應用,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字媒體及應用 數(shù)字 媒體 應用 PPT 課件
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權(quán),請勿作他用。
鏈接地址:http://m.italysoccerbets.com/p-11508523.html