計算機(jī)中的文字表達(dá)方式.pptx
《計算機(jī)中的文字表達(dá)方式.pptx》由會員分享,可在線閱讀,更多相關(guān)《計算機(jī)中的文字表達(dá)方式.pptx(11頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
計算機(jī)中的文字表達(dá)方式,1.ASCII碼2.GB2312編碼3.Big5編碼4.Unicode編碼5.輸入編碼6.字型碼,一.文字表達(dá)方式的種類1.ASCII碼,ASCII(AmericanStandardCodeforInformationInterchange,美國信息互換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語和其他西歐語言。它是現(xiàn)今最通用的單字節(jié)編碼2010年12月8日叫基礎(chǔ)ASCII碼,使用7位二進(jìn)制數(shù)來表示所有的大寫和小寫字母,數(shù)字0到9、標(biāo)點(diǎn)符號,以及在美式英語中使用的特殊控制字符。ASC11碼編碼的編碼規(guī)則是在下表中確定的,它是一種約定順序編碼,每個字符在ASC11碼表中的順序號成為字符的ASC值,它有兩種形式,一種包含128個字符,另一種包含256個字符。包括128個字符的ASC碼表,ASC值范圍是0~127,計算機(jī)中使用7個二進(jìn)制位就可以表示,因此稱為7位二進(jìn)制碼。包含256個字符的ASC碼表,在7位碼表的基礎(chǔ)上,增加了對128個字符的支持。國際上7位ASC碼有廣泛的支持,對8位ASC11值支持程度較弱,尤其在中文環(huán)境下因?yàn)橥瑵h字的存儲編碼相沖突,8位ASC11碼值不被支持。在7位ASC11碼值中,字符總體上分為兩大類:控制字符和可顯示字符??刂谱址糜陲@示、打印、警告或傳輸過程和解釋,在頻幕上不顯示,其ASC11值得范圍是0~31及127。可顯示字符則同英文中出現(xiàn)的各種字母和個符號相對應(yīng),涵蓋了英文所需要的所有文字符號,其ASC11值范圍是32~126,可細(xì)分為以下幾大類:英文字符,ASC11值范圍是32~47、58~64、91~96及123~126;數(shù)字字符,ASC11值是48~57;大寫英文字母,ASC11值是65~90;小寫英文字母,ASC11值范圍是97~122.,2.GB2312編碼,GB2312或GB2312-80是一個簡體中文字符集的中國國家標(biāo)準(zhǔn),全稱為《信息交換用漢字編碼字符集基本集》,又稱為GB0,由中國國家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。GB2312編碼通行于中國大陸;新加坡等地也采用此編碼。中國大陸幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB2312。GB2312標(biāo)準(zhǔn)共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個全角字符。ASC11碼值得出現(xiàn)有效的解決了西文文字的信息化問題,但對于漢字字符卻完全不適用,為了滿足國內(nèi)在計算機(jī)中使用文字的需要,中國國家標(biāo)準(zhǔn)總局發(fā)布了一系列的漢字字符集國家標(biāo)準(zhǔn)編碼,統(tǒng)稱為GB碼或國標(biāo)碼,其中最有影響的是與1980年發(fā)布的《信息交換用漢字編碼字符集基本集》,標(biāo)準(zhǔn)號為GB2312-1980.因其使用非常普遍,也常被統(tǒng)稱為國標(biāo)碼.GB2312是一個簡體中文字符集,由6763個常用漢字和682個全角的非漢字字符組成,其中漢字根據(jù)使用的頻率可分為兩級。一級漢字3755個,二級漢字3008個。由于字符數(shù)量比較大,GB2312采用了二維矩陣編碼法對所有字符進(jìn)行編碼。首先構(gòu)造一個94列的方陣,對每一行成為一個“區(qū)”,每一列稱為一個“位”,然后將所有字符依照下表的規(guī)律填寫在方陣中。這樣所有的字符在方陣中都有一個唯一的位置,這個位置可以用區(qū)號、位號合成表示,稱為字符的區(qū)位碼。因?yàn)閰^(qū)位碼同字符的位置是完全對應(yīng)的,因此區(qū)位碼同字符之間也是一一對應(yīng)的。,3.Big5編碼,“大五碼”(Big5)是在1984年由臺灣13家廠商與臺灣地區(qū)財團(tuán)法人信息工業(yè)策進(jìn)會為五大中文套裝軟件所設(shè)計的中文內(nèi)碼,所以就稱為Big5中文內(nèi)碼,雖然五大套裝軟件并沒有成功,但Big5碼卻深遠(yuǎn)地影響中文電腦內(nèi)碼,直至今日?!拔宕蟠a”的英文名稱“Big5”后來被人按英文字序譯回中文,以致現(xiàn)在有“五大碼”和“大五碼”兩個中文名稱。大五碼是一種繁體中文漢字字符集,其中繁體漢字13053個,808個標(biāo)點(diǎn)符號,希臘字母及特殊符號。大五碼的編碼碼表直接針對存儲而設(shè)計、每個字符統(tǒng)一使用兩個字節(jié)存儲表示。第一字節(jié)范圍81H~FEH,避開了同ASCII碼的沖突,第二字節(jié)范圍是40H~7EH和A1H~FEH,在同一正文不能對兩種字符集的字符同時支持。,Big5編碼的字符編碼分布表,4.Unicode編碼,Unicode字符集可以簡寫為UCS(UnicodeCharacterSet)。早期的Unicode標(biāo)準(zhǔn)有UCS-2、UCS-4的說法。UCS-2用兩個字節(jié)編碼,UCS-4用4個字節(jié)編碼。UCS-4根據(jù)最高位為0的最高字節(jié)分成2^7=128個group。每個group再根據(jù)次高字節(jié)分為256個平面(plane)。每Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。Unicode用數(shù)字0-0 x10FFFF來映射這些字符,最多可以容納1114112個字符,或者說有1114112個碼位。碼位就是可以分配給字符的數(shù)字。UTF-8、UTF-16、UTF-32都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案。,UCS是一種字符集編碼法,主要用于計算機(jī)程序和操作系統(tǒng)內(nèi)部。在存儲和傳輸中,往往不直接使用UCS編碼而是通過一定的轉(zhuǎn)換程序來實(shí)現(xiàn)。這些轉(zhuǎn)換編碼最通用的是utf8和utf16.由于大量使用的ASC11碼字符兼容所提出的UCS的一種實(shí)現(xiàn)就是utf8.utf8就是采用變長字節(jié)表示一個字符,盡管有節(jié)約存儲和傳輸資源的好處,但也同時導(dǎo)致軟件實(shí)現(xiàn)有困難。平面根據(jù)第3個字節(jié)分為256行(row),每行有256個碼位(cell)。group0的平面0被稱作BMP(BasicMultilingualPlane)。將UCS-4的BMP去掉前面的兩個零字節(jié)就得到了UCS-2。,五輸入編碼,世界上使用漢字的人口約占世界總?cè)丝诘乃姆种?,因此研究和發(fā)展?jié)h字輸入編碼是一項(xiàng)非常急迫的任務(wù)。中國是漢字的發(fā)源國,漢字應(yīng)用已有數(shù)千年歷史。一九八七年中國研究漢字輸入編碼的人員已近四百人,不論在深度和廣度上,都走在世界前列。漢字從形編碼利用人們已有的漢字書寫知識,在鍵盤上象寫字一樣打入筆畫和字根,從計算機(jī)內(nèi)選出漢字,既直接又方便。從音編碼是以一九五八年二月十一日全國人大批準(zhǔn)公布的《漢語拼音方案》為基本編碼元素。漢語拼音是以北京語音為標(biāo)準(zhǔn)音,以北方語為基礎(chǔ)方言,以典范的白話文著作為語法規(guī)范的普通話。自推廣普通話以來,已有相當(dāng)數(shù)量的人掌握了漢語拼音,以此為基礎(chǔ)作漢字輸入編碼,為這部分人所樂于接受。但中國各地方言復(fù)雜,不少人還難以做到準(zhǔn)確認(rèn)讀漢字,因此容易出現(xiàn)差錯。,6.字型碼,漢字字型碼又稱字字模,用于漢字在顯示屏或打印機(jī)輸出。漢字字型碼通常有兩種表示方式:點(diǎn)陣和矢量表示方法。用點(diǎn)陣表示字型時,漢字字型碼指的是這個漢字字型點(diǎn)陣的代碼。根據(jù)輸出漢字的要求不同,點(diǎn)陣的多少也不同。簡易型漢字為16*16點(diǎn)陣,提高型漢字為24*24點(diǎn)陣,32*32點(diǎn)陣,48*48點(diǎn)陣等等。點(diǎn)陣規(guī)模愈大,字型愈清晰美觀,所占存儲空間也愈大矢量表示方式存儲的是描述漢字字型的輪廓特征,當(dāng)要輸出漢字時,通過計算機(jī)的計算,由漢字字型描述生成所需大小和形狀的漢字點(diǎn)陣。矢量化字型描述與最終文字顯示的大小,分辨率無關(guān),因此可以產(chǎn)生高質(zhì)量的漢字輸出。Windows中使用的TrueType技術(shù)就是漢字的矢量表示方式。,二.文字輸入到顯示流程,將字符寫入一個MN的空白方格中,對表格中每個方格用一個比特(Bit)來表示,字符通過的方格用“1”表示,未通過的方格用“0”來表示,這樣將每個方格的值按照從左到右,從上到下的順序?qū)懴聛?,就形成了字符的點(diǎn)陣字型碼。顯示漢字時,則執(zhí)行相反的過程,對于點(diǎn)陣字形為“0”的比特,在頻幕中像素顯示為背景色,而為“1”的比特,則顯示為前景色。根據(jù)點(diǎn)陣編碼時使用的表格大小,常用的漢字點(diǎn)陣字庫一般分為16點(diǎn)陣、24點(diǎn)陣、32點(diǎn)陣等格式。每個漢字碼占(MN)/8個字節(jié)數(shù)。點(diǎn)陣字型碼顯示漢字的熟讀很快,但在進(jìn)行放大時由于使用字塊填充,會出現(xiàn)明顯的鋸齒邊緣。因此點(diǎn)陣字庫一邊不用于圖形環(huán)境,常用在字符操作界面中。,1.點(diǎn)陣編碼法,文字輸入到顯示流程,2.矢量編碼法,文字字符的字形信息都是由多個筆畫子圖形組成的,適量編碼發(fā)將組成的字符每一筆畫用一組直線勾勒,然后按一定順序?qū)Ω鞴P畫一體組適量來表示.顯示漢字是,首先從矢量庫中檢索字型碼。矢量編碼法所占存儲空間的字節(jié)數(shù)不是固定的,取決于字符本身的復(fù)雜度,一般來講,所含筆畫越多,筆畫越復(fù)雜的字符,字型碼所占空間越大。矢量字符在顯示時,需要進(jìn)行大量的矢量計算,耗費(fèi)時間要長一些。但矢量字形方法是以幾何方法精確勾畫輪廓的,因此具有無級縮放的優(yōu)點(diǎn)。目前,矢量字形廣泛應(yīng)用在各種圖形用戶界面的系統(tǒng)以及文本的打印輸出環(huán)境。,計算機(jī)中的文字表達(dá)方式,,完,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計算機(jī) 中的 文字 表達(dá)方式
鏈接地址:http://m.italysoccerbets.com/p-3589358.html