欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

java架構(gòu)師必須掌握的編碼有哪些

本篇內(nèi)容主要講解“java架構(gòu)師必須掌握的編碼有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“java架構(gòu)師必須掌握的編碼有哪些”吧!

公司主營業(yè)務(wù):成都做網(wǎng)站、成都網(wǎng)站制作、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。成都創(chuàng)新互聯(lián)公司推出臨沭免費做網(wǎng)站回饋大家。

編碼在我們?nèi)粘i_發(fā)過程中經(jīng)常有遇到,常見的編碼格式有ASCII、ISO-8859-1、GB2312、GBK、GB18030、UNICODE、UTF-8、UTF-16等,其中GB2312、GBK、GB18030、UTF-8、UTF-16都可以用來表示中文。

為什么有編碼

我們知道計算機中最小的存儲單位是字節(jié)(byte),一個字節(jié)所能表示的字符數(shù)又有限,1byte=8bit,一個字節(jié)最多也只能表示255個字符,而世界上的語種又多,都有各種不同的字符,無法用一個byte表示,所以java中的char表示字符就是來解決這種編碼問題的,一個char占兩個字節(jié),所以從char到最小單位byte之間必須經(jīng)過編碼。

java架構(gòu)師必須掌握的編碼有哪些

常用編碼

ASCII

全稱為American Standard Code for Information Interchange,美國信息交換標(biāo)準(zhǔn)代碼,這是世界上最通用的單字節(jié)編碼系統(tǒng),主要用來顯示現(xiàn)代英語及其他西歐語言。

ASCII碼用7位表示,只能表示128個字符,0~31表示控制字符如回車、退格、刪除等;32~126表示打印字符即可以通過鍵盤輸入并且能顯示出來的字符,

其中48~57為0到9十個阿拉伯?dāng)?shù)字,65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標(biāo)點符號、運算符號等,具體可以參考ASCII標(biāo)準(zhǔn)表。

ISO-8859-1

既然ASCII只能表示128個字符,顯示是不能完全表示完的,所以ISO-8859-1擴展了ASCII編碼,在ASCII編碼之上又增加了西歐語言、希臘語、泰語、阿拉伯語、希伯來語對應(yīng)的文字符號,它是向下兼容ASCII編碼的。

ISO-8859-1也是單字節(jié)編碼,但它是一個8位的容器,它能表示256個字符。

GB2312

全稱為信息交換用漢字編碼字符集,是中國于1980年發(fā)布,主要用于計算機系統(tǒng)中的漢字處理。GB2312主要收錄了6763個漢字、682個符號。

GB2312覆蓋了漢字的大部分使用率,但不能處理像古漢語等特殊的罕用字,所以后來出現(xiàn)了像GBK、GB18030這種編碼。

GBK

GBK,全稱為Chinese Internal Code Specification,即漢字內(nèi)碼擴展規(guī)范,于1995年制定。它主要是擴展了GB2312,在它的基礎(chǔ)上又加了更多的漢字,它一共收錄了21003個漢字。

GBK是向下兼容GB2312編碼的,也就是說GB2312編碼的漢字可以用GBK正常解碼不會出現(xiàn)亂碼,但用GBK編碼的漢字用GB2312解碼就不一定了。

GB18030

GB18030全稱漢字內(nèi)碼擴展規(guī)范,是現(xiàn)在最新的內(nèi)碼字集于2000年發(fā)布,并于2001年強制執(zhí)行,包含了中國大部分少數(shù)民族的語言字符,收錄漢字?jǐn)?shù)超過70000余個。

它主要采用單字節(jié)、雙字節(jié)、四字節(jié)對字符編碼,它是向下兼容GB2312和GBK的,雖然是我國的強制使用標(biāo)準(zhǔn),但在實際生產(chǎn)中很少用到,用得最多的反而是GBK和GB2312。

java架構(gòu)師必須掌握的編碼有哪些

UNICODE

為了自己的語言能在計算機中正常顯示,每個國家和地區(qū)都有各自的編碼,所以編碼多了誰也不認(rèn)識對方的編碼,這時候ISO組織就提出了一種新的編碼叫UNICODE編碼讓全球的文化、字符、符號都能支持。UNICODE在制定時計算機容量已不是問題,所以設(shè)計成了固定兩個字節(jié),所有的字符都用16位表示,包括之前只占8位的英文字符等,所以會造成空間的浪費,UNICODE在很長的一段時間內(nèi)都沒有得到推廣應(yīng)用。

UTF-16

UTF-16是UNICODE的具體實現(xiàn),16即16位,UTF-16即是這個來由,定義了UNICODE字符在計算機中的存儲方式,UTF-16同樣使用了兩個字節(jié)來表示任何字符,這樣使得操作字符串非常高效,這也是java把UTF-16作為字符在內(nèi)存中存儲的格式的重要原因。

UTF-16適合在磁盤與內(nèi)存之間使用,字符和字節(jié)的相互轉(zhuǎn)換會更加簡單和高效,但不適合在網(wǎng)絡(luò)上傳輸,因為網(wǎng)絡(luò)傳輸可能會損壞字節(jié)流。

UTF-8

雖然UTF-16很高效,但也是UNICODE最大的壞處,使得所有單字節(jié)字符一定要占兩個字節(jié),存儲空間放大了一倍,這明顯消耗了資源,不符合現(xiàn)在互聯(lián)網(wǎng)高速發(fā)展的現(xiàn)狀。所以有了UTF-8,它是UNICODE的一種可變長度字符編碼的實現(xiàn),它可以使用1~6個定長字節(jié)來編碼UNICODE字符。

UTF-8對ASCII字符使用單字節(jié)存儲,單個字符損壞也不會影響后面的字符,所以UTF-8非常適合在網(wǎng)絡(luò)上面?zhèn)鹘y(tǒng),也是現(xiàn)在使用最廣泛的編碼之一。

如果要表示中文,UTF-8編碼效率要大于GBK,小于UTF-16,所以它也是除了GBK之外最理想的編碼方式。

到此,相信大家對“java架構(gòu)師必須掌握的編碼有哪些”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

分享標(biāo)題:java架構(gòu)師必須掌握的編碼有哪些
地址分享:http://www.chinadenli.net/article42/gccphc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名小程序開發(fā)面包屑導(dǎo)航網(wǎng)站內(nèi)鏈全網(wǎng)營銷推廣網(wǎng)站導(dǎo)航

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司