成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Java字符編碼根本原理

開發 后端
Java開發中,常常會遇到亂碼的問題,一旦遇到這種問題,常常就很扯蛋,每個人都不愿意承認是自己的代碼有問題。其實編碼問題并沒有那么神秘,那么不可捉摸,搞清Java的編碼本質過程就真相大白了。

Java開發中,常常會遇到亂碼的問題,一旦遇到這種問題,常常就很扯蛋,每個人都不愿意承認是自己的代碼有問題。其實編碼問題并沒有那么神秘,那么不可捉摸,搞清Java的編碼本質過程就真相大白了。

先看個圖:

 

其實,編碼問題存在兩個方面:JVM之內和JVM之外。

1、Java文件編譯后形成class

這里Java文件的編碼可能有多種多樣,但Java編譯器會自動將這些編碼按照Java文件的編碼格式正確讀取后產生class文件,這里的class文件編碼是Unicode編碼(具體說是UTF-16編碼)。

因此,在Java代碼中定義一個字符串:

String s="漢字";

不管在編譯前java文件使用何種編碼,在編譯后成class后,他們都是一樣的----Unicode編碼表示。

2、JVM中的編碼

JVM加載class文件讀取時候使用Unicode編碼方式正確讀取class文件,那么原來定義的String s="漢字";在內存中的表現形式是Unicode編碼。

當調用String.getBytes()的時候,其實已經為亂碼買下了禍根。因為此方法使用平臺默認的字符集來獲取字符串對應的字節數組。在WindowsXP中文版中,使用的默認編碼是GBK,不信運行下:

  1. public class Test {   
  2. public static void main(String[] args) {   
  3. System.out.println("當前JRE:" + System.getProperty("java.version"));   
  4. System.out.println("當前JVM的默認字符集:" + Charset.defaultCharset());   
  5. }   

當前JRE:1.6.0_16

當前JVM的默認字符集:GBK

當不同的系統、數據庫經過多次編碼后,如果對其中的原理不理解,就容易導致亂碼。因此,在一個系統中,有必要對字符串的編碼做一個統一,這個統一模糊點說,就是對外統一。比如方法字符串參數,IO流,在中文系統中,可以統一使用GBK、GB13080、UTF-8、UTF-16等等都可以,只是要選擇有些更大字符集,以保證任何可能用到的字符都可以正常顯示,避免亂碼的問題。(假設對所有的文件都用ASCII碼)那么就無法實現雙向轉換了。

要特別注意的是,UTF-8并非能容納了所有的中文字符集編碼,因此,在特殊情況下,UTF-8轉GB18030可能會出現亂碼,然而一群傻B常常在做中文系統喜歡用UTF-8編碼而不說不出個所以然出來!最傻B的是,一個系統多個人做,源代碼文件有的人用GBK編碼,有人用UTF-8,還有人用GB18030。FK,都是中國人,也不是外包項目,用什么UTF-8啊,神經!源代碼統統都用GBK18030就OK了,免得ANT腳本編譯時候提示不可認的字符編碼。

因此,對于中文系統來說,***選擇GBK或GB18030編碼(其實GBK是GB18030的子集),以便***限度的避免亂碼現象。

3、內存中字符串的編碼

內存中的字符串不僅僅局限于從class代碼中直接加載而來的字符串,還有一些字符串是從文本文件中讀取的,還有的是通過數據庫讀取的,還有可能是從字節數組構建的,然而他們基本上都不是Unicode編碼的,原因很簡單,存儲優化。

因此就需要處理各種各樣的編碼問題,在處理之前,必須明確“源”的編碼,然后用指定的編碼方式正確讀取到內存中。如果是一個方法的參數,實際上必須明確該字符串參數的編碼,因為這個參數可能是另外一個日文系統傳遞過來的。當明確了字符串編碼時候,就可以按照要求正確處理字符串,以避免亂碼。

在對字符串進行解碼編碼的時候,應該調用下面的方法:

  1. getBytes(String charsetName)   
  2. String(byte[] bytes, String charsetName) 

而不要使用那些不帶字符集名稱的方法簽名,通過上面兩個方法,可以對內存中的字符進行重新編碼。

原文鏈接:http://lavasoft.blog.51cto.com/62575/273608/

【編輯推薦】

  1. Java中對象的等價性比較
  2. Java自定義異常類
  3. Java編程:數據的截尾與舍入
  4. Java版A星算法實現步驟
  5. Tomcat運行Java Web內存溢出總結
責任編輯:林師授 來源: 熔巖的博客
相關推薦

2023-10-09 10:43:27

2022-10-12 17:42:54

MySQL數據表磁盤

2024-07-10 11:43:28

2012-01-12 14:37:34

jQuery

2010-03-18 20:13:03

Java socket

2013-04-17 10:59:17

三網融合網絡技術

2009-03-09 08:46:28

聯想柳傳志虧損

2011-11-29 12:17:00

2009-02-24 09:43:00

IP電話原理

2021-03-30 22:47:09

網絡故障IT

2024-07-29 09:38:47

2016-08-17 23:53:29

網絡爬蟲抓取系統

2021-02-08 21:40:04

SockmapBPF存儲

2019-11-28 10:45:28

ZooKeeper源碼分布式

2016-08-18 00:04:09

網絡爬蟲抓取系統服務器

2010-08-20 13:29:33

OFDM

2013-04-07 14:09:55

Android應用基本

2020-03-21 14:57:14

手機定位智能手機APP

2020-07-09 15:20:16

代碼開發GitHub

2020-10-25 11:44:21

1024程序員節程序員
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久免费 | 一级a性色生活片久久毛片波多野 | 国产一级片91 | 六月成人网 | 久久久久久91香蕉国产 | 中文字幕一区二区三区不卡 | 亚洲欧美网| 盗摄精品av一区二区三区 | 在线看片国产精品 | 九九99久久 | 久久久www成人免费无遮挡大片 | 一本一道久久a久久精品综合蜜臀 | 日韩中文字幕在线视频 | 日韩国产精品一区二区三区 | 国产成人久久精品 | 国产成都精品91一区二区三 | 伊人在线 | 一区二区三区四区不卡视频 | 2019精品手机国产品在线 | 日韩成人久久 | 成人av电影免费在线观看 | 成人一级视频在线观看 | 成人免费在线播放 | 国产一区二区三区免费视频 | 国产一区日韩在线 | 亚州激情| 精品粉嫩超白一线天av | 99精品一级欧美片免费播放 | 涩在线| 亚洲免费视频网址 | 国产精品久久久久久婷婷天堂 | 日韩一区二区在线视频 | 欧美日韩1区2区 | 羞羞免费网站 | 中文字幕av亚洲精品一部二部 | 国产精品国产a级 | 国产电影一区 | 久久久.com| 一级做a爰片性色毛片 | 91素人| 99精品欧美一区二区蜜桃免费 |