成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺析Servlet和Jsp中的多國語言顯示

開發(fā) 后端
本文簡單分析了Servlet、Jsp的多國語言顯示的問題,也就是Servlet的多字符集問題,所有的語言中都是有相應(yīng)編碼的,因為在計算機內(nèi)部字符串總是用內(nèi)碼來表示的,只不過一般計算機語言中的字符串編碼時平臺相關(guān)的,而Java則采用了平臺無關(guān)的UNICODE。

因為一直不信Java竟會有不能混排顯示多國語言的BUG,這個周末研究了一下Servlet、Jsp的多國語言顯示的問題,也就是Servlet的多字符集問題,由于我對字符集的概念還不是很清晰所以寫出的東西未必是準(zhǔn)確的,我是這樣理解Java中的字符集的:在運行時,每個字符串對象中存儲的都是編碼為UNICODE內(nèi)碼的(筆者認(rèn)為所有的語言中都是有相應(yīng)編碼的,因為在計算機內(nèi)部字符串總是用內(nèi)碼來表示的,只不過一般計算機語言中的字符串編碼時平臺相關(guān)的,而Java則采用了平臺無關(guān)的UNICODE)。

Java從一個byte流中讀取一個字符串時,將把平臺相關(guān)的byte轉(zhuǎn)變?yōu)槠脚_無關(guān)的Unicode字符串。在輸出時Java將把Unicode字符串轉(zhuǎn)變?yōu)槠脚_相關(guān)的byte流,如果某個Unicode字符在某個平臺上不存在,將會輸出一個´?´。舉個例子:在中文Windows中,Java讀出一個"GB2312"編碼的文件(可以是任何流)到內(nèi)存中構(gòu)造字符串對象,將會把GB2312編碼的文字轉(zhuǎn)變?yōu)閁nicode編碼的字符串,如果把這個字符串輸出又將會把Unicode字符串轉(zhuǎn)化為GB2312的byte流或數(shù)組:"中文測試"----->"u4e2du6587u6d4bu8bd5"----->"中文測試"。

byte[] bytes = new byte[]{(byte)0xd6, (byte)0xd0, (byte)0xce, 
(byte)0xc4, (byte)0xb2, (byte)0xe2, (byte)0xca, (byte)0xd4};//GBK編碼的"中文測試" java.io.ByteArrayInputStream bin = new java.io.ByteArrayInputStream(bytes); java.io.BufferedReader reader =
new java.io.BufferedReader(new java.io. InputStreamReader (bin,"GBK")); String msg = reader.readLine(); System.out.println(msg)

這段程序放到包含"中文測試"這四個字的系統(tǒng)(如中文系統(tǒng))中,可以正確地打印出這些字。msg字符串中包含了正確的"中文測試"的Unicode編碼:"u4e2du6587u6d4bu8bd5",打印時轉(zhuǎn)換為操作系統(tǒng)的默認(rèn)字符集,是否可以正確顯示依賴于操作系統(tǒng)的字符集,只有在支持相應(yīng)字符集的系統(tǒng)中,我們的信息才能正確的輸出,否則得到的將會是垃圾。

話入正題,我們來看看Servlet/Jsp中的多語言問題。我們的目標(biāo)是,任一國家的客戶端通過Form向Server發(fā)送信息,Server把信息存入數(shù)據(jù)庫中,客戶端在檢索時仍然能夠看到自己發(fā)送的正確信息。事實上,我們要保證,最終Server中的SQL語句中保存的時包含客戶端發(fā)送文字的正確Unicode編碼;DBC與數(shù)據(jù)庫通訊時采用的編碼方式能包含客戶端發(fā)送的文字信息,事實上,最好讓JDBC直接使用UNICODE/UTF8與數(shù)據(jù)庫通訊!這樣就可以確保不會丟失信息;Server向客戶端發(fā)送的信息時也要采用不丟失信息的編碼方式,也可以是Unicode/Utf8。

如果不指定Form的Enctype屬性,F(xiàn)orm將把輸入的內(nèi)容依照當(dāng)前頁面的編碼字符集urlencode之后再提交,服務(wù)器端得到是urlencoding的字符串。編碼后得到的urlencoding字符串是與頁面的編碼相關(guān)的,如gb2312編碼的頁面提交"中文測試",得到的是"%D6%D0%CE%C4%B2%E2%CA%D4",每個"%"后跟的是16進(jìn)制的字符串;而在UTF8編碼時得到的卻是"%E4%B8%AD%E6%96%87%E6%B5%8B%E8%AF%95",因為GB2312編碼中一個漢字是16位的,而UTF8中一個漢字卻是24位的。中日韓三國的ie4以上瀏覽器均支持UTF8編碼,這種方案肯定包涵了這三國語言,所以我們?nèi)绻孒tml頁面使用UTF8編碼那么將至少可以支持這三國語言。

但是,如果我們html/Jsp頁面使用UTF8編碼,因為應(yīng)用程序服務(wù)器可能不知道這種情況,因為如果瀏覽器發(fā)送的信息不包含charset信息,至多Server知道讀到Accept-Language請求投標(biāo),我們知道僅靠這個投標(biāo)是不能獲知瀏覽器所采用編碼的,所以應(yīng)用程序服務(wù)器不能正確解析提交的內(nèi)容,為什么?因為Java中的所有字符串都是Unicode16位編碼的,HttpServletRequest.request(String)的功能就是把客戶端提交的Urlencode編碼的信息轉(zhuǎn)為Unicode字符串,有些Server只能認(rèn)為客戶端的編碼和Server平臺相同,簡單地使用URLDecoder.decode(String)方法直接解碼,如果客戶端編碼恰好和Server相同,那么就可以得到正確地字符串,否則,如果提交地字符串中包含了當(dāng)?shù)刈址敲磳?dǎo)致垃圾信息。

【編輯推薦】

  1. JSP中文編碼問題解決方法詳解
  2. JSP頁面查詢顯示的常用模式
  3. 高性能、高彈性JSP和Servlet性能優(yōu)化
責(zé)任編輯:佚名 來源: TechWeb
相關(guān)推薦

2009-06-10 18:01:35

netbeans下載多國語言開發(fā)版

2011-06-21 09:19:24

Qt 界面 多國語言

2009-07-06 17:11:38

Servlet文件上傳

2009-05-29 09:48:05

Sandboxie瀏覽器

2011-03-16 13:47:44

IE9

2009-06-25 14:26:07

JSPJavaBeanServlet

2009-07-06 15:34:56

JSP和Servlet

2009-07-03 14:41:03

2009-07-03 17:41:47

JavaBean Se

2011-06-30 13:37:29

MFC Qt 多國語

2009-07-01 17:34:03

Servlet和JSP

2009-07-08 09:22:03

Servlet和JSP

2009-06-30 15:37:27

Servlet和JSP

2009-07-09 10:49:56

Servlet和JSP

2009-07-07 13:29:33

Servlet和JSP

2009-07-07 14:04:55

JSP入門

2009-06-30 17:10:28

JSP和Servlet

2009-06-30 14:51:19

JSP和Servlet

2009-06-29 16:24:00

JSP和Servlet

2009-07-02 10:51:21

腳本編程JSP開發(fā)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产在线精品一区二区三区 | 国产高清精品一区二区三区 | 免费中文字幕 | 日韩欧美三级 | 亚洲欧美日本在线 | 国产精品海角社区在线观看 | 久久成人精品视频 | 黄页网址在线观看 | 日韩精品在线看 | 午夜影院在线观看 | 国产精品欧美精品 | 精品久久中文字幕 | 九九热在线视频 | 国产视频线观看永久免费 | 作爱视频免费看 | 欧美精品一区二区三区四区五区 | 日韩黄| 蜜桃在线视频 | 亚洲精品中文字幕在线观看 | 国产精品毛片一区二区在线看 | 国产精品久久久久久久久免费樱桃 | 一区二区精品 | 日韩视频在线一区 | 国产精品久久久久久久久久久免费看 | 在线成人| 人人爽人人爽人人片av | 天堂网avav | 午夜视频在线观看一区二区 | 欧美一区二区在线观看视频 | 亚洲精品日本 | 欧美日韩网站 | 一区二区三区四区在线视频 | 日韩精品一区二区在线 | 亚洲一区二区三区四区五区午夜 | 午夜免费成人 | 福利一区在线观看 | 一级毛片色一级 | 四虎影视| 日韩成人一区二区 | 久久久久一区二区 | 97久久精品午夜一区二区 |