成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

談談WEB開發中的苦大難字符集問題

開發 前端
記得剛做javaweb開發的時候被這個編碼問題搞得暈頭轉向,經常稀里糊涂的編碼正常了一會編碼又亂了。那個時候迫于項目進度大多都是知其然不知其所以然。后來有時間就把整個體系搞了個遍,終于摸通了來龍去脈。

記得剛做javaweb開發的時候被這個編碼問題搞得暈頭轉向,經常稀里糊涂的編碼正常了一會編碼又亂了。那個時候迫于項目進度大多都是知其然不知其所以然。后來有時間就把整個體系搞了個遍,終于摸通了來龍去脈。

在C++的CGI開發時大家喜歡用latin,這個屬于字節方式的編碼格式,存儲mysql節約空間,而C++也是比較容易控制到byte級別的語言。所以經過框架封裝基本也問題不大。

在Java語言中,要涉及修改編碼問題的地方還真多。一個地方沒有設好就會亂碼滿天飛。大概總結包括以下這幾部分:瀏覽器、服務器、數據庫、操作系統。

瀏覽器:

如果使用模板語言,html需要設置顯示的字符集。這個適用于瀏覽器判斷什么編碼顯示。

  1. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 

擴展,瀏覽器識別編碼的順序:
1.如果HTTP頭部申明了charset,則會使用HTTP頭部的,
2.讓HTTP頭部沒有設置,則會去解析meta標簽的,
3.如果meta也沒有的話,瀏覽器會根據是否設置了auto detect來進行編碼識別,
4.否則會使用本地UI的字符編碼。

服務器:
對于JSP等動態語言,需要在jsp頭部設置編碼格式,J2EE服務器解析這個JSP的時候才會把整個頁面編碼為UTF-8輸出,不然就按照系統默認編碼格式ISO-8859-1輸出了。JSP設置格式如下:

  1. <%@ page language"java" contentType = "text/html; charset=UTF-8" 
  2.       pageEncoding ="UTF-8" %> 

大家都知道,JSP對應的就是servlet。servlet的編碼對應如下設置:

  1. public void service(HttpServletRequest request, HttpServletResponse response) 
  2. throws ServletException,IOException{ 
  3. response.setContentType("text/html;charset=utf-8"); 

還有不要漏掉大家常用的spring工具類,編碼轉換filter,很實用。在你用struts、spring mvc時這個過濾器幫你轉換沒有設置的編碼過濾。如下設置:

  1. <filter> 
  2.             <filter-name> Set Character Encoding</filter-name> 
  3.             <filter-class> 
  4.                  org.springframework.web.filter.CharacterEncodingFilter 
  5.             </filter-class> 
  6.             <init-param> 
  7.                   <param-name> encoding</param-name> 
  8.                   <param-value> UTF-8</param-value> 
  9.             </init-param> 
  10.       </filter> 

萬一還有亂碼怎么辦呢?doGet方式的參數傳遞肯定會有亂碼問題。只需要在tomcat的監聽器里設置編碼字符集如下(文件一般存儲在 /tomcat安裝目錄/conf/server.xml ):

  1. <Connector port="80" protocol="HTTP/1.1" 
  2.               connectionTimeout="20000" 
  3.               redirectPort="8443" URIEncoding="utf-8"   /> 

大家在開發的時候別忘了java文件本身也是有編碼格式的。在類文件右鍵查看屬性。

eclipse屬性

 

 

如果開發時忘記更改文件的編碼格式,windows默認是GBK的,后來又要一直到utf8編碼的linux怎么辦。文件巨多,總不能一個一個去更改吧。其實很簡單,只需要在java命令的環境參數設置 -Dfile.encoding=GBK 解決。

編譯java代碼時,如果使用ant需要在javac里設置編譯的字符集。這樣打印的log輸出到文件或者控制臺上就不會亂碼了。

  1. <javac debuglevel"source,lines" source"1.6"   encoding"utf-8"> 

maven編譯時設置的字符集:

  1. < artifactId> maven-compiler-plugin </artifactId > 
  2.        < version> 2.5 </version > 
  3.                         
  4.          < configuration> 
  5.            < optimize> true </optimize > 
  6.            < showDeprecation> false </showDeprecation > 
  7.            < debuglevel> lines,source </debuglevel > 
  8.             < source> 1.6 </source > 
  9.             < target> 1.6 </target > 
  10.             < encoding> UTF-8 </encoding > 
  11.             < meminitial> 128m </meminitial >   
  12.              < maxmem> 768m </maxmem > 
  13.                         
  14.          </ configuration> 

sqlmap的sql xml,sping的xml 也是需要設置的,因為涉及到跨平臺。 頂上添加:

  1. <!--?xml version="1.0" encoding="UTF-8"?--> 

數據庫:
這里列出大家用的最多的Mysql字符集設置。打開mysql的配置文件( linux 一般在 /etc/my.cnf ,windows在mysql的安裝目錄 my.ini)。設置如下:

  1. [mysqld] 
  2. default-character-set = utf8 
  3.  
  4. [ mysql] 
  5. character_set_server = utf8 

jdbc需要設置

jdbc : mysql://192.168.0.237:3306/dzh_db?useUnicode=true&characterEncoding=UTF-8

這些都設置了一般的中文是不會有問題的。

不過最近出現了一個問題很搞怪。以前以為所有的字符只要設置好了所有數據都可以錄入數據庫,結果有些字符就不行,比如●■★這類型的。后來把這些字符變成字節碼,居然不是三位utf8的,我擦,大汗淋漓。后來查詢可以通過過濾utf8 特殊字符的方式處理。

#p#

  1. public static String Utf2String (byte buf[]) { 
  2. int len = buf.length ; 
  3. StringBuffer sb = new StringBuffer(len / 2); 
  4. for (int i = 0; i &lt; len; i++) { 
  5.  
  6. if (by2int(buf[i]) &lt;= 0x7F) 
  7. sb.append(( char ) buf[i]); 
  8. else if (by2int(buf[i]) &lt;= 0xDF &amp;&amp; by2int(buf[i]) &gt;= 0xC0) { 
  9. int bh = by2int(buf[i] &amp; 0x1F); 
  10. int bl = by2int(buf[++i] &amp; 0x3F); 
  11.  
  12. bl = by2int(bh &lt;&lt; 6 | bl); bh = by2int(bh &gt;&gt; 2); 
  13. int c = bh &lt;&lt; 8 | bl; 
  14. sb.append(( char ) c); 
  15. } else if (by2int(buf[i]) &lt;= 0xEF &amp;&amp; by2int(buf[i]) &gt;= 0xE0) { 
  16. int bh = by2int(buf[i] &amp; 0x0F); 
  17. int bl = by2int(buf[++i] &amp; 0x3F); 
  18. int bll = by2int(buf[++i] &amp; 0x3F); 
  19.  
  20. bh = by2int(bh &lt;&lt; 4 | bl &gt;&gt; 2); 
  21. bl = by2int(bl &lt;&lt; 6 | bll); 
  22.  
  23. int c = bh &lt;&lt; 8 | bl; 
  24. // 空格轉換為半角 
  25. if (c == 58865) { 
  26. c = 32
  27. sb.append(( char ) c); 
  28.  
  29. return sb.toString(); 

或者把mysql的字符集改為 utf8mb4 ,記得這個只有mysql55支持哦!

  1. [mysqld] 
  2. default-character-set =utf8mb4 
  3.  
  4. [ mysql] 
  5. character_set_server = utf8mb4 

操作系統:

windows默認是gbk,一般不需要變動。不過大家又想每個文件都要建立為utf8格式怎么辦,不可能我們每個文件建立后都去用屬性改變一下?太麻煩!直接在eclipse設置后,同種類型的文件建立都會是utf8格式。

eclipse屬性2

 

linux,可以有兩個地方修改基本就足夠了:

vi /etc/sysconfig/i18n

修改

  1. LANG="zh_CN.GB3212" 
  2. LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN" 
  3. SUPPORTED="zh_CN.GB18030:zh_CN:zh:en_US.UTF-8:en_US:en" 

vi /etc/profile

  1. export LC_ALL="zh_CN.GB2312" 
  2. export LANG="zh_CN.GB2312" 

原文鏈接:http://www.lanceyan.com/tech/arch/web_luanma.html

責任編輯:陳四芳 來源: lanceyan.com
相關推薦

2011-05-16 13:15:55

MySQL存儲字符集

2010-05-17 10:01:09

MySql字符集

2010-06-11 16:46:20

MySQL5

2009-07-01 00:23:40

MySQL字符集亂碼

2010-04-30 10:16:22

Oracle字符集

2011-04-11 10:59:33

Oracle字符集

2011-02-24 09:27:00

Java字符集編碼

2010-04-21 16:07:16

Oracle 8i

2011-04-11 11:05:12

Oracle字符集

2010-04-22 09:08:30

Oracle 8i

2010-06-13 10:06:05

MySQL4.1.7

2010-06-07 16:09:58

MySQL字符集

2020-12-16 06:34:16

MySQL字符集服務器

2021-03-23 18:21:30

MySQL數據庫字符集

2010-06-02 17:59:19

MySQL字符集

2010-06-10 13:34:17

MySQL5

2009-11-20 16:52:35

Oracle字符集

2011-05-20 13:24:39

oracle字符集

2010-06-13 16:17:26

MySQL改變字符集

2009-02-24 10:51:30

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区三区四区av | 国产精品18hdxxxⅹ在线 | 国产一区二区高清在线 | 亚洲午夜精品视频 | 成人在线免费视频 | 欧美成人精品激情在线观看 | 免费国产一区二区视频 | 国产精品久久 | 最新国产精品 | 极品粉嫩国产48尤物在线播放 | 做a的各种视频 | 国产高清精品在线 | 精品伊人 | 国产在线一区二区 | 午夜欧美一区二区三区在线播放 | 日韩一区二区三区在线观看视频 | 超级黄色一级片 | 日韩av在线不卡 | 四虎影院一区二区 | 国产高清精品在线 | 日本精品久久久一区二区三区 | 国产中文视频 | 日韩视频中文字幕 | 手机三级电影 | 亚洲性视频网站 | 最新一级毛片 | 日韩免费视频一区二区 | 亚洲精品久久 | 国产成人一区二区三区精 | 少妇性l交大片免费一 | 欧美亚洲综合久久 | 国产一区久久精品 | 亚洲精品成人网 | 97精品视频在线 | 国产一区二区精品在线观看 | 丁香五月网久久综合 | 波多野结衣中文字幕一区二区三区 | 天天色天天射天天干 | 中文字幕一区二区三区四区五区 | 国产精品久久久久久久久图文区 | 国产精品一区二区三区在线 |