JSP中文亂碼問題解決

大家在JSP的開發過程中,經常出現中文亂碼的問題,可能一至困擾著大家,現把JSP開發中遇到的中文亂碼的問題及解決辦法寫出來供大家參考。

首先了解一下Java中文問題的由來:Java的內核和class文件是基于unicode的,這使Java程序具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP文件本身編譯時產生的亂碼問題和Java程序與其他媒介交互產生的亂碼問題。首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字節流的,如果Java和JSP編譯成class文件過程中,使用的編碼方式與源文件的編碼不一致,就會出現亂碼。基于這種亂碼,建議在Java文件中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關系),如果必須寫的話,盡量手動帶參數-ecoding GBK或-ecoding gb2312或-ecoding UTF-8編譯;對于JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>基本上就能解決這類亂碼問題。

JSP頁面亂碼##

這種亂碼問題比較簡單,一般是頁面編碼不一致導致的亂碼,一般新手容易出現這樣的問題,具體分以下兩種情況:

未指定使用字符集編碼###

下面的顯示頁面(display.jsp)就出現亂碼:

<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html charset=gb2312">
    </head>
    <body>
        <%out.print("JSP的中文處理");%>
    </body>
</html>

這種亂碼的原因是沒有在頁面里指定使用的字符集編碼,JSP頁面中出現了中文字符,而默認的ISO-8859-1字符集中無中文字符,解決方法:只要在頁面開始地方用下面代碼指定字符集編碼即可,在JSP頁面中指定編碼方式(gb2312),和瀏覽器解碼方式設置相同,即在頁面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就可以消除亂碼了。完整頁面如下:

<%@ page contentType="text/html; charset=gb2312"%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html charset=gb2312">
    </head>
    <body>
        <%out.print("JSP的中文處理");%>
    </body>
</html>

編碼字符集設置不一致###

下面的顯示頁面(display.jsp)就出現亂碼:

<%@ page language="java" pageEncoding="gb2312"%>
<%@ page contentType="text/html;charset=iso8859-1"%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html charset=gb2312">
    </head>
    <body>
        <%out.print("JSP的中文處理");%>
    </body>
</html>

這個出現亂碼原因是由于頁面編碼不一致導致的亂碼,在這個例子中我們可以看到有三處設置字符集的地方,下面分別了解一下這三處設置具體含義:

第一處<%@ page language="java" pageEncoding="gb2312"%>的編碼格式為jsp文件的存儲格式。Eclipse會根據這個編碼格式保存文件。并編譯jsp文件,包括里面的漢字。
第二處<%@ page contentType="text/html;charset=iso8859-1"%>的編碼為解碼格式。因為存為gb2312的文件被解碼為iso8859-1,這樣如有中文肯定出亂碼。也就是必須一致。而第二處所在的這一行,可以沒有。缺省也是使用iso8859-1的編碼格式。所以如果沒有這一行的話,也會出現亂碼。必須一致才可以。
第三處<meta http-equiv="Content-Type" content="text/html charset=gb2312">的編碼為控制瀏覽器的解碼方式。如果前面的解碼都一致并且無誤的話,這個編碼格式用不用設置都可以。有的網頁出現亂碼,就是因為瀏覽器不能確定使用哪種編碼格式。因為頁面有時候會嵌入頁面,導致瀏覽器混淆了編碼格式出現了亂碼。

完整解決代碼如下:

<%@ page language="java" pageEncoding="gb2312"%>
<%@ page contentType="text/html;charset= gb2312"%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html charset=gb2312">
    </head>
    <body>
        <%out.print("JSP的中文處理");%>
    </body>
</html>

表單提交中文時出現亂碼##

下面是一個提交頁面(submit.jsp),代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>
<html>
    <head><title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    </head>
    <body>
        <form name="form1" method="post/get" action="process.jsp">
            <div align="center">
                <input type="text" name="name">
                <input type="submit" name="Submit" value="Submit">
            </div>
        </form>
    </body>
</html>

下面是處理頁面(process.jsp)代碼:

<%@ page contentType="text/html; charset=gb2312"%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    </head>
    <body>
        <%=request.getParameter("name")%>
    </body>
</html>

如果submit.jsp提交英文字符能正確顯示,如果提交中文時就會出現亂碼。原因:瀏覽器默認使用UTF-8編碼方式來發送請求,而UTF- 8和GB2312編碼方式表示字符時不一樣,這樣就出現了不能識別字符。

POST提交方式###

解決辦法:(A)接受參數時進行編碼轉換

String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;

修改后的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    </head>
    <body>
        <%
        String s=new String(request.getParameter("name").getBytes("ISO-8859-1"),"gb2312") ;
        out.print(s);
        %>
    </body>
</html>

如果使用該方法的話,每一個參數都必須這樣進行轉碼。很麻煩。但確實可以拿到漢字。

解決辦法:(B)通過request.seCharacterEncoding ("gb2312")對請求進行統一編碼,就實現了中文的正常顯示,修改后的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>
<%request.seCharacterEncoding("gb2312");%>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    </head>
    <body>
        <%=request.getParameter("name")%>
    </body>
</html>

如果使用該方法接受此參數的頁面就不必在轉碼了,即可得到漢字參數。但每頁都需要執行這句話。

解決辦法:(C)為了避免每頁都要寫request.setCharacterEncoding("gb2312"),可以使用過濾器對所有jsp進行編碼處理。就是使用Servlet規范中的過慮器指定編碼,主要代碼如下:

import java.io.*;
import javax.servlet.Filter; 
import javax.servlet.FilterChain; 
import javax.servlet.FilterConfig; 
import javax.servlet.ServletException; 
import javax.servlet.ServletRequest; 
import javax.servlet.ServletResponse; 

public class SetCharacterEncodingFilter implements Filter {

    protected String encoding = null; 
    public void destroy(){ 
        this.encoding = null; 
    } 

    public void init(FilterConfig filterConfig) throws ServletException {
         this.encoding = filterConfig.getInitParameter("encoding");
    }

    public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException {
        request.setCharacterEncoding(encoding);
        response.setContentType("text/html;charset="+encoding);
        chain.doFilter(request, response);
    }
}

過濾器在web.xml中的配置如下:

<filter>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <filter-class>SetCharacterEncodingFilter</filter-class>
    <init-param>
        <param-name>encoding</param-name>
        <param-value>gb2312</param-value>
    </init-param>
</filter>

<filter-mapping>
    <filter-name>SetCharacterEncodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
</filter-mapping>

修改后的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>
<html>
    <head>
        <title>JSP的中文處理</title>
    </head>
    
    <body>
        <%=request.getParameter("name")%>
    </body>
</html>

以上方法只對POST方式提交有效果。

GET提交方式###

如果使用get方式提交中文,接受參數的頁面也會出現亂碼,這個亂碼的原因也是tomcat的內部編碼格式iso8859-1導致。Tomcat會以get的缺省編碼方式iso8859-1對漢字進行編碼,編碼后追加到url,導致接受頁面得到的參數為亂碼。
解決辦法:

(A)使用POST提交方式解決辦法的第一種方式,對接受到的字符進行解碼,再轉碼。

(B)首先配置tomcat下server.xml的Connector節點增加useBodyEncodingForURI="true"屬性配置,然后在JSP頁面中加入**<%request.seCharacterEncoding("gb2312");%>**所設置的編碼格式進行編碼。

(1)Tomcat中server.xml配置如下:

<Connector port="8080" protocol="HTTP/1.1" 
    connectionTimeout="20000" 
    redirectPort="8443" 
    useBodyEncodingForURI="true" />

<Connector port="8080" protocol="HTTP/1.1" 
    URIEncoding="gb2312"  
    connectionTimeout="20000"    
    redirectPort="8443" />

(2)修改后的process.jsp代碼如下:

<%@ page contentType="text/html; charset=gb2312"%>
<% request.seCharacterEncoding("gb2312"); %>
<html>
    <head>
        <title>JSP的中文處理</title>
        <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    </head>
    <body>
        <%=request.getParameter("name")%>
    </body>
</html>

數據庫連接出現亂碼##

這種亂碼會使你插入數據庫的中文變成亂碼,或者讀出顯示時也是亂碼,解決方法如下:在數據庫連接字符串中加入編碼字符集:

String Url=" jdbc:sqlserver://localhost:1433;DataBaseName=mydb;user=sa&password=sa&useUnicode=true&characterEncoding=GB2312";

并在JSP頁面中使用如下代碼:

response.setContentType("text/html;charset=gb2312");
request.setCharacterEncoding("gb2312");

JSP頁面通過URL傳遞中文參數的亂碼問題##

在項目中,我們經常遇到需要在jsp頁面切換中傳遞中文字符。例如:http://website/test1.jsp?act=add&type=蘋果。

一般來說我們很少直接在URL里面把參數寫成中文,如例子中的"type=蘋果"這樣傳遞。如果出現這種情況,在我們的接收參數的頁面我們只需要做個簡單的轉換就可以了。代碼test1.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>
<%
    String type = request.getParameter("type");
    String result = new String(type.getBytes("iso-8859-1"), "gb2312");
    out.println(result);
%>

更普遍的做法,就是對url中的中文字符進行編碼,變成類似type=%20D%20B這樣的字符。代碼MyJsp1.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>
<%@ page import="java.net.*" %>
<a href='./MyJsp2.jsp?act=<%=URLEncoder.encode("中國人 非常好")%>'>test</a>

代碼MyJsp2.jsp:

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>
<%@ page import="java.net.*" %>
<%
    String tempVal = URLDecoder.decode(request.getParameter("act"));
    out.println(new String(tempVal.getBytes("ISO-8859-1"), "gb2312"));
%>

jsp include html 亂碼問題##

在使用<%@ include page=""%>指令包含一個html頁面(b.html)時中文亂碼:

其一,首先想到的就是這兩個文件編碼是否統一。
其二,兩個文件的pageEncoding和contentType中的編碼是否統一。

下面我們分析下pageEncoding和contentType兩種屬性的區別:

(1)pageEncoding是jsp文件本身的編碼;
(2)contentType的charset是指服務器發送給客戶端時的內容編碼;

JSP從用戶發送請求到相應給用戶中間要經歷三個階段:

(1)jsp編譯成.java,它會根據pageEncoding的設定編碼讀取jsp,結果是由指定的編碼方案翻譯成統一的UTF-8 JAVA源碼(即.java),如果pageEncoding設定錯了,或沒有設定,出來的就是中文亂碼。

(2)由JAVAC的JAVA源碼至java byteCode的編譯,不論JSP編寫時候用的是什么編碼方案,經過這個階段的結果全部是UTF-8的encoding的java源碼。JAVAC用UTF-8的encoding讀取java源碼,編譯成UTF-8 encoding的二進制碼(即.class),這是JVM對常數字串在二進制碼(java encoding)內表達的規范。

(3)Tomcat(或其的application container)載入和執行階段二得來的JAVA二進制碼,輸出的結果,也就是在客戶端見到的,這時隱藏在階段一和階段二的參數contentType就發揮了功效。

而include指令就是在第一階段之前執行的,注意這個是在第一階段之前,所以,如果包含文件和被包含文件的文件編碼不一致,那么,該指令就會工作不太正常,不能正確的把被包含的文件從原來編碼轉換為包含文件的編碼,就會出現亂碼現象。

所以這時候得指定html頁面的pageEncoding 屬性 雖能html文件不識別這個屬性 但是最后include到jsp文件中他會發揮作用的。

還有一種方法 就是修改項目的web.xml 文件 在web-app標簽中加入如下內容:

<jsp-config>
    <jsp-property-group>
        <description>html encoding example</description>
        <display-name>JSPConfiguration</display-name>
        <url-pattern>*.html</url-pattern>
        <el-ignored>true</el-ignored>
        <page-encoding>UTF-8</page-encoding>
        <scripting-invalid>false</scripting-invalid>
        <include-prelude></include-prelude>
        <include-coda></include-coda>
    </jsp-property-group>
</jsp-config>

重新部署下項目就好了。其實仔細觀察代碼 他也是設置include的html/jsp頁面的編碼。思路是一樣的。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,327評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,996評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,316評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,406評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,128評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,524評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,576評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,759評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,310評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,065評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,249評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,821評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,479評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,909評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,140評論 1 290
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,984評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,228評論 2 375

推薦閱讀更多精彩內容