Tomcat+Jsp環(huán)境下的中文問題
發(fā)表時(shí)間:2024-01-23 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]摘要:關(guān)于Java應(yīng)用在處理中文時(shí)所存在問題的討論已經(jīng)相當(dāng)多了,與大部分的討論不同,本文將從漢字字符的輸入和輸出的角度來討論Java語言處理中文時(shí)所存在的問題。盡管關(guān)于Java在處理中文字符時(shí)所存在的問題的討論已不乏其數(shù),但由于Java技術(shù)涉及內(nèi)容廣(J2EE包含了十幾種相關(guān)技術(shù)),技術(shù)供應(yīng)商繁多...
摘要:關(guān)于Java應(yīng)用在處理中文時(shí)所存在問題的討論已經(jīng)相當(dāng)多了,與大部分的討論不同,本文將從漢字字符的輸入和輸出的角度來討論Java語言處理中文時(shí)所存在的問題。
盡管關(guān)于Java在處理中文字符時(shí)所存在的問題的討論已不乏其數(shù),但由于Java技術(shù)涉及內(nèi)容廣(J2EE包含了十幾種相關(guān)技術(shù)),技術(shù)供應(yīng)商繁多,面向Java的Web服務(wù)器、應(yīng)用服務(wù)器以及JDBC數(shù)據(jù)庫驅(qū)動(dòng)等都沒有官方的標(biāo)準(zhǔn),所以Java應(yīng)用在處理中文時(shí)出了存在固有的問題外也會(huì)隨著選用的服務(wù)器、驅(qū)動(dòng)程序的不同產(chǎn)生一些與平臺(tái)相關(guān)的問題。也就是說,在處理中文問題時(shí),Java代碼的可移植性打了折扣。
總的看來,Java的中文處理問題較為集中地出現(xiàn)在JSP技術(shù)應(yīng)用和Java的數(shù)據(jù)庫訪問過程中。這是因?yàn)闊o論是JSP應(yīng)用還是基于JDBC的數(shù)據(jù)庫訪問都涉及到了Java程序與另外一種應(yīng)用系統(tǒng)的交互,這種交互不可避免的要求系統(tǒng)之間進(jìn)行數(shù)據(jù)的交互和參數(shù)的傳遞,而Java處理中文出現(xiàn)問題的地方往往就是這些數(shù)據(jù)讀入和輸出的地方。
JSP程序所應(yīng)該注意的中文問題
以Tomcat 3.2.1的JSP應(yīng)用為例,一般遇到中文問題可以使用如下的編碼強(qiáng)制轉(zhuǎn)換函數(shù)進(jìn)行內(nèi)碼的轉(zhuǎn)換。
public static String toChinese(String strvalue)
{
try{
if(strvalue==null)
return null;
else
{
strvalue = new String(strvalue.getBytes("ISO8859_1"), "GBK");
return strvalue;
}
}catch(Exception e){
return null;
}
}
注意,在使用該函數(shù)前,我們需要分析中文無法正確輸出的原因到底是什么,而不能將所有的中文處理的問題都用這個(gè)方法來解決。例如,如果是由于忘記將JSP的輸出代碼定義為GB2312或GBK而產(chǎn)生的中文無法正確輸出就不能用這個(gè)函數(shù)來解決。一個(gè)好的習(xí)慣是在我們編寫每一個(gè)JSP頁面時(shí)都在文件的第一行定義程序所要輸出的字符集,如
<%@ page contentType="text/html; charset=GBK" %>或
<%@ page contentType="text/html; charset=GB2312" %>
對(duì)于一些不支持定義輸出的字符集的JSP版本,我們也可以作如下的設(shè)置:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=gb2312">
另外還需要注意的是,這個(gè)函數(shù)是用來解決那些確實(shí)出現(xiàn)了無法正確輸出中文的代碼,而不是一個(gè)通用的用來保證中文字符正確輸出的函數(shù)。由于中文字符無法正確的輸出或讀入的原因都是因?yàn)檫@個(gè)字符的編碼和系統(tǒng)缺省的字符集編碼(或者是應(yīng)用所要輸出的字符集,二者一般情況下是相同的)的不同引起的,所以在應(yīng)用該函數(shù)前我們必須確定我們所要讀入或輸出的字符的編碼到底與系統(tǒng)缺省的字符集編碼是否相同。