彻底解决页面文字编码乱码问题

站长资源 2025/12/20 佚名

17 1538 17

相思资源网 Design By www.200059.com

本文提供一种方法，通过将字符串编码成Unicode格式，保证数据在展示和传输过程中万无一失。无论客户端浏览器如何改变编码，页面上的编码都不会乱码。
对于HTML/XML,采用 &# + 十位Unicode码 + ; 的形式格式化字符。
对于JS,采用 \u + 4位Unicode码来格式化字符串.
示例采用C#编写，使用了中文、俄文、韩文、日文来展示。对于PHP,文章末尾将会提到。
首先，有一个String的扩展类。
复制代码代码如下:
using System.Text.RegularExpressions;
namespace XXOO
{
/// <summary>
/// 扩展方法，提供Html编码和脚本编码
/// </summary>
public static class StringExtension
{
private static string GetHtmlEncodedStr(Match m)
{
string x = m.ToString();
return string.Format("&#{0};", (int)x[0]);
}
/// <summary>
/// 将字符串转换为HTML编码格式
/// </summary>
/// <param name="text">字符串</param>
/// <returns>输出形如：中文丰厚警</returns>
public static string HtmlEncode( this string text )
{
return Regex.Replace(text
, "([^\\000-\\127]|&|\\\"|\\<|\\>|')"
, new MatchEvaluator(GetHtmlEncodedStr)
, RegexOptions.ECMAScript | RegexOptions.Compiled
);
}
private static string GetScriptEncodedStr(Match m)
{
string x = m.ToString();
return "\\u" + string.Format("{0:X}", (int)x[0]).PadLeft( 4, '0');
}
/// <summary>
/// 将字符串编码成Unicode格式如：\uXXXX
/// </summary>
/// <param name="text">字符串</param>
/// <returns>输出形如：\u4E2D\u6587\u4E30\u539A\u8B66\u65B9</returns>
public static string ScriptEncode( this string text )
{
return Regex.Replace(text
, "([^\\000-\\127]|&|\\\"|'|\\<|\\>|\\n|\\r|\\t)"
, new MatchEvaluator(GetScriptEncodedStr)
, RegexOptions.ECMAScript | RegexOptions.Compiled
);
}
}
}

它提供了2个方法，给测试页面使用。
测试页面(ASP.Net)
复制代码代码如下:
<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="WebForm1.aspx.cs" Inherits="WebApplication1.WebForm1" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head runat="server">
<title></title>
</head>
<body>
<form id="form1" runat="server">
<pre runat="Server" id="pre"></pre>
<asp:PlaceHolder runat="Server" ID="placeHolder"></asp:PlaceHolder>
</form>
</body>
</html>

测试页面代码：
复制代码代码如下:
using XXOO;
namespace WebApplication1
{
public partial class WebForm1 : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
var str = @"中文丰厚警方过后发达看见发的话该快发动机后购房贷款好
Китайское посольство в Ираке и Багдаде отделение
""'\|}{][:;
";
pre.InnerHtml = str.HtmlEncode();
HtmlGenericControl control = new HtmlGenericControl("script");
control.Attributes["language"] = "javascript";
control.Attributes["type"] = "text/javascript";
control.InnerHtml = string.Format("alert(\"{0}\");", str.ScriptEncode());
placeHolder.Controls.Add(control);
}
}
}

运行后得到的HTML:
复制代码代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head><title>
</title></head>
<body>
<form name="form1" method="post" action="WebForm1.aspx" id="form1">
<pre id="pre">中文丰厚警方过后发达看见发的话该快发动机后购房贷款好
Китайское посольство в Ираке и Багдаде отделение
이라크에서 중국 대사관과 알의 바그다드 지사 - 만수르 호텔
イラクでの大使館やアルのバグダッド支局-マンスールホテル
1234567890!@#$%^&*()<>"'\|}{][:;
</pre>
<script language="javascript" type="text/javascript"></script>
</form>
</body>
</html>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head><title>
</title></head>
<body>
<form name="form1" method="post" action="WebForm1.aspx" id="form1">
<pre id="pre">中文丰厚警方过后发达看见发的话该快发动机后购房贷款好
Китайское посольство в Ираке и Багдаде отделение
이라크에서 중국 대사관과 알의 바그다드 지사 - 만수르 호텔
イラクでの大使館やアルのバグダッド支局-マンスールホテル
1234567890!@#$%^&*()<>"'\|}{][:;
</pre>
<script language="javascript" type="text/javascript"></script>
</form>
</body>
</html>

这样，不管浏览器采用何种编码，页面都不会出现乱码。
==============================================
PHP
PHP的情况就复杂一点，需要考虑mysql的编码。这些姑且不论。
下面给出一点示例，将GBK进行HTML编码。仅作参考：
复制代码代码如下:
function htmlEncode($text)
{
$encoded = "";
for( $index = 0; $index < strlen($text); $index++)
{
if( ord($text[$index]) <= 127 )
{
switch(ord($text[$index]))
{
case 34:
case 38:
case 39:
case 60:
case 62:
$encoded .= "&#" .ord($text[$index]).";";
break;
default:
$encoded .= $text[$index];
}
}
else
{
$char = $text[$index] . $text[$index+1];
$char = mb_convert_encoding( $char, "utf-16", "gbk");
$encoded .= "&#" . (ord($char[0])*256 + ord($char[1])) . ";";
$index++;
}
}
return $encoded;
}
function htmlEncode($text)
{
$encoded = "";
for( $index = 0; $index < strlen($text); $index++)
{
if( ord($text[$index]) <= 127 )
{
switch(ord($text[$index]))
{
case 34:
case 38:
case 39:
case 60:
case 62:
$encoded .= "&#" .ord($text[$index]).";";
break;
default:
$encoded .= $text[$index];
}
}
else
{
$char = $text[$index] . $text[$index+1];
$char = mb_convert_encoding( $char, "utf-16", "gbk");
$encoded .= "&#" . (ord($char[0])*256 + ord($char[1])) . ";";
$index++;
}
}
return $encoded;
}

然后通过XML返回，这样就能够彻底杜绝乱码。
复制代码代码如下:
echo "<?xml version=\"1.0\" encoding=\"utf-8\"?>\n";
echo "<result>";
echo "<success>". ($success ? 1 : 0) ."</success>";
echo "<message>" . htmlEncode($message) . "</message>";
if( $success )
{
echo "<nickname>" . htmlEncode($nickname) . "</nickname>";
echo "<userId>".$userId."</userId>";
echo "<siteId>".$siteId."</siteId>";
echo "<isTeacher>". ($isTeacher ? 1 : 0) ."</isTeacher>";
echo "<ipAddress>" . htmlEncode($ipAddress) . "</ipAddress>";
}
echo "</result>";
本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/wangjia184/archive/2009/10/26/4728318.aspx

页面文字,编码乱码

标签：

页面文字,编码乱码

相思资源网 Design By www.200059.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

相思资源网 Design By www.200059.com

评论“彻底解决页面文字编码乱码问题”

暂无彻底解决页面文字编码乱码问题的评论...

www.200059.com 相思资源网

139,976影音资源

144,792福利资源

21,817软件资源

631,128技术资源

彻底解决页面文字编码乱码问题

页面文字,编码乱码

数据类型和Json格式分析小结

alt键 chr码值对应列表查看方法

评论“彻底解决页面文字编码乱码问题”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

友情链接

彻底解决页面文字编码乱码问题

页面文字,编码乱码

数据类型和Json格式分析小结

alt键 chr码值对应列表查看方法

评论“彻底解决页面文字编码乱码问题”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存