QQ:4869887 - Email:sos0716#163.com hewei's rss

何为 > 网站研究 > 正文

shtml调用在utf8编码下多出空行的问题(解决)

上次我写过一篇关于shtml include在utf-8编码下多出一行的问题,当时是采用css来解决的,不过当时根本没搞清楚问题的根本原因,后来我发现在ie5.0里面,还会出现一个小正方形的乱码,并且网页在百度快照里显示调用处多出来一个问号,也是乱码。

后来到处找资料还是知道原因了,原来是utf-8的签名导致的问题。

UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记。如果多个文件设置了签名,在二进制流中就会包含多个UTF-8签名,而IE是无法识别多个UTF-8签名的,所以用一个空行来代替,在某些程序处理中还会出现一个类似“诺”的字符。

在UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输 字符”ZERO WIDTH NO-BREAK SPACE”。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。

详情请参见这两篇文章:

http://www.xiaop.net/archives/2007/11/07/utf-8-signature-bom/

http://zxsv.com/post/246.html

还有W3C官方关于这个问题的说明:http://www.w3.org/International/questions/qa-utf8-bom

解决方法是去掉UTF-8文件的签名,EditPlus和Dreamweaver中均有相应的选项。以EditPlus为例:进入Tools->Preferences->Files,在UTF-8 signature选项中选择“Always remove signature”,重新保存文件即可。

如果模板采用包含的方法包含多个utf8文件需要用ultraedit保存时另存为功能,选择utf8 无bom格式保存即可。
另外,如果中文页面在html head标记中将title标记放在<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />前面会导致页面空白。
所以utf8页面应该使用标准顺序

<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />
<meta http-equiv=”content-language” content=”zh-CN” />
<meta name=”robots” content=”index,follow” />
<meta name=”keywords” content=”" />
<meta name=”description” content=”" />
<meta name=”rating” content=”general” />
<meta name=”author” content=”" />
<meta name=”copyright” content=”" />
<meta name=”generator” content=”" />
<title></title>

返回顶部网友评论»查看所有评论

发表评论:(内容不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。)

您的昵称:验证码: 验证码查看所有评论

About Hewei.org

何为的博客。记录我的生活点滴,技术经验,奇思妙想。无聊的时候看看自己记录的思想,也是一种享受。

订阅何为的博客
  • ZhuaXia 订阅到抓虾
  • SouYo 订阅到沙发
信息检索 In Hewei.org
Hot标签
最新推荐主题
最新推荐专题
  • google adsense
  • firfox
  • 域名无忧
  • 在线交友
XHTML 1.0 StrictValid CSS 2.1
何为博客!意欲何为?大有作为!Copyright © HeWei.Org
皖ICP备06010916号