shtml调用在utf8编码下多出空行的问题(解决)
上次我写过一篇关于shtml include在utf-8编码下多出一行的问题,当时是采用css来解决的,不过当时根本没搞清楚问题的根本原因,后来我发现在ie5.0里面,还会出现一个小正方形的乱码,并且网页在百度快照里显示调用处多出来一个问号,也是乱码。
后来到处找资料还是知道原因了,原来是utf-8的签名导致的问题。
UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记。如果多个文件设置了签名,在二进制流中就会包含多个UTF-8签名,而IE是无法识别多个UTF-8签名的,所以用一个空行来代替,在某些程序处理中还会出现一个类似“诺”的字符。
在UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输 字符”ZERO WIDTH NO-BREAK SPACE”。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。
详情请参见这两篇文章:
http://www.xiaop.net/archives/2007/11/07/utf-8-signature-bom/
还有W3C官方关于这个问题的说明:http://www.w3.org/International/questions/qa-utf8-bom
解决方法是去掉UTF-8文件的签名,EditPlus和Dreamweaver中均有相应的选项。以EditPlus为例:进入Tools->Preferences->Files,在UTF-8 signature选项中选择“Always remove signature”,重新保存文件即可。
如果模板采用包含的方法包含多个utf8文件需要用ultraedit保存时另存为功能,选择utf8 无bom格式保存即可。
另外,如果中文页面在html head标记中将title标记放在<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />前面会导致页面空白。
所以utf8页面应该使用标准顺序
<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″ />
<meta http-equiv=”content-language” content=”zh-CN” />
<meta name=”robots” content=”index,follow” />
<meta name=”keywords” content=”" />
<meta name=”description” content=”" />
<meta name=”rating” content=”general” />
<meta name=”author” content=”" />
<meta name=”copyright” content=”" />
<meta name=”generator” content=”" />
<title></title>
- 相关文章
- shtml include在utf-8编码下多出一行的问题 - 2007-08-13
- shtml精简教程 - 2006-06-28
- 上一篇:5u系统后台评论管理给文章标题加上链接
- 下一篇:大站之间的频道合作推广











