分享
 
 
 

解读HTML:命名空间与字符编码

王朝html/css/js·作者佚名  2008-12-19
窄屏简体版  字體: |||超大  

在做项目的过程中,我们经常会建立各种各样的规范,以方便团队之间更好的合作更好的完成项目;同样我们也经常会听到各种各样的协议,比如Google的IM软件Gtalk使用的开放的XMPP协议,只要其他IM软件也遵循XMPP协议就能与Gtalk使用互通;而互联网上的信息无以计数,这些信息本身是独立存在的,如何将其串联并呈现在用户眼前,就需要使用到HTTP协议。

同样的道理,因为浏览器们各自的内核不同,对于默认样式的渲染也不尽相同,所以就需要一份各浏览器都遵循的规则来保证同一个网页文档在不同浏览器上呈现出来的样式是一致的,这个规则就是DOCTYPE声明。

因为互联网是互通的,所以任意的两个或者以上的网页文档都可能会涉及到数据交换,而因为XML语言是允许用户自定义标签的,所以任意两个交换的文档就可能会出现相同的标签,从而导致相同标签的冲突,所以就需要一个命名空间以区分开交换文档中可能存在的相同标签。

XHTML做为HTML向XML过渡的一种语言,并不能实现XML语言中的用户自定义标签,所以XHMTL文档中的命名空间都是相同的:

<html xmlns=”http://www.w3.org/1999/xhtml”>

xmlns即是XHTML namespace的缩写,也就是所谓的“命名空间”。与DOCTYPE声明一样,xmlns也属于一种声明。与HTML文档中仍然存在DOCTYPE声明不一样的是,在HTML文档是不存在xmlns的,我们平常所见到的xmlns都是出现在XHTML文档中的。

在制作一个网页的时候,除了在开始的时候声明DOCTYPE(文档类型)之外,如果是XHTML文档还需要声明命名空间,而第三个需要声明的就是网页文档的字符编码类型:

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />

为了能被浏览器正确的解释以及通过W3C验证,每个XHTML文档都应该声明所使用的字符编码。很多时候网页文档出现乱码大部分都是由于字符编码不对而引起的。

utf-8是unicode的一种变长度的编码表达方式,做为一种全球通用型的字符编码正越来越多的网页文档所使用,使用utf-8字符编码的网页可最大程度的避免不同区域的用户访问相同网页时因字符编码不同而导致的乱码现象。

但是当我们打开国内的大多数网站看,特别是门户型的大型网站,关于字符编码的声明却并非是utf-8,而是gb2312:

<meta http-equiv=”Content-Type” content=”text/html; charset=gb2312″ />

当然,除了gb2312外还有一些网站使用gbk或者是gb18030编码,这三种字符编码都是属于简体中文字符集。也就是说,如果一台电脑没有安装简体中文字符集时,当它访问字符编码为gb2312的中文网页时,则显示出来的是乱码。

既然使用gb2312字符编码时会因为不同区域的用户访问而可能出现乱码现象,那为何不使用utf-8呢?

其中一个原因可能历史遗留的原因,而另一个更重要的原因应该是由于两种编码的存储方式不同而造成的文档体积不同。

使用gb2312字符编码集时,一个汉字是占用2个字节的大小,而一个汉字在utf-8编码中所占的字节数却往往都是在3个字节,甚至是3个以上的字节。所以对于同一个中文文档来说,使用gb2312字符编码来进行存储的体积是要小于utf-8编码所存储的文档大小的。

而对于文字多访问量大的中文网站来说,使用gb2312编码的网页文档在下载传输上可以节省下不小的流量,再者是因为中文网站的用户群体基本上都锁定在中文用户上,这些也就是很多网站使用gb2312编码而不是utf-8编码的原因。

但是文字多访问量大的网站,国内并不多,再加上可能成对的乱码问题,所以在制作网页的时候推荐使用utf-8编码。

当然,不管用何种编码,最重要的是整站使用的编码要统一。

对于字符编码的声明除了上面的方式,还可能看到另一种声明方式:

<meta http-equiv=”Content-Language” content=”gb2312″ />

<meta http-equiv=”Content-Language” content=”zh-CN” />

这种声明方式是针对老版本的浏览器的,在浏览器已经普遍更新换代的今天已经不推荐使用这种声明方式。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有