建站选utf-8还是GB2312(GBK)?

经常在网上看到有的朋友问建站时选择utf-8还是GBK(GB2312)呢?目前建站的朋友大部分建的是中文站,因为GBK比utf-8占用的空间小,很多人就选择了GBK。现在网上的大部分cms都有两种编码方式,到底要如何选择呢?

UTF-8是UNICODE的一种变长字符编码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE字符。

GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。 Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;

传统的使用GB标准的网站,用其它语言系统访问时,就会造成乱码,utf-8包括了世界上大部分的语言编码,别国语言系统在访问时不会存在乱码现象。虽然现在大部人建站是为了国内访问者,但也不能忽视了少部分的国外访问者,所以说选择utf-8才是未来发展的主要的方向。

发表评论

电子邮件地址不会被公开。 必填项已用*标注