将近50%的网站使用UTF-8编码

标签:Google

昨天Google发布了一篇《Unicode nearing 50% of the web》,其中提到世界上采用UTF-8为编码的网站已经将近50%了。

从这张图可以看出,从2001年至2010年,UTF-8从0%飙升至45%以上,而ASCII则从55%以上跌至20%左右,中文一直在5%左右徘徊,并由于去年的扫黄事件大幅下降。

其实我个人的看法是中文网站采用GBK编码就行了(GB18030里新增的文字基本上中国人都认不得),这样可以减少传输量(约为UTF-8的2/3)。如果是浏览者的浏览器不支持GBK,那么基本上换成UTF-8也会显示成方框,而且很可能浏览者根本就看不懂中文。

然而从编程的角度来看,我会坚定地采用UTF-8,因为这样在处理时更为方便和统一,不用担心我的XML不能写成GBK,输出的JSON得根据页面指定字符集,数据库是否和页面采用相同语言等。

0条评论 你不来一发么↓

    想说点什么呢?