首页 加密 & 解密 UTF8编码转换器

UTF-8编码转换

一、UTF-8是甚么?

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。如今曾经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它说话(如英文,日文,韩文)。

中文名 UTF-8 作 者 Ken Thompson
外文名 8-bit Unicode Transformation Format 创建时间 1992年
别 称 万国码 针 对 Unicode

2、UTF-8优缺点?

UTF-8长处

UTF-8编码可以经过过程樊篱位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的前往成果雷同,是以使排序变得加倍轻易。字节FF和FE在UTF-8编码中永久不会出现,是以他们可以用来注解UTF-16或UTF-32文本(见BOM) UTF-8 是字节次序有关的。它的字节次序在一切体系中都是一样的,是以它实际上其实不须要BOM。

UTF-8缺点

你没法从UNICODE字符数断定出UTF-8文本的字节数,由于UTF-8是一种变长编码它须要用2个字节编码那些用扩大ASCII字符集只需1个字节的字符 ISO Latin-1 是UNICODE的子集,但不是UTF-8的子集 8位字符的UTF-8编码会被email网关过滤,由于internet信息最后设计为7位ASCII码。是以产生了UTF-7编码。 UTF-8 在它的表示中应用值100xxxxx的概率逾越50%, 而现存的完成如ISO 2022, 4873, 6429, 和8859体系,会把它错认为是C1 控制码。是以产生了UTF-7.5编码。

付出扫码

一切赞助/开支都讲地下通细,用于网站保护:赞助名单检查

检查我的收藏

正在加载... ...