- ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。ASCII 编码 只能表示一些英文字母和数字,满足不了不使用英文的国家的字符。ASCII编码就是用1个字节来存储字符。
- Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。因为世界国家很多,每个国家都定义一套自己的编码标准,结果相互之间谁也不懂谁的编码,就无法进行很好的沟通交流,所以及时的出现了一个组织ISO(国际标准化组织)决定定义一套编码方案来解决所有国家的编码问题,这个新的编码方案就叫做Unicode。Unicode 没有规定字符对应的二进制码如何存储。以汉字“汉”为例,它的 Unicode码点1 是 0x6c49,对应的二进制数是 110110001001001,二进制数有 15 位,这也就说明了它至少需要 2 个字节来表示。可以想象,在 Unicode 字典中往后的字符可能就需要 3 个字节或者 4 个字节,甚至更多字节来表示了。