另类字符 回忆上次内容
- 上次再次输出了大红心<span style="font-size:64px;color:red">?</span>
- 找到了红心对应的编码
- 黑红梅方都对应有编码
2024年11月26日
另类字符 回忆上次内容
2024年11月26日
这篇文章开始我们来学习一下python中的字符串,同时查看一下Cpython中字符串对象及类型对象和方法在底层的实现。CPython中字符串对象结构体为PyUnicodeObject,为什么要用unicode来命名。回想一下前边的一篇文章,ASCII编码,一个字节,英文字符可以表示;随着中文等语言的出现,一个字符已经不能表示这么多字符,Unicode使用最多可以达到4个字节来表示一个字符;同时会出现一个问题,一个英文符号使用一个字节就够了,没必要采用四个字节,utf-8编码提供了一个新的编码规则,具有可变长的功能。
2024年11月26日
尽管世界通用的Emoji表情已经有近2700个,你在手机上找到一个不常用的Emoji也许要找半天——但Unicode最近又发布新Emoji了,共有157个。算上各种肤色发色组合,最终Emoji总数将会超过2800个。
Unicode联盟(The Unicode Consortium)是由诸如苹果、微软、谷歌等科技巨头组成的非盈利组织,过去主要为了统一世界编码语言,2010年后他们也开始负责统一“图像编码”Emoji。换句话说,他们不生产Emoji,但他们定义每一个Emoji的含义。
2024年11月26日
Pytest是一个广泛使用的Python测试框架,通过参数化测试(Parameterized Testing)功能,可以轻松地为测试用例提供多组输入数据。然而,当我们尝试在参数化测试中使用中文作为测试用例的IDs时,有时会遇到Unicode编码问题,导致测试报告中显示的是乱码。本文将详细解释这个问题的原因,并提供解决方案,确保测试报告中正确显示中文IDs。
2024年11月26日
在Python编程中,我们有时候会遇到UnicodeDecodeError错误。这个错误通常是因为Python无法将一个字符串解码成正确的编码格式。这个问题在处理不同编码格式的文件时经常出现。在本文中,我们将为你介绍常见的UnicodeDecodeError错误以及处理方法。
2024年11月26日
2024年11月26日
MFC采用Unicode编码的字符时,在编译链接时,就必须用到特殊的参数(还要改变可执行文件执行的入口),必须在每个string前面加上T,将char修改成TCHAR,每个字符串处理函数(strcpy()、strdup()、strcat()等)都要改变成其他的字符串处理函数名。
2024年11月26日
在前端开发中,为了让中文在不同的环境下都能很好的显示,一般是将中文转化为unicode格式,即\u4f60,比如:"你好啊"的unicode编码为"\u4f60\u597d\u554a"。
JS里将中文转为unicode编码很简单。
2024年11月26日
2024年11月26日
python的ASCII码范围为[0,127],非ASCII码范围大于127.