计算机只认识由 0 和 1 组成的二进制编码,计算机的所有字符都有属于自己的二进制编码

例如:» 这个符号在计算机中的二进制编码为 10111011 一共有八位数,等于8位(8bit)

8bit(8位)=1b(1字节)

1024b(1024字节)=1kb(千字节)

等等...

ASCII码字符对照表:

参考:https://blog.csdn.net/wz947324/article/details/80076496

各种进制之间可以用程序员计算器进行转换(系统自带)

打开方法:运行---输入命令 calc

Unicode是字符集,几乎包含了全世界所有的字符

官网:https://home.unicode.org/

Unicode需要通过编码规则来实现传播,编码规则可以让所有的电脑统一正确的识别到想要表达的字符

utf-8是最常用的编码规则,可以通过在线工具转换

在线工具:

https://tool.chinaz.com/tools/unicode.aspx

http://www.mytju.com/classcode/tools/encode_utf8.asp

从字符集找到相应字符的编码后,可以通过系统自带的程序员计算器查看相应的系统能识别的二进制编码,才能被系统输出

print(chr(0b100111001100000))
print(ord('习'))

运行结果:

  • 20064

print() 打印函数

chr() 可以将字符编码转换成字符

0b 表示这串编码是二进制的(写在编码前面)

100111001100000 字符的二进制编码

ord() 可以将字符转换成字符编码

20064 字符的十进制编码

计算机中,不管是文字还是字母还是符号都叫字符,可以使用二进制,八进制,十进制,十六进制,但最后都要变成二进制才能被计算机识别

拓展阅读:

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

(未理解,后期跟进)

最后修改:2021 年 06 月 02 日 12 : 11 PM