程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

pandas(0)

flask(0)

标签  

pandas(0)

flask(0)

日期归档  

字符编码

发布于2019-08-06 10:32     阅读(597)     评论(0)     点赞(4)     收藏(4)


字符集

字符集是用来表示语言符号的数字的集合
注意这只是数字,不涉及用什么方法来存储数字
我们常见的字符集
ASCII字符集 #美国英语的语言符号 共128个
Unicode #囊括世界上所有的语言符号(中文英文等等),Unicode也是包含中文的符号。同样的汉字在Unicode和GB系列字符集里面所对应的数字是不同的
gb2312,gbk,gb18030 #中国人的字符在里面,也是包括ASCII字符集的,gb系列是不覆盖Unicode的
#字符集:语言符号和数字的一个对应表,它的概念是跨越编程语言的。字符集就是一套规范。只有规定了字符用哪些数字表示
和实际存储在计算机中还没有关系
字符编码和解码
字符是以字节的方式存储和传输的 。
一个字节等于8个比特(位)(1Byte=8bit)
:bit 音译位“比特”,表示二进制位。位是计算机内部数据存储的最小单位。一个二进制位,只能表示0,1.两种状态
字节:byte 。字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和释放信息,规定一个字节由8个二进制位组成

字符编码

把字符串用字节序列(字节串)表示的方法(解决怎么把数字用字节串表示)
字符编码可以有很多种规则:如果每个字符用4个字节表示的话,就相当于2**32=4亿多,完全能表示所有的字符。但是太浪费了
UTF-8编码规则:现在主要是Unicode的字符集在使用utf-8的编码规则。字符集就是把符号对应成数字
#如果字符集中的符号对应的数字的大小在0-127之间,就用一个字节表示。高位就是0 0xxxxxxx
#字符



所属网站分类: 技术文章 > 博客

作者:爱丽丝

链接:https://www.pythonheidong.com/blog/article/7737/b9609875ee32738a9400/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

4 0
收藏该文
已收藏

评论内容:(最多支持255个字符)