发布于2019-08-06 10:32 阅读(825) 评论(0) 点赞(4) 收藏(4)
字符集是用来表示语言符号的数字的集合
注意这只是数字,不涉及用什么方法来存储数字
我们常见的字符集
ASCII字符集 #美国英语的语言符号 共128个
Unicode #囊括世界上所有的语言符号(中文英文等等),Unicode也是包含中文的符号。同样的汉字在Unicode和GB系列字符集里面所对应的数字是不同的
gb2312,gbk,gb18030 #中国人的字符在里面,也是包括ASCII字符集的,gb系列是不覆盖Unicode的
#字符集:语言符号和数字的一个对应表,它的概念是跨越编程语言的。字符集就是一套规范。只有规定了字符用哪些数字表示
和实际存储在计算机中还没有关系
字符编码和解码
字符是以字节的方式存储和传输的 。
一个字节等于8个比特(位)(1Byte=8bit)
位:bit 音译位“比特”,表示二进制位。位是计算机内部数据存储的最小单位。一个二进制位,只能表示0,1.两种状态
字节:byte 。字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和释放信息,规定一个字节由8个二进制位组成
:把字符串用字节序列(字节串)表示的方法(解决怎么把数字用字节串表示)
字符编码可以有很多种规则:如果每个字符用4个字节表示的话,就相当于2**32=4亿多,完全能表示所有的字符。但是太浪费了
UTF-8编码规则:现在主要是Unicode的字符集在使用utf-8的编码规则。字符集就是把符号对应成数字
#如果字符集中的符号对应的数字的大小在0-127之间,就用一个字节表示。高位就是0 0xxxxxxx
#字符
作者:爱丽丝
链接:https://www.pythonheidong.com/blog/article/7737/b9609875ee32738a9400/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!