技术文章 > Python技术 > Python高级 > 正文

python如何查看字符集

FXL

python查看字符集的方法:可以利用第三方库chardet来进行判断。通过在命令行下执行【pip install chatdet】命令来安装chardet。使用方法如:【chardet.detect(b'Hello, world!')】。

Python利用第三方库chardet判断字符集。

(推荐教程:Python入门教程

如果安装了Anaconda,chardet就已经可用了。否则,需要在命令行下通过pip安装:

$ pip install chardet

当我们拿到一个bytes时,就可以对其检测编码。用chardet检测编码,只需要一行代码:

>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

检测出的编码是ascii,注意到还有个confidence字段,表示检测的概率是1.0(即100%)。

对UTF-8编码进行检测:

>>> data = '离离原上草,一岁一枯荣'.encode('utf-8')
>>> chardet.detect(data)
{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}

用chardet检测编码,使用简单。获取到编码后,再转换为str,就可以方便后续处理。

免费视频教程
本文原创发布python学习网,转载请注明出处,感谢您的尊重!
相关文章
 python3中怎么让print输出不换行
 python中如何表示多维数组
 python如何注释整行代码
 python怎样去除制表符
相关视频章节
 解决提示“‘python’不是内部或外外部命令
 python注释
 python代码缩进
 python编码规范
视频教程分类