文章 > Python基础教程 > python UTF-8编码是什么

python UTF-8编码是什么

头像

小妮浅浅

2021-03-18 17:31:20766浏览 · 0收藏 · 0评论

1、说明

UTF-8编码,即“可变长的编码”。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,很生僻的字符会被编码成4-6个字节。

2、注意点

Python的诞生比Unicode标准早,所以最早的Python只支持ASCII代码。

一般字符串ABC在Python中都是ASCII编码。

使用UTF-8代码还有另一个好处,那就是ASCII代码实际上可以被视为UTF-8代码的一部分。

因此,大量只支持ASCII代码的历史遗留软件可以在UTF-8代码下继续工作。

这就是为什么我们每次使用中文都需要在文件开头声明UTF-8。

以上就是python UTF-8编码的介绍,希望对大家有所帮助。更多Python学习指路:python基础教程

关注公众号

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

底部广告图 底部广告图按钮