品易云推流 关闭
文章详情页
文章 > Python常见问题 > python怎么去掉字符串的非中文

python怎么去掉字符串的非中文

头像

yang

2020-05-09 11:17:217773浏览 · 0收藏 · 0评论

python去除非中文的方法:

import re
 
 
def find_chinese(file):
    pattern = re.compile(r'[^\u4e00-\u9fa5]')
    chinese = re.sub(pattern, '', file)
    print(chinese)
 
def find_unchinese(file):
    pattern = re.compile(r'[\u4e00-\u9fa5]')
    unchinese = re.sub(pattern,"",file)
    print(unchinese)
 
 
 
if __name__ == "__main__":
    line = "2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('\',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ..."
    print("原文:")
    print(line)
    print("保留中文:")
    find_chinese(line)
    print("保留非中文:")
    find_unchinese(line)

运行结果:

原文:
2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ...
保留中文:
年月日去除空格和换行符的方法一去除空格用后边的串替换掉前边的
保留非中文:
201913 - python 、 strip().strip() # ...replace('',''),posted @ 2016-07-18 08:53 ...

更多Python知识请关注Python视频教程栏目。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

底部广告图