设为首页 加入收藏

TOP

Python读取中文字符编码问题
2015-07-16 12:55:30 来源: 作者: 【 】 浏览:2
Tags:Python 读取 中文 字符 编码 问题

preface:许久没遇到过编码问题,一没注意就被绊倒脚了。。


一、编辑器是以ASICC编码格式的,若想在程序中有中文,需要改为utf-8格式,加入如下代码可破:


import sys?
reload(sys)?
sys.setdefaultencoding('utf8')?


二、读取中文文档时,卤主天真的以为字符长度是根据中文长度来着,但是读入后发现是根据字符长度来着,一个中文字长度字符长度为3。发现codecs可破:


import codecs
with codecs.open("XXX.txt", encoding = "utf-8") as f:
? ? text? =? f.readlines()
for i in text:
? ? i = i.strip("\n")
? ? print i,len(i)


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇Python 查找某个文件夹下第几个文.. 下一篇Python系统默认编码

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: