设为首页 加入收藏

TOP

python中烦人的锟斤拷(\xef\xbf\xbd)
2017-09-30 17:08:27 】 浏览:4110
Tags:python 烦人 xefxbfxbd

首先要知道\xef\xbf\xbd是啥东西

>>> u'\uFFFD'.encode('utf-8')
'\xef\xbf\xbd'

由此我们可以知道\xef\xbf\xbd是utf8编码的'\uFFFD',那么这个'\uFFFD'是啥东西呢?

原来是因为Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。

>>> "\xef\xbf\xbd".decode("utf-8")
u'\ufffd'

所以,如果你的文本中有一些字符是unicode表示不了的,在python程序读入的时候就会转成\xef\xbf\xbd,如果在某些地方变成了unicode,那么内部就会变成

u'\ufffd',然而你再也不能转为str了。

如果你碰巧用到这些字符串作为字典的key,那么就会报key_error的错误了。

 

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Python Tutorial笔记 下一篇Python成长笔记 - 基础篇 (一)p..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目