博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python 编码问题
阅读量:5172 次
发布时间:2019-06-13

本文共 498 字,大约阅读时间需要 1 分钟。

有时候需要将命令行或者网页上的或者文件中的内容读取出来做些处理,这个时候可能你发现读取出来的内容是其他的编码方式,如\x20等。

处理思路如下:

下载chardet模块,安装。

利用chardet模块检测读取出来的str是什么编码格式的,如‘UTF-8'或者’GB2312‘等。

>>> import chardet>>> chardet.detect(a){'confidence': 0.0, 'encoding': None}

 知道了编码方式后就可以针对他进行解码了,如:

>>> a.decode('GB2312')u'\r\n\u4e3b\u673a\u540d:

 解码后是unicode格式的,然后就可以对这个unicode的str进行encode了,如

>>> b.encode('UTF-8')'\r\n\xe4\xb8\xbb\xe6\x9c\xba\xe5\x90\x8d:

ps:

字符串在python的内部表示是unicode,所以编码,解码的中间格式就是unicode。

 

转载于:https://www.cnblogs.com/maseng/p/3240937.html

你可能感兴趣的文章
基于FPGA实现的高速串行交换模块实现方法研究
查看>>
Java Scala获取所有注解的类信息
查看>>
delphi ,安装插件
查看>>
case when then的用法-leetcode交换工资
查看>>
11.28.cookie
查看>>
BeanShell简介
查看>>
python字符串操作
查看>>
不同程序语言的注释和变量要求
查看>>
语言基础(9):static, extern 和 inline
查看>>
ES5_03_Object扩展
查看>>
bzoj 2600: [Ioi2011]ricehub
查看>>
创建数据库,表
查看>>
工厂模式
查看>>
计算机网络基础知识
查看>>
C#里如何遍历枚举所有的项
查看>>
如何在键盘出现时滚动表格,以适应输入框的显示
查看>>
超级强大的鼠标手势工具
查看>>
常用Dockerfile举例
查看>>
jquery的ajax用法
查看>>
设计模式-策略模式(Strategy)
查看>>