使用python转换文件编码的简单介绍

本文目录一览：

1、如何进行Python编码转换
2、如何修改python文件的编码格式
3、Python 编码转换与中文处理

如何进行Python编码转换

1、python2与python3稍微有点区别 2、python2中默认的字符编码格式都是unicode,在字符串前加'u'，表示unicode 编码 3、将unicode转换成中文，只需要用deconde解码就可以了 u='欢迎' e=u.encode() e b'\xe6\xac\xa2\xe8\xbf\x8e' ...

如何修改python文件的编码格式

可以知道的是，文本文件的默认编码并不是utf8。

我们打开一个文本文件，并点击另存为

我们在新窗口的编码一栏看到默认编码是ANSI。先不管这个编码是什么编码，但是通过下拉列表我们知道，这种编码不是utf8。

END

编码测试

对于Python里面的中文显示，我们常常使用utf8和gbk的编码。对于这两种编码笔者就不介绍了，总之都是专门可以处理中文的编码方式啦。

我们首先对文本文件测试了gbk解码。我们发现，此编码下文本文件内容可以正常显示，但是使用utf8解码，程序出错，抛出decodeError异常

同样的，我们对Python脚本文件测试了utf8解码。我们发现，此编码下文本文件内容可以正常显示，但是使用gbk解码，中文部分出现乱码

测试说明，对于文本文件需要使用gbk解码，而对于脚本文件需要utf8解码，也就是说，文本文件是gbk编码的，而脚本则是utf8

使用python转换文件编码的简单介绍

Python 编码转换与中文处理

python 中的 unicode 是让人很困惑、比较难以理解的问题. 这篇文章写的比较好， utf-8是 unicode的一种实现方式，unicode、gbk、gb2312是编码字符集.

Python 默认脚本文件都是 ANSCII 编码的，当文件中有非 ANSCII 编码范围内的字符的时候就要使用" 编码指示 "来修正一个 module 的定义中，如果.py文件中包含中文字符（严格的说是含有非anscii字符），则需要在第一行或第二行指定编码声明： # -*- coding=utf-8 -*- 或者 #coding=utf-8

其他的编码如：gbk、gb2312也可以；否则会出现:

先说一下python中的字符串类型，在python中有两种字符串类型，分别是 str 和 unicode ，他们都是basestring的派生类；

在str的文档中有这样的一句话：

也就是说在读取一个文件的内容，或者从网络上读取到内容时，保持的对象为str类型；如果想把一个str转换成特定编码类型，需要把str转为Unicode,然后从unicode转为特定的编码类型如：utf-8、gb2312等。

unicode 转为 gb2312,utf-8等,使用 encode(encoding)

utf-8,GBK转换为 unicode 使用 unicode(s,encoding) 或者 s.decode(encoding)

普通的 str 转为 unicode,

如果直接执行s.encode('gb2312')会发生什么？

这里会发生一个异常：Python 会自动的先将 s 解码为 unicode ，然后再编码成 gb2312。因为解码是python自动进行的，我们没有指明解码方式，python 就会使用 sys.defaultencoding 指明的方式来解码。很多情况下 sys.defaultencoding 是 ANSCII，如果 s 不是这个类型就会出错。

拿上面的情况来说，我的 sys.defaultencoding 是 anscii，而 s 的编码方式和文件的编码方式一致，是 utf8 的，所以出错了:

对于这种情况，我们有两种方法来改正错误：

s = '中文'

s.decode('utf-8').encode('gb2312') ```

import sys

reload(sys) # Python2.5 初始化后会删除 sys.setdefaultencoding 这个方法，我们需要重新载入

sys.setdefaultencoding('utf-8')

str = '中文'

str.encode('gb2312')

print open("Test.txt").read()

import codecs

print open("Test.txt").read().decode("utf-8")

Traceback (most recent call last):

File "ChineseTest.py", line 3, in module

print open("Test.txt").read().decode("utf-8")

UnicodeEncodeError: 'gbk' codec can't encode character u'\ufeff' in position 0: illegal multibyte sequence

import codecs

data = open("Test.txt").read()

if data[:3] == codecs.BOM_UTF8:

data = data[3:]

print data.decode("utf-8")

s = "中文"

print unicode(s, "utf-8")

Traceback (most recent call last):

File "ChineseTest.py", line 3, in module

s = unicode(s, "utf-8")

UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data

s = "中文"

print unicode(s, "gbk")

s = "中文"

print unicode(s, "cp936")

geojson合并python的简单介绍

本文目录一览： 1、Geojson笔记二：geojson-python-util 2、python 合并两个json文件 3、怎么样用Python实现地理编码 4、如何生成geojson格式的tile

2023-12-08

python学习之笔记（python的笔记）

2022-11-10

将Jupyter Notebook文件转换为Python文件

2023-05-13

python技巧笔记（python自学笔记）

2022-11-12

python的用法笔记本（笔记本学python）

2022-11-16

python字符编码笔记（python默认字符编码）

2022-11-10

python学习笔记一之,python入门笔记

2022-11-21

python方法笔记,python基础教程笔记

2022-11-20

第1章python简介（python第一章笔记）

2022-11-10

python图像识别时钟的简单介绍

2022-11-09

阿平的python小笔记吖,python 阿里巴巴

2022-11-18

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

使用python转换文件编码的简单介绍

本文目录一览：

如何进行Python编码转换

如何修改python文件的编码格式

Python 编码转换与中文处理

使用python转换文件编码的简单介绍

python使用笔记23的简单介绍

python使用笔记006的简单介绍

重拾python笔记三的简单介绍

python使用turtle库的简单介绍

python笔记第六天,python第六周笔记

包含python使用笔记24的词条

我的python笔记06（Python）

python笔记二（2python）

geojson合并python的简单介绍

python学习之笔记（python的笔记）

将Jupyter Notebook文件转换为Python文件

python技巧笔记（python自学笔记）

python的用法笔记本（笔记本学python）

python字符编码笔记（python默认字符编码）

python学习笔记一之,python入门笔记

python方法笔记,python基础教程笔记

第1章python简介（python第一章笔记）

python图像识别时钟的简单介绍

阿平的python小笔记吖,python 阿里巴巴

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

使用python转换文件编码的简单介绍

本文目录一览：

如何进行Python编码转换

如何修改python文件的编码格式

Python 编码转换与中文处理

使用python转换文件编码的简单介绍

python使用笔记23的简单介绍

python使用笔记006的简单介绍

重拾python笔记三的简单介绍

python使用turtle库的简单介绍

python笔记第六天,python第六周笔记

包含python使用笔记24的词条

我的python笔记06（Python）

python笔记二（2python）

geojson合并python的简单介绍

python学习之笔记（python的笔记）

将Jupyter Notebook文件转换为Python文件

python技巧笔记（python自学笔记）

python的用法笔记本（笔记本学python）

python字符编码笔记（python默认字符编码）

python学习笔记一之,python入门笔记

python方法笔记,python基础教程笔记

第1章python简介（python第一章笔记）

python图像识别时钟的简单介绍

阿平的python小笔记吖,python 阿里巴巴

人机检测，请谅解