python文本读写及编码检测,python读文件编码

本文目录一览：

1、python 读取文本里有多种编码
2、Python读取文件内容的方法有几种
3、python3读文件编码错误怎么办
4、Python中的文件读写-理论知识
5、python读写文件
6、python对文本文件的读有哪些方法,写有哪些方法?

python 读取文本里有多种编码

读取ANSI编码文件

建立一个文件test.txt，文件格式用ANSI，内容为:

abc中文

用Python来读取

# coding=gbk

print open("Test.txt").read()

结果：abc中文

读取utf-8编码文件（无BOM）

把文件格式改成UTF-8：

结果：abc涓枃

显然，这里需要解码：

# -*- coding: utf-8 -*-

import codecs

print open("Test.txt").read().decode("utf-8")

结果：abc中文

读取utf-8编码文件（有BOM）

某些软件在保存一个以UTF-8编码的文件时，默认会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。在有些软件可以控制是否插入BOM。如果在有BOM的情况下，在读取时需要自己去掉这些字符，python中的codecs module定义了这个常量：

python文本读写及编码检测,python读文件编码

Python读取文件内容的方法有几种

python读取文本文件内容的方法主要有三种：read()、readline()、readlines()。

第一种：read()

read()是最简单的一种方法，一次性读取文件的所有内容放在一个大字符串中，即内存中。

read()的好处：方便、简单，一次性读出文件放在一个大字符串中，速度最快。

read()的坏处：文件过大的时候，占用内存会过大。

第二种：readline()

readline()逐行读取文本，结果是一个list。

readline()的好处：占用内存小，逐行读取。

readline()的坏处：逐行读取，速度比较慢。

第三种：readlines()

readlines()一次性读取文本的所有内容，结果是一个list。

readlines()的好处：一次性读取文本内容，速度比较快。

readlines()的坏处：随着文本的增大，占用内存会越来越多。

python3读文件编码错误怎么办

在python3中系统默认编码是unicode,读取文件经常会编码错误导致报错。

首先先确认要读取文件的编码，可这样操作：

记事本打开文本文件，点击“文件”-“另存为”查看编码:

如图显示编码就是当前的文件编码，这里是“utf-8”。

2. 要想用指定编码打开，使用codecs模块

安装模块pip命令:

pip install codecs

3. 使用codecs模块，例如读取test文件内容并打印：

import codecs

f=codecs.open(r"test.txt","r","gbk")

print(f.read())

f.close()

（示例的文件是ANSI所以使用GBK读取）

以上就可以正确读取想要的文件了

Python中的文件读写-理论知识

Python处理两种不同类型的文件：二进制文件和文本文件。了解两者之间的差异很重要，因为它们的处理方式不同。

二进制文件

在正常计算机使用期间使用的大多数文件实际上是二进制文件，而不是文本。比如：Microsoft Word .doc文件实际上是一个二进制文件，即使它只有文本。

二进制文件的其他示例包括：

图像文件，包括.jpg，.png，.bmp，.gif，等。

数据库文件包括.mdb，.frm和.sqlite

文件，包括.doc，.xls，.pdf或者其他文件。

那是因为这些文件都有特殊处理的要求，需要特定类型的软件来打开它。例如，您需要Excel来打开.xls文件，并使用数据库程序来打开.sqlite文件。

文本文件

一方面，没有特定的编码，可以通过没有任何特殊处理的标准文本编辑器打开。但是，每个文本文件都必须遵守一组规则：

文本文件必须是可读的。他们可以（并且经常会）包含许多特殊编码，尤其是在HTML或其他标记语言中，但您仍然可以说出它的含义

文本文件中的数据按行组织。在大多数情况下，每一行都是一个独特的元素，无论是指令行还是命令。

此外，文本文件在每行的末尾都有一个看不见的字符，这使文本编辑器知道应该有一个新行。通过编程与这些文件交互时，您可以利用该字符。在Python中，它用“ n” 表示。

在哪里可以找到Python的文件I / O工具

在Python中工作时，您不必担心导入任何特定的外部库来处理文件。Python附带有“文件库”，文件I / O工具和实用程序是核心语言的内置部分。

但是在其他语言（如C ++）中，要处理文件，您必须通过包含正确的头文件来启用文件I / O工具#include fstream。如果您使用Java编写代码，则需要使用该import java.io.*语句。

使用Python，就没有必要这样做，这是因为Python有一组内置函数，可以处理读取和写入文件所需的所有内容。

python读写文件

读文件

1）使用open()方法打开文件，返回一个文件对象

原型：open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)

举例：f = open('test.txt', 'r')

test.txt表示文件路径(包含文件名，这个file参数可以是绝对或者相对路径)

r表示是读文本文件，rb是读二进制文本文件。（这个mode参数默认值就是r）

2）使用close()方法关闭文件

f.close()

打开后的文件必须关闭，因为文件对象会占用系统资源，系统打开文件数量也就有限了

3）打开文件时的异常处理

f=open('test.txt', 'r')

f.read()

f.close()

FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'

文件读写时都有可能产生异常IOError(比如文件不存在)，这样其后面的f.read()，f.close()就不会调用。为保证无论是否异常都可以关闭文件，一般使用try ... finally来处理：

try:

f = open('test.txt', 'r')

f.read()

finally:

if f:

f.close()

但这种写法过于繁琐，所以Python引入了with语句来自动调用close()方法：

with open('test.txt', 'r') as f:

f.read()

4）读文件 - read()、readline() 和 readlines()

read() 一次读取整个文件，它通常用于将文件内容放到一个字符串变量中。如果文件过大，内存不够，可以通过反复调用read(size)方法，每次最多读取size个字节的内容。

readline() 一次读取文件中一行内容，可反复调用

readlines() 一次读取所有内容并按行返回列表，该列表可以由for ... in ... 结构再进一步处理。

特别注意：

这三种方法是把每行末尾的'\n'也读进来了，如有需要就得我们手动去掉'\n'

with open('test.txt', 'r') as f:

list = f.readlines()

for i in range(0, len(list)):

list[i] = list[i].rstrip('\n')

写文件

1）写文件和读文件是一样的，唯一区别是open文件时，传入标识符不同，即'w'或者'wb'表示写文本文件或写二进制文件

f = open('test.txt', 'w')

f = open('test.txt', 'wb')

f = open('test.txt', 'a')

f.close()

特别注意：

1. 如果没有这个文件，会自动创建一个新文件；如果有，就会先把原文件的内容清空再写入；若不想清空原来的内容而是直接在后面追加新的内容，就用'a'这个模式

2. 写文件，操作系统往往不会立刻把数据写入磁盘，而是放到内存缓存起来，空闲的时候再慢慢写入。只有调用close()方法时，操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘，剩下的丢失了。

2）写文件 - write()、writelines()

write()方法和read()、readline()方法对应，是将字符串写入到文件中。

writelines()方法和readlines()方法对应，也是针对列表的操作。它接收一个字符串列表作为参数，将他们写入到文件中。

特别注意：

换行符不会自动的加入，需要显式的加入换行符。

f = open('test.txt', 'w')

f.writelines(["111\n", "222\n", "333\n"])

补充说明：

1）对于非默认编码(utf-8)的文件，需要open时添加encording参数，选择对应的编码方式

2）r+, w+, a+，可读可写

3）seek()方法，移动文件指针

seek(offset[, whence]) ，offset是相对于某个位置的偏移量。位置由whence决定，默认whence=0，从开头起；whence=1，从当前位置算起；whence=2相对于文件末尾移动，通常offset取负值。

python对文本文件的读有哪些方法,写有哪些方法?

1 文件读取全文本操作

在一定场景下我们需要把文本全部内容读取出来，进行处理。python提供三种函数读取文件，分别是read readline readlines，

read()：读取文件的全部内容，加上参数可以指定读取的字符。

readline()：读取文件的一行。

readlines()：读取文件的所有行到内存中。

不同场景下我们可以选择不同函数对文件进行读取。

1.1 方法一

file_name = input("请输入你要打开的文件的完整路径及名称")

file= open(file_name, "r")

txt=file.read()

# 全文本的处理

file.close()

使用read函数将文件中的内容全部读取，放在字符串变量txt中。这样操作适合于文本较小，处理简单的情况，当文件较大时，这种方式处理时不合适的。一次性读取较大的文件到内存中，会耗费较多的时间和资源。这时候分批处理效果更好。

1.2 方法二

file_name = input("请输入你要打开的文件的完整路径及名称")

file= open(file_name, "r")

txt= file.read(4)

# 文本的处理while txt != ""txt= file.read(4)

# 批量文本处理

file.close()

这种方法适合于分批处理文本信息，每次批量读入，批量处理，不会对内存造成较大的压力。

1.3 方法三

file_name = input("请输入你要打开的文件的完整路径及名称")

file= open(file_name, "r")for line infile.readlines():

# 处理每一行数据

file.close()

这种处理方式适合处理以行为分割特点的文本，并且文本较小，因为这种处理方式需要一次性把文件所有内容读取到内存中。

1.4 方法四

file_name = input("请输入你要打开的文件的完整路径及名称")

file= open(file_name, "r") # 这里的file时文件句柄for line infile:

# 处理每一行数据

file.close()

这种方式和方法三中的区别是分行读入，逐行处理，不会一次性把文件所有内容都读入到内存中，对一些大文件的处理是很有效的。

2 文件写入文本操作

文件写入有两种写入函数和一种辅助支持。

write()：向文件中写入一个字符或者字节流

writelines()：将一个元素全为字符串的列表写入到文件中需要注意的是，writelines写入列表元素的时候会把列表元素的内容拼接到一起写入，不会有换行和空格。

seek()：辅助写入函数offset偏移量参数代表含义如下

0 - 文件开头

1 - 当前位置

2 - 文件结尾

2.1 方法一

file_name = input("output.txt", "w+")

text= "hello world!"file_name.write(text)

file.close()

2.2 方法二

file_name = input("output.txt", "w+")

list= ["中午","早上","晚上"]

file_name.writelines(list)for line infile:

# 读取写入的数据，这时候发现是没有任何内容的

file.close()

我们增加一行代码就可以读取到写入的文件内容，利用seek()函数调整写操作指针的位置，可以实现写操作之后的正常读取。

file_name = input("output.txt", "w+")

list= ["中午","早上","晚上"]

file_name.readlines(list)

file_name.seek(0) # 调整写的指针到文件的开始位置for line infile:

# 读取写入的数据，这时候会读出一行写入的数据。

file.close()

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

python文本读写及编码检测,python读文件编码

本文目录一览：

python 读取文本里有多种编码

Python读取文件内容的方法有几种

python3读文件编码错误怎么办

Python中的文件读写-理论知识

python读写文件

python对文本文件的读有哪些方法,写有哪些方法?

python文本读写及编码检测,python读文件编码

python字符编码笔记（python默认字符编码）

Python Padx：用Python快速打造自己的代码笔记

python学习笔记一之,python入门笔记

python制作简单文本编辑器（python做文本编辑器）

python的用法笔记本（笔记本学python）

Python文件读取——快速读取文本内容

python读取中文文本出错,python文本纠错

python笔记第六天,python第六周笔记

python字符编码和文件处理,关于python字符编码

python基础读写文件05（python文件读写操作方法）

Python读取文本文件的方法详解

我的python笔记06（Python）

python读取cvs文件问题,matlab读取cvs文件

python库之文件读取（python中文件读取）

python读写dbf文件详解,python操作db文件

python生成csv文件乱码,csv文件下载乱码

关于python学习第四次笔记的信息

python读文件r,python读文件对每行求和

Python文件读写操作—简单文件读写入门

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

python文本读写及编码检测,python读文件编码

本文目录一览：

python 读取文本里有多种编码

Python读取文件内容的方法有几种

python3读文件编码错误怎么办

Python中的文件读写-理论知识

python读写文件

python对文本文件的读有哪些方法,写有哪些方法?

python文本读写及编码检测,python读文件编码

python字符编码笔记（python默认字符编码）

Python Padx：用Python快速打造自己的代码笔记

python学习笔记一之,python入门笔记

python制作简单文本编辑器（python做文本编辑器）

python的用法笔记本（笔记本学python）

Python文件读取——快速读取文本内容

python读取中文文本出错,python文本纠错

python笔记第六天,python第六周笔记

python字符编码和文件处理,关于python字符编码

python基础读写文件05（python文件读写操作方法）

Python读取文本文件的方法详解

我的python笔记06（Python）

python读取cvs文件问题,matlab读取cvs文件

python库之文件读取（python中文件读取）

python读写dbf文件详解,python操作db文件

python生成csv文件乱码,csv文件下载乱码

关于python学习第四次笔记的信息

python读文件r,python读文件对每行求和

Python文件读写操作—简单文件读写入门

人机检测，请谅解