Python是一种高级的、面向对象的编程语言,具有简洁、易读的语法和强大的标准库,常被用于Web开发、网络编程、数据分析、人工智能等多个领域。其中文件读写操作是Python编程中非常重要的一项技能,尤其在数据分析和人工智能领域中更是必不可少。
一、文件读写操作基础
Python提供了多种文件读写操作的方法,最常用的有以下三种:
# 打开文件 file = open('file.txt', 'r') # 读取全部内容 content = file.read() # 关闭文件 file.close()
上述代码中,首先通过open()函数打开了一个名为"file.txt"的文件,并以只读模式('r')打开。接着使用read()函数从文件中读取全部的内容,最后使用close()函数关闭文件。
另一种常用的方式是逐行读取文件内容:
# 打开文件 file = open('file.txt', 'r') # 逐行读取内容 for line in file: print(line) # 关闭文件 file.close()
上述代码中,使用for循环逐行读取文件内容,并使用print()函数输出。同样,最后使用close()函数关闭文件。
有时候我们需要向文件中写入一些内容,Python也提供了多种文件写入的方法:
# 打开文件 file = open('file.txt', 'w') # 写入内容 file.write('hello, world!') # 关闭文件 file.close()
上述代码中,使用open()函数以写入模式('w')打开文件,并使用write()函数向文件中写入了"hello, world!"这句话。最后使用close()函数关闭文件。
二、文件读写操作进阶
1. 使用with语句自动关闭文件
在实际编程中,文件读写操作完成后一定要记得关闭文件。然而,如果程序出现异常或者其他原因导致程序没有关闭文件,就可能会出现资源泄漏的问题。为了避免这种情况的发生,Python提供了一个with语句来自动关闭文件:
# 使用with语句打开文件 with open('file.txt', 'r') as file: content = file.read() # with语句块结束后,文件自动关闭
2. 操作二进制文件
在进行文件读写操作时,有些文件是以二进制格式存储的,如图片、音频、视频等文件。Python同样可以进行二进制文件处理:
# 以二进制模式打开文件 with open('image.jpg', 'rb') as file: content = file.read() # 以二进制模式写入文件 with open('image_copy.jpg', 'wb') as file: file.write(content)
3. 操作CSV文件
CSV(Comma-Separated Values)文件是常用的数据文件格式之一,在数据分析和机器学习中经常使用。Python中可以使用csv模块对CSV文件进行读写操作:
import csv # 读取CSV文件 with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: print(row) # 写入CSV文件 with open('data.csv', 'w', newline='') as file: writer = csv.writer(file) writer.writerow(['name', 'age', 'gender']) writer.writerow(['Tom', '20', 'male']) writer.writerow(['Lucy', '22', 'female'])
三、实战案例:统计文本中单词出现的次数
在实际开发中,我们通常会遇到需要统计文本中单词出现的次数的需求。下面给出一个实现的例子:
# 打开文件 with open('text.txt', 'r') as file: content = file.read() # 将字符串中的非字母字符替换为空格 content = re.sub('[^\w]', ' ', content) # 将字符串分割成单词列表 words = content.split() # 统计单词出现的次数 word_count = {} for word in words: if word.lower() in word_count: word_count[word.lower()] += 1 else: word_count[word.lower()] = 1 # 输出统计结果 for word, count in sorted(word_count.items(), key=lambda item: item[1], reverse=True): print(word, count)
上述代码中,使用open()函数打开文本文件,并使用read()函数读取全部内容。接着使用re.sub()函数将字符串中的非字母字符替换为空格,使用split()函数将字符串分割成单词列表。最后使用字典来统计单词出现的次数,并使用sorted()函数对字典按值进行排序,并输出结果。