一、介绍
在数据分析、机器学习、深度学习等领域,Jupyter Notebook(以下简称Notebook)已经成为一种必备的开发工具。除了可以编写代码并逐步运行外,它还可以实时展示代码、图像和文本等多种数据类型。在Notebook中,打开文件是一个基础功能,本文将涵盖如何在Notebook中打开CSV、Excel、JSON、文本、Python代码等不同类型的文件。
二、正文
1. 打开CSV文件
CSV(Comma-Separated Values)是指逗号分隔值文件,它通常用于存储表格数据。在Notebook中打开CSV文件,只需要使用pandas库中的read_csv
方法即可。
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())
以上代码读取名为data.csv
的CSV文件,并用head()
方法显示前5行数据。如果文件不在当前目录中,可以添加其路径。
2. 打开Excel文件
Excel是一种电子表格软件,它的文件通常以.xls
或.xlsx
为后缀名。在Notebook中打开Excel文件,同样可以使用pandas库,只需要使用read_excel
方法,并指定需要读取的表单的位置或名称。
import pandas as pd
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
print(data.head())
以上代码读取名为data.xlsx
中的Sheet1
表单,并用head()
方法显示前5行数据。
3. 打开JSON文件
JSON(JavaScript Object Notation)是指JavaScript对象表示法的文件格式。在Notebook中,使用Python的标准json
库即可读取JSON文件。
import json
with open('data.json') as f:
data = json.load(f)
print(data)
以上代码读取名为data.json
的JSON文件,并打印其中的全部内容。由于JSON数据天然适合用Python的字典表示,json.load()
方法返回的也是Python字典。
4. 打开文本文件
文本文件以纯文本格式存储,可以用记事本等文本编辑器打开。在Notebook中,读取文本文件也非常简单,使用内置的open
方法即可。
with open('data.txt') as f:
data = f.read()
print(data)
以上代码读取名为data.txt
的文本文件,并打印全部内容。如果文件被读取时需要加上换行符,则可以在read()
方法中传入'rb'
。
5. 打开Python代码文件
在Notebook中打开Python的代码文件,可以使用Python内置的builtins
模块的open
函数。读取后,可以用IPython的run_line_magic
方法执行其中的Python代码。
from IPython.core import magic_arguments
from IPython.core.magic import register_line_cell_magic
@register_line_cell_magic
@magic_arguments.magic_arguments()
@magic_arguments.argument('--filename', '-f',
help='the Python script you want to run.')
def run_py(filename, cell=None):
'''
`run_py` - Run the specified Python script in Jupyter Notebook.
'''
if cell is not None:
clean_cell = ''.join(cell.splitlines()) # remove '\n'
exec(clean_cell, globals())
if filename is not None:
exec(open(filename, 'rb').read(), globals())
%run_py -f example.py
以上代码示例是如何打开名为example.py
的Python代码文件,并执行其中的代码。需要注意的是,run_py
方法需要被注册为IPython的magic方法,并在其中使用exec()
来执行指定的代码。
三、小标题
1. CSV文件
CSV文件是存储表格数据的一种文件格式。
2. Excel文件
Excel文件是一种电子表格软件,通常以.xls
或.xlsx
结尾。
3. JSON文件
JSON文件是JavaScript对象表示法的文件格式。
4. 文本文件
文本文件是以纯文本格式存储的一种文件。
5. Python代码文件
Python代码文件是存储Python代码的一种文件格式。
四、结论
在Notebook中打开文件是一项基础技能,需要通过熟悉的库和Python内置函数实现。无论是CSV、Excel、JSON、文本、Python代码等不同类型的文件,在Notebook中打开都是非常简单的。