一、下载CMIP6数据
CMIP6数据指的是第六次耦合模式比较项目,该项目由国际上的气候研究机构合作完成。在CMIP6中,多个独立气候模式都已经运行并递交了自己的实验结果,这些实验结果需要保存在计算机数据库中,供气候研究人员使用。以下是下载CMIP6数据的步骤:
1. 访问ESGF网站
<a href="https://esgf-node.llnl.gov/projects/esgf-llnl/">https://esgf-node.llnl.gov/projects/esgf-llnl/</a>
2. 注册你自己的帐号,在ESGF网站上登陆
3. 选择你感兴趣的数据集和模型实验
4. 点击 "Download" 下载CMIP6数据集
二、安装conda
Conda是一个开源并且跨平台的软件包管理器和环境管理器。下面是安装conda的步骤:
1. 访问conda官网地址
<a href="https://docs.conda.io/en/latest/miniconda.html">https://docs.conda.io/en/latest/miniconda.html</a>
2. 下载适合你系统的安装包
3. 执行安装包并按照提示进行安装
三、使用conda下载pangeo环境
Pangeo是一个基于python的地球科学数据分析项目,它的目标是简化地球科学数据分析和可视化。
1. 打开终端输入以下命令以添加pangeo channel:
conda config --add channels conda-forge
conda config --add channels pangeo
conda config --set channel_priority strict
2. 现在你可以从pangeo环境下载需要的软件包,如下所示:
conda create --name pangeo -c pangeo python=3.7 pangeo-notebook
四、使用xarray包处理CMIP6数据
xarray是一个用于处理标记多维数组的python软件包。它使用netCDF语法从文件中加载多维数组,并使用pandas库的特性为数据分配标签。
使用xarray下载数据的方式如下所示:
import xarray as xr
url = "https://esgf-data.dkrz.de/esg-/content/"
ds = xr.open_mfdataset(url + "v1/CICERONE50/pp_fv3gfs_aero/base/CICERONE50_atm.pp_fv3gfs_aero_base.default.20170701-20170731#.nc",
combine='by_coords')
五、下载CMIP6数据后处理
在处理CMIP6数据之前,需要先用conda安装pandas,matplotlib等相关软件包。用如下代码安装:
conda install pandas matplotlib
下面对CMIP6数据进行一些简单处理的示例:
import xarray as xr
path_to_file = '/path/to/cmip6/file.nc'
ds = xr.open_dataset(path_to_file, chunks={'time': 10}) # 用“chunks”方法对大文件进行处理
temp_global_mean = ds.ta.mean(dim=['lat', 'lon']).mean(dim='lev') #计算全球平均温度
temp_global_mean.plot() # 用matplotlib画出全球平均温度随时间变化的曲线图