探索时区数据——从tzdata了解世界时区

发布时间:2023-05-20

一、什么是tzdata

tzdata是Unix操作系统中的一个包含时区信息的数据库,它是由ICANN(Internet Corporation for Assigned Names and Numbers)组织维护的,其中包括了全球各个时区的历史时区偏移量、DST(Daylight Saving Time,夏令时)规则以及所有相关的时间记录。它最初被称为tz数据库,后来根据FTP服务器路径的名字被重命名为tzdata。 在实际应用中,tzdata作为全球化应用程序和计算机操作系统的主要组成部分,它负责将时间转换为正确的本地时间,对于涉及不同时区的交互应用程序,尤其是跨国际公司和跨宗教活动、在线会议等,时区数据是至关重要的。

二、时区数据的格式

tzdata文件是一系列地球上不同时区的描述。目前,时区数据规范版本号为2021a。其文件使用磁盘上的英文缩写来标识时区,并以+/-hh:mm形式指定偏移量,存储夏令时变化的规则。 例如,亚洲/上海时区使用的格式为:

# Rule  NAME    FROM    TO  TYPE    IN  ON  AT  SAVE    LETTER/S
Rule    China   1949    only    -   Oct  1   0:00    0   -
Rule    China   1986    only    -   May  4   0:00    1:00    D
Rule    China   1986    only    -   Sep 14   0:00    0   S
Rule    China   1987    only    -   Apr 12   0:00    1:00    D
Rule    China   1987    only    -   Sep 13   0:00    0   S
Rule    China   1988    only    -   Apr 10   0:00    1:00    D

每一行提供了一个规则,规则的格式如下:

RULE [name] [from] [to] [type] [in] [on] [at] [save] [letters]

其中,RULE是固定字段,表示这是一个规则;[name]指被规则覆盖区域的名称(如 "China");[from]和[to]分别为时间范围;[type]有两种可能:"w"表示该规则在本地时间和标准时间之间有一个固定的偏移量,"s"表示规则的时间取决于日出日落。[in]表示 DST 开始时间与结束时间的说明(如“仅在线下周五”或“在某个月的第三个星期日之后”等);[on]确定规则在什么时间生效;[at]确定规则生效的准确时间;[save]表示夏令时期间本地时间与标准时间之间的小时数差异;[letters]是两个字母的缩写,表示要在夏令时期间显示的字母简写。

三、时区数据更新

由于夏令时规则和历史时区偏移量的变化是不可预见的,tzdata需要持续更新。ICANN每年都会发布一次tzdata更新,保证包含所有近期的规则和偏移量信息,并且,所有的时区和规则均按照数字顺序列出。 如果需要实时更新tzdata,可以在服务器上安装zic程序,使用以下命令进行配置:

$ wget https://data.iana.org/time-zones/releases/tzdata2021a.tar.gz
$ tar -xzf tzdata2021a.tar.gz
$ sudo zic ./zoneinfo

其中,第一行命令下载最新的tzdata文件,第二行和第三行将tzdata文件解压并将区域信息输出到指定文件夹zoneinfo中。

四、应用时区数据

在实际应用中,我们可以使用标准化的API将本地时间与世界标准时间进行转换,Python pandas模块是用于数据操作和数据分析的常用库,也提供了时区转换的功能。我们可以使用以下代码来将本地时间转换为UTC:

import pandas as pd
import pytz
local_time = pd.Timestamp.now()
utc_time = local_time.tz_localize(pytz.timezone('Asia/Shanghai')).tz_convert(pytz.utc)

其中,pd.Timestamp.now()获取当前本地时间,tz_localize()将本地时间转换为指定时区的时间,tz_convert()将指定时区的时间转换为UTC时间。

五、总结

tzdata作为一个全球有关时区相关信息的数据库,在跨国公司和国际活动等实际应用中具有非常重要的地位。除此之外,时区转换也是多数语言和框架常用的函数库,Python pandas模块就是其中之一。 在实际应用中,我们只需读取zic输出的时区数据文件或通过API获取时区数据即可。而方式和具体实现则根据实际情况灵活选择,唯一需要注意的是时区偏移量和DST规则在随着时间的变化而变化,需要定期更新时区数据。