一、什么是tzdata
tzdata是Unix操作系统中的一个包含时区信息的数据库,它是由ICANN(Internet Corporation for Assigned Names and Numbers)组织维护的,其中包括了全球各个时区的历史时区偏移量、DST(Daylight Saving Time,夏令时)规则以及所有相关的时间记录。它最初被称为tz数据库,后来根据FTP服务器路径的名字被重命名为tzdata。 在实际应用中,tzdata作为全球化应用程序和计算机操作系统的主要组成部分,它负责将时间转换为正确的本地时间,对于涉及不同时区的交互应用程序,尤其是跨国际公司和跨宗教活动、在线会议等,时区数据是至关重要的。
二、时区数据的格式
tzdata文件是一系列地球上不同时区的描述。目前,时区数据规范版本号为2021a。其文件使用磁盘上的英文缩写来标识时区,并以+/-hh:mm形式指定偏移量,存储夏令时变化的规则。 例如,亚洲/上海时区使用的格式为:
# Rule NAME FROM TO TYPE IN ON AT SAVE LETTER/S
Rule China 1949 only - Oct 1 0:00 0 -
Rule China 1986 only - May 4 0:00 1:00 D
Rule China 1986 only - Sep 14 0:00 0 S
Rule China 1987 only - Apr 12 0:00 1:00 D
Rule China 1987 only - Sep 13 0:00 0 S
Rule China 1988 only - Apr 10 0:00 1:00 D
每一行提供了一个规则,规则的格式如下:
RULE [name] [from] [to] [type] [in] [on] [at] [save] [letters]
其中,RULE是固定字段,表示这是一个规则;[name]指被规则覆盖区域的名称(如 "China");[from]和[to]分别为时间范围;[type]有两种可能:"w"表示该规则在本地时间和标准时间之间有一个固定的偏移量,"s"表示规则的时间取决于日出日落。[in]表示 DST 开始时间与结束时间的说明(如“仅在线下周五”或“在某个月的第三个星期日之后”等);[on]确定规则在什么时间生效;[at]确定规则生效的准确时间;[save]表示夏令时期间本地时间与标准时间之间的小时数差异;[letters]是两个字母的缩写,表示要在夏令时期间显示的字母简写。
三、时区数据更新
由于夏令时规则和历史时区偏移量的变化是不可预见的,tzdata需要持续更新。ICANN每年都会发布一次tzdata更新,保证包含所有近期的规则和偏移量信息,并且,所有的时区和规则均按照数字顺序列出。 如果需要实时更新tzdata,可以在服务器上安装zic程序,使用以下命令进行配置:
$ wget https://data.iana.org/time-zones/releases/tzdata2021a.tar.gz
$ tar -xzf tzdata2021a.tar.gz
$ sudo zic ./zoneinfo
其中,第一行命令下载最新的tzdata文件,第二行和第三行将tzdata文件解压并将区域信息输出到指定文件夹zoneinfo中。
四、应用时区数据
在实际应用中,我们可以使用标准化的API将本地时间与世界标准时间进行转换,Python pandas模块是用于数据操作和数据分析的常用库,也提供了时区转换的功能。我们可以使用以下代码来将本地时间转换为UTC:
import pandas as pd
import pytz
local_time = pd.Timestamp.now()
utc_time = local_time.tz_localize(pytz.timezone('Asia/Shanghai')).tz_convert(pytz.utc)
其中,pd.Timestamp.now()获取当前本地时间,tz_localize()将本地时间转换为指定时区的时间,tz_convert()将指定时区的时间转换为UTC时间。
五、总结
tzdata作为一个全球有关时区相关信息的数据库,在跨国公司和国际活动等实际应用中具有非常重要的地位。除此之外,时区转换也是多数语言和框架常用的函数库,Python pandas模块就是其中之一。 在实际应用中,我们只需读取zic输出的时区数据文件或通过API获取时区数据即可。而方式和具体实现则根据实际情况灵活选择,唯一需要注意的是时区偏移量和DST规则在随着时间的变化而变化,需要定期更新时区数据。