读取NetCDF文件(***.nc) 回顾:【气候软件】Python读取气象数据 NetCDF文件(***.nc)
本例以一套CMIP6的BCC-CSM2-MR模式输出的全球tas(表面气温)变量1850-2014年的历史格点资料为例:(数据下载地址:www.52ocean.cn) 文件信息查看如下:
' \: u6 w- Z' @" h4 i) z, `
可以看到,文件的坐标有时间time, 经度lon,纬度lat,高度height,变量有表面气温tas。 %读取nc文件用到xarray库包中.open_dataset()函数; %提取某时间范围内、某经纬度范围内的数据用到.loc[]函数; . O6 g" @; A% x, {! ^: m5 S" S1 f: f
- 3 y$ ]% U2 N% t2 x0 q# X; o3 R `# F3 U
- 5 g8 V& W9 D" [3 z% P& D" {
7 s/ n: ?# d/ w1 z9 C4 n/ {
& Z: Z: s1 P" i* k# m, d3 i7 ~5 y8 P
2 O2 o3 V' Z4 c/ e; C9 G
, J9 @# w L8 c* b# g e
: b# D9 a9 V. w! d; Q5 N% _- 7 n$ s H- w: R5 ` u
- ; a3 K4 @( J, @( B3 w. w
* j8 D( d' b5 h1 h7 J7 _+ [
#1引库import xarray as xr#2数据(数据免费下载后台输入“BCC-CSM2-MR数据”回复获取)data = xr.open_dataset('tas_Amon_BCC-CSM2-MR_historical_r1i1p1f1_gn_185001-201412.nc', decode_times=False)print(data) #输出显示数据信息,便于了解tas = data['tas'] #提取变量tas数据 a = tas.loc[15.5:74.5] # 提取time在15.5至74.5区间内的数据b = tas.loc[15.5:74.5, 40:55, 115:135] #选取了lat在40°N-55°N,lon在115°E-135°E范围的数据
% R2 y1 j0 ~& \: [6 }- Q
' D7 N J( c% P! M5 u2 D$ [读取(time时间在15.5至74.5区间内,lat纬度在40°N-55°N,lon精度在115°E-135°E)范围结果显示:
" y ~4 [: m$ z4 S5 m* R5 F
_. y+ i, c2 e9 o! _" F
读取TXT文件 " U1 m% h8 l7 B# U. D' t
回顾:【气候软件】Python2:读取TXT文本格式的数据 站点数据是气象数据很重要的一部分,尤其是在观测数据方面,站点数据一般存放于.txt(.csv)文件中,首先就需要读取数据。 以一套中国气象数据网下载的某省的1979-2019年逐月气温数据为例,数据文件格式为TXT文本格式:(数据下载地址:www.52ocean.cn) TXT文本保存的数据如下图所示:
%读取txt文件用到pandas库包中.read_csv()函数; 9 g/ @& {, j1 G2 K- D
- ( i5 \, g# f$ w" B; R- r
$ r. U3 {$ y% n" D. O1 ^- : S" L5 a! S" }- i, v. y$ I
- # g3 n6 _: {# i! G* a
/ k6 V ]9 ]6 w6 \6 o1 O- d5 U1 o# q- 8 z8 i" H+ H! h+ T% }1 x: o
4 [3 _% ~( b8 H# H& L- 6 e# Q8 U% {! d4 r% d( @
2 W. R6 G! W+ e6 b: w& ?7 _5 d# F ^/ T* L1 `9 M) E8 H
#1引库import pandas as pd#2数据##skiprows跳过了前1行的文件头##sep=','为文件中数据以逗号间隔;若以空格为间隔修改为sep='\s+'#设置导入 数据 的列名称data = pd.read_csv("tem.txt", skiprows=1, sep=',', header=None) print(data)
. ^% ?! X* K/ Q( |
0 e1 u2 J2 c$ t; T" _1 g. g" O" ~读取结果显示:
可以看到,文件的数据有22列,492行,第0列是年份,第1列是月份,剩余列数是变量数据。 skiprows=1表示跳过了前1行的文件头(因为第一行的数据中含有非数字的字符,所以选择跳过不读取)。 如果其他文件中数据是以空格为间隔,则sep='\s+'定义了数据间隔为空格。 header:设置导入 数据 的列名称,默认为 "infer",注意它与下面介绍的 names 参数的微妙关系。 names: & a/ \, o& y6 U8 D$ S2 Q9 m
8 H( ]9 u/ Y$ ] t) a+ b |