收藏本站 劰载中...网站公告 | 吾爱海洋论坛交流QQ群:835383472

[Python] Python11:读取不同Netcdf和txt格式的气象数据(xarray库和pandas...

[复制链接]

读取NetCDF文件(***.nc)

回顾:【气候软件】Python读取气象数据 NetCDF文件(***.nc)


本例以一套CMIP6的BCC-CSM2-MR模式输出的全球tas(表面气温)变量1850-2014年的历史格点资料为例:(数据下载地址:www.52ocean.cn

文件信息查看如下:


  U/ f1 c" N2 @, a. K' D: u

1a1e28f7de9c02c666ed97dbd5fd2a72.png

可以看到,文件的坐标有时间time, 经度lon,纬度lat,高度height,变量有表面气温tas。

%读取nc文件用到xarray库包中.open_dataset()函数;

%提取某时间范围内、某经纬度范围内的数据用到.loc[]函数;

' k" ]5 ^9 M5 `, O; b# v0 z

  • & n, z0 L* w: C1 S/ D8 n. i  j
  • 8 S- a+ B7 J; @
  • 8 k) I7 g* I- H+ R- ]- x# Q' e  M
  • & i) S! {4 U: V1 t+ e
  • $ G, F0 o0 F) @7 f! e3 v  k

  • 1 C1 r: Y; z$ s, @' w4 }3 e
  • ' M0 e4 h5 a( K" |7 B

  • 3 M+ r# t2 M- _2 [' s0 y; E- c
  • ; `1 X( k7 r- ~) [

    $ @6 u# ?" ^3 ]' l# C5 l

#1引库import xarray as xr#2数据(数据免费下载后台输入“BCC-CSM2-MR数据”回复获取)data = xr.open_dataset('tas_Amon_BCC-CSM2-MR_historical_r1i1p1f1_gn_185001-201412.nc', decode_times=False)print(data)  #输出显示数据信息,便于了解tas = data['tas']  #提取变量tas数据  a = tas.loc[15.5:74.5]  # 提取time在15.5至74.5区间内的数据b = tas.loc[15.5:74.5, 40:55, 115:135]  #选取了lat在40°N-55°N,lon在115°E-135°E范围的数据# k# c# J) s: M5 S1 Z* M8 _

/ h6 y& X$ ?; X* [) ?0 V; c/ B3 Z' q

读取(time时间在15.5至74.5区间内,lat纬度在40°N-55°N,lon精度在115°E-135°E)范围结果显示:

ba790cde36edf774adba4d7236ae5bae.png

" S. o, \& _3 Z) z9 ^- o" _
6 i& z) O  d- b; N, q/ ~

读取TXT文件


2 g& L& [; ]0 B0 b$ E' S  J

回顾:【气候软件】Python2:读取TXT文本格式的数据

站点数据是气象数据很重要的一部分,尤其是在观测数据方面,站点数据一般存放于.txt(.csv)文件中,首先就需要读取数据。

以一套中国气象数据网下载的某省的1979-2019年逐月气温数据为例,数据文件格式为TXT文本格式:(数据下载地址:www.52ocean.cn

TXT文本保存的数据如下图所示:

9b1379a3b4909ed05af149774d062cda.png

%读取txt文件用到pandas库包中.read_csv()函数;


* m2 d8 X: _1 F6 |7 k- g: ?
  • 3 H9 O( d. N. t' ~( a% |/ f9 _2 H

  • 0 C+ K: \' s' P* l2 O, |
  • ' s* }6 i$ c7 P- K$ w! A1 i1 g

  • - w( O( S" k0 Q' {

  • 3 R7 t1 ~6 C/ @7 S& I( f
  • & B7 y% F8 s3 `2 V4 w1 U  i, T) }
  • ' {  H0 h" W8 p

  • ( |# [8 ~8 u$ c
  • 6 |4 Y/ n5 y' F# F0 I* {
    ' ]4 l) @. m8 H5 D0 M9 T4 ^' W

#1引库import pandas as pd#2数据##skiprows跳过了前1行的文件头##sep=','为文件中数据以逗号间隔;若以空格为间隔修改为sep='\s+'#设置导入 数据 的列名称data = pd.read_csv("tem.txt", skiprows=1, sep=',', header=None)  print(data)
  T6 I7 p: X  s  p3 T  F3 ^; r


. m" ?. e, L4 [$ T. n

读取结果显示:

cdeaa0ac0572f4c8f1dcd31b2cedc757.png

可以看到,文件的数据有22列,492行,第0列是年份,第1列是月份,剩余列数是变量数据。

skiprows=1表示跳过了前1行的文件头(因为第一行的数据中含有非数字的字符,所以选择跳过不读取)。

如果其他文件中数据是以空格为间隔,则sep='\s+'定义了数据间隔为空格。

header:设置导入 数据 的列名称,默认为 "infer",注意它与下面介绍的 names 参数的微妙关系。

names

  • 当names没被赋值时,header会变成0,即选取数据文件的第一行作为列名。

  • 当 names 被赋值,header 没被赋值时,那么header会变成None。如果都赋值,就会实现两个参数的组合功能。


    # B$ s# }. G' {8 ?: L
4 {: n5 g' l) L. @" ]2 d! K, t2 ?
$ y5 h: r# j* a- p0 c: F
回复

举报 使用道具

相关帖子

全部回帖
暂无回帖,快来参与回复吧
懒得打字?点击右侧快捷回复 【吾爱海洋论坛发文有奖】
您需要登录后才可以回帖 登录 | 立即注册
有风
活跃在2022-10-29
快速回复 返回顶部 返回列表