如何从多个每日文件中获取运行或移动平均值

3回答

素胚勾勒不出你

这不是python中的解决方案，但是如果您的文件被称为file_20061105.nc等，您可以从命令行将它们与cdo（气候数据运算符）合并，然后使用runmean函数cdo mergetime file_*.nc merged_file.nccdo runmean,15 merged_file.nc runmean.nc在某些系统上，您可以打开的文件数量有限制，在这种情况下，您可能需要先合并文件一年for year in {2007..2017} ; do   cdo mergetime file_${year}????.nc merged_${year}.ncdonecdo mergetime merged_????.nc merged_file.nccdo runmean,15 merged_file.nc runmean.nc作为从命令行快速执行此操作的另一种方法。如果你想在python程序中完成这个任务，那么你可以先用这种方式将文件cat成一个（或在python中循环文件并将它们读入一个100x360x4000的numpy数组），然后执行运行意思是在python中

饮歌长啸

至于我上面的评论：“每个文件中有多少项目？...如果每个文件包含数千个网格点，我会首先将不同的网格点排序为单独的文件。每个文件将保存所有日期的相同网格点，按以下顺序排序日期。这样就可以轻松加载单个网格点的整个文件并计算其运行平均值。”现在您有一个用于单个网格点的文件，我会将数据加载到列表中并运行这个简单的运行平均值计算。（由于您可以访问整个数据集，您可以使用此代码。对于在运行时计算平均值并且没有结果历史记录的情况，您可以使用此处指定的算法：维基百科 - 移动平均）#Generate a list of 10 itemsmy_gridpoints_data=[x for x in range(1, 11)]print(my_gridpoints_data)#The average calculation window is set to 3, so the average is for 3 items at a timeavg_window_width: int = 3avg: float = 0.0sum: float = 0.0# Calculate the average of the first 3 items (avg_window_width is 3)for pos in range(0, avg_window_width):    sum = sum + my_gridpoints_data[pos]avg = sum / avg_window_widthprint(avg)# Then move the window of the average by subtracting the leftmost item # and adding a new item from the right# Do this until the calculation window reaches the list's last itemfor pos in range(avg_window_width, my_gridpoints_data.__len__()):    sum = sum + my_gridpoints_data[pos] - my_gridpoints_data[pos - avg_window_width]    avg = sum/avg_window_width    print(avg)结果输出为：[1, 2, 3, 4, 5, 6, 7, 8, 9]2.03.04.05.06.07.08.0

回首忆惘然

回答有点晚，但对于将来阅读的人来说，xarray还提供了一个简单的 Pythonic 解决方案，非常类似于 @Adrian Tomkins 的答案，其中可以先合并每年的文件，然后由于限制将它们合并到一个文件中可以在系统中打开的文件数。for yr in range(2011,2018):    file_name = str(yr) + 'merge.nc'    xr.open_mfdataset(str(yr)*, combine='nested', concat_dim='time').to_netcdf(file_name)xr.open_mfdataset(*merge.nc, combine='nested', concat_dim='time').to_netcdf(merge_all.nc)ds = xr.open_dataset(merge_all.nc, chunks={'lat'=10, 'lon'=10}) # option to chunk if file size is too large, can also be used earlier with open_mfdatasetds_rolling_mean = ds.rolling(time=15, center=True).mean()编辑：xarray与其他经典工具相比的一大优势是，由于dask. 例如，如果您必须在合并之前对文件进行一些预处理，则将xr.open_mfdataset用户定义的预处理函数作为preprocess参数，并且设置 'parallel=True' 将在合并之前并行预处理您的输入文件。