从另一个数据帧创建熊猫数据帧的更快方法

动态增长的 python 列表比动态增长的 numpy 数组（这是 pandas 数据帧的底层数据结构）快得多。请参阅此处以获取简要说明。考虑到这一点：import pandas as pd# Initialize input dataframeraw_dataset = pd.DataFrame({    'ID':['a121','b142','cd3'],    'start_date':['2019-10-09','2017-02-06','2012-12-05'],    'end_date':['2020-01-30','2019-08-23','2016-06-18'],})# Create integer columns for start year and end yearraw_dataset['start_year'] = pd.to_datetime(raw_dataset['start_date']).dt.yearraw_dataset['end_year'] = pd.to_datetime(raw_dataset['end_date']).dt.year# Iterate over input dataframe rows and individual yearsid_list = []active_years_list = []for row in raw_dataset.itertuples():    for year in range(row.start_year, row.end_year+1):        id_list.append(row.ID)        active_years_list.append(year)# Create result dataframe from listsdesired_df = pd.DataFrame({    'id': id_list,    'active_years': active_years_list,})print(desired_df)# Output:#     id  active_years# 0  a121          2019# 1  a121          2020# 2  b142          2017# 3  b142          2018# 4  b142          2019# 5   cd3          2012# 6   cd3          2013# 7   cd3          2014# 8   cd3          2015# 9   cd3          2016

从另一个数据帧创建熊猫数据帧的更快方法

1回答