我希望这个问题很清楚,但我正在研究 Zillow 房屋销售数据,并且遇到了一个问题,即能够将某些年份的所有月份合并到新声明的“年份”变量。这基本上应该将包含 Jan-YY、Feb-YY、Mar-YY...等的所有数据存储为 YY。
我尝试过 Pandas 内置的函数,例如Stack()和Pivot(),但这些似乎不起作用。
如果没有可行的方法来做到这一点,我有什么选择?提前致谢!
示例:采用 Column1 = '1/31/1996'和 Column2 = '2/28/1996' …等。和 Column12 = '12/31/1996'并组合成一个名为Y1996的新列。这比每月细分更容易分析。
我的代码:
import pandas as pd
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt
%matplotlib inline
zil = pd.read_csv('zillow.csv')
df_zil = pd.DataFrame(df_zil)
df_zil.head(4)
#My attempt at merging into one
y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] +
df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] +
df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])
如何通过 Excel 格式化数据的屏幕截图 - 从第一列开始
参考 Zillow 数据: https: //www.zillow.com/research/data/
冉冉说
相关分类