我有一个熊猫数据框,其中列的名称类似于: BT_XXX_XX.XX%_X.XX.XX ;EH_XXX_XX.XX%_XX.XX.XX ; C_XXX_XX.XX%_XX.XX.XX 其中 X 代表任何字母数字字符。他们完全杂乱无章。
我想将 DataFrame 拆分为包含 BT_ 、EH_和 C_* 的不同 DataFrame(就像我在 bash 脚本中所做的那样)。
我按字母顺序对它们进行了排序,以便按顺序排列 BT_ 、 EH_和 C_* 。但是,我不知道如何自动查找第一个字符串来创建一个全新的 DataFrame。
目前我可以通过每次检查每组列的位置来手动执行此操作。
#Sorting the dataframe by alphabetical order
dataset = dataset.reindex(sorted(dataset.columns), axis=1)
#Splitting the dataframe
df1 = dataset.iloc[:, :72]
df2 = dataset.iloc[:, 72:148]
df3 = dataset.iloc[148, 148:]
我希望自动执行此操作,以避免检查 BT_* 列的完成位置以及 EH_* 或 C_* 的开始位置。
心有法竹
郎朗坤
相关分类