请查看下面的示例数据帧和我的代码。以下是我的逐步目标:步骤 1:将 A 列和 B 列合并到 Column_A_B步骤 2:计算“ColumnA_B”中值的每个实例步骤 3过滤掉“ColumnA_B”中只有 1 个值实例的行第 4 步:删除“状态”列中已取消的每一行,仅删除其中已取消的行 - ColumnA_B 中可能有一些具有相同值但“状态”值不同(请注意,第 3 步过滤器是正在应用)我在第 5 步之前的代码似乎有效,它只是第 5 步,我真的坚持 第 5 步:'Column_A_B' 的过滤器仍然打开(即过滤掉计数为 1)查看冗余值(所以当你计算 'Column_A_B_' 中的值时将是 2 或更大),然后对于所述分组计数查看“数量”列。如果该组的数量少于 16 且超过 99,则仅删除“QTY”为 16 的行。超过 99 不要删除任何东西。
当程序完成时,我希望上面的数据框看起来像什么(上面我命名为 keep.xlsx)应该是这样的:
import pandas as pd
goaldf = pd.DataFrame({'Column_A':['test1', 'test4', 'test6', 'test6', 'test7'],'Column_B':['WO1', 'WO6', 'WO6', 'WO6', 'WO7'],
'Column_A_B': ['test1W01','test4WO6','test6WO6','test6WO6', 'test7WO7'], 'Satus': ['Cancelled', 'Active', 'Open', 'Active', 'Active'],
'Qty': ['12', '3000', '14', '88', '1500']})
writer = pd.ExcelWriter('goaldf.xlsx', engine='xlsxwriter')
goaldf.to_excel(writer, sheet_name='Sheet1')
writer.save()
慕雪6442864
相关分类