基于Python中的字符串从2个数据帧中减去数字

我绝对是初学者。在这里，我有两个数据透视表存储在同一个 Excel 文件的两个不同工作表中。

df1:

['1C', '1E', '1F', '1H', '1K', '1M', '1N', '1P', '1Q', '1R', '1S', '1U', '1W', '2C', '2E', '2F', '2H', '2K', '2M', '2P', '2S', '2U', '2W']

df2:

['1CA', '1CB', '1CC', '1CF', '1CJ', '1CS', '1CU', '1EA', '1EB', '1EC', '1EF', '1EJ', '1ES', '1FA', '1FB', '1FC', '1FF', '1FJ', '1FS', '1FT', '1FU', '1HA', '1HB', '1HC', '1HF', '1HJ', '1HS', '1HT', '1HU', '1KA', '1KB', '1KC', '1KF', '1KJ', '1KS', '1KU', '1MA', '1MB', '1MC', '1MF', '1MJ', '1MS', '1MU', '1NA', '1NB', '1NC', '1NF', '1NJ', '1PA', '1PB', '1PC', '1PF', '1PJ', '1PS', '1PT', '1PU', '1QA', '1QB', '1QC', '1QF', '1QJ', '1RA', '1RB', '1RC', '1RF', '1RJ', '1SA', '1SB', '1SC', '1SF', '1SJ', '1SS', '1ST', '1SU', '1UA', '1UB', '1UC', '1UF', '1UJ', '1US', '1UU', '1WA', '1WB', '1WC', '1WF', '1WJ', '1WS', '1WU', '2CA', '2CB', '2CC', '2CJ', '2CS', '2EA', '2EB', '2EJ', '2FA', '2FB', '2FC', '2FJ', '2FU', '2HB', '2HC', '2HF', '2HJ', '2HU', '2KA', '2KB', '2KC', '2KF', '2KJ', '2KU', '2MA', '2MB', '2MC', '2MF', '2MJ', '2MS', '2MT', '2PA', '2PB', '2PC', '2PF', '2PJ', '2PU', '2SA', '2SB', '2SC', '2SF', '2SJ', '2UA', '2UB', '2UJ', '2WB', '2WC', '2WF', '2WJ']

df2 是 df1 的子类别。

每个工作表都有一个数据透视表：

df1:[1 rows x 23 columns]

1C 1E 1F 1H 1K ... 2M 2P 2S 2U 2W

total 1057 334 3609 3762 1393 ... 328 1611 1426 87 118

df2:[1 rows x 137 columns]

1CA 1CB 1CC 1CF 1CJ 1CS ... 2UB 2UJ 2WB 2WC 2WF 2WJ

total 11 381 111 20 527 2 ... 47 34 79 2 1 36

我想减去F工作表 2中字符串结尾的值。例如：在工作表 2 中：1CF, 1EF, 1FF& 等从相应的字符串 ie 1C, 1E, 1F& 等等。

我的结果应该是这样的"1C= 1C-1CF= 1037"，它应该存储在一个新的工作表中（这里：工作表 3）。

我的 Python 代码：

#importing pandas

import pandas as pd

import numpy as np

from openpyxl import load_workbook

#Assigning the worksheet to file

file="Stratification_worksheet.xlsx"

#Loading the spreadsheet

data= pd.ExcelFile(file)

#sheetname

print(data.sheet_names)

#loading the sheetname to df1

df=data.parse("Auftrag")

print(df)

人到中年有点甜

浏览 129回答 1

1回答

呼如林

df2= df2.filter(regex=(".*F$"))  # Leave only 'F' columns in sheet2df2.columns = [i[:-1] for i in df2.columns]  # Remove 'F' in the end for column-wise subtractionresult = df1 - df2  # Substract valuesresult[result.isnull()] = sheet1  #leaves when there is no "F"

随时随地看视频慕课网APP