如何替换数据框 python 中的所有单词

我正在尝试将 AGL 账单转换为数据框,以便我可以将所需的值放入 Excel 电子表格中。

我一直试图.replace()在行中没有任何字符,以便只留下数字(试图删除数据框中的所有单词)。另一个问题是每个单元格中有多个单词和数字。

http://img3.mukewang.com/61b16c1f0001be2106210362.jpg

from tabula import read_pdf

import openpyxl

from openpyxl import load_workbook

import pandas as pd

import numpy as np


df1 = tabula.read_pdf('C:/Users/Blake/Desktop/Python/AGL_Bill.pdf',guess=False, pages=2)

df1.columns = ['Description', 'Blank', 'Values']





df1.drop(labels=None, axis=None, index=[0,1,3,4,7,8,25,26,19,15,16,20,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62], columns=None, level=None, inplace=True, errors='raise')

df1.drop(labels=None, axis=1, columns=['Values'], level=None, inplace=True, errors='raise')






df1['Description'].str.replace('kWh', '')




print (df1)


df1.to_csv('Tableone.csv', encoding='utf-8')



wb2 = load_workbook('C:/Users/Blake/Desktop/ETemplate.xlsx')



wb2.create_sheet('DATA')

wb2.save('C:/Users/Blake/Desktop/Template.xlsx')`


海绵宝宝撒
浏览 179回答 1
1回答

米脂

如果您试图用空替换字符 - 然后使用数字,每个单元格的 RegEx - 将它们连接在一起。进口重新import pandas as pddata={'1':'Some dumb data $200.22 for me','2':'Some more really dumb data $5.23'}df=pd.DataFrame.from_dict(data,orient='index')df.columns=['Data']def Num_Only(val):    return ' '.join(re.findall('[\d\.]+',val))df['New']=''df.New=df.Data.apply(lambda x: Num_Only(x))Which should output a new Dataframe ... like this输出现在是......我已经删除了 $ 因为它没有任何用处。1.   Some dumb data $200.22 for me  200.222   Some more really dumb data $5.23    5.23希望能让你继续前进
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python