我在“页面”列中有一个包含很长字符串的熊猫数据框,我试图从中提取子字符串:
示例字符串: /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s& search_query=示例一&y=0&x=0
使用正则表达式,我很难确定如何提取两个&符号之间的字符串并删除较大字符串的所有其他字符部分。
到目前为止,我的代码如下所示:
import pandas as pd
import re
dataset = pd.read_excel(r'C:\Users\example.xlsx')
dataframe = pd.DataFrame(dataset)
dataframe['Page'] = format = re.search(r'&(.*)&',str(dataframe['Page']))
dataframe.to_excel(r'C\Users\output.xlsx)
上面的代码运行但不会向我的新电子表格输出任何内容。
呼唤远方
狐的传说
陪伴而非守候
相关分类