使用 Python 和正则表达式从字符串中提取子字符串

3回答

呼唤远方

您可以使用提取 URL 中的查询字符串urllib.parse.urlparse，然后使用解析它urllib.parse.parse_qs：>>> from urllib.parse import urlparse, parse_qs>>> path = '/ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=0'>>> query_string = urlparse(path).query  >>> parse_qs(query){'search_query': ['example one'], 'y': ['0'], 'x': ['0']}编辑：query_string从Page列中的所有页面中提取：dataframe['Page'] = dataframe['Page'].apply(lambda page: parse_qs(urlparse(page).query)['search_query'][0])

狐的传说

你可以试试这个(?<=&).*?(?=&)解释(?<=&)- 积极的回顾。匹配&。(.*?)- 匹配除换行符以外的任何内容。（懒人方法）。(?=&)- 正向前瞻匹配&。

陪伴而非守候

快速高效的熊猫方法。示例数据：temp,page1,  /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=02,  /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=03,  /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=0代码：df = example.data # from abovedf["query"] = df['page'].str.split("&", expand=True)[1].str.split("=", expand=True)[1]print(df)示例输出：   temp  \0  1          1  2          2  3                                                                                                                    page  \0    /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=0   1    /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=0   2    /ex/search/!tu/p/z1/zVJdb4IwFP0r88HH0Sp-hK/dz/d5/L2dBISEvZ0FBIS9nQSEh/?s&search_query=example one&y=0&x=0            query  0  example one  1  example one  2  example one  如果您想根据 key=value 对标记您的列，那将是不同的提取后记。