如何在python中使用正则表达式提取字符串旁边的单词

9.DATUM DER ERTEILUNG DER ZULASSUNG/VERLÄNGERUNG DER ZULASSUNG

10.STAND DER INFORMATION

Juni 2019

Rezeptpflicht/Apothekenpflicht

Rezept- und apothekenpflichtig, wiederholte Abgabe verboten.

这是我的文本,我正在尝试提取总是在之后的日期。 在上面的示例文本中。STAND DER INFORMATIONJuni 2019


我已经尝试了字符串拆分方法,但这对我不起作用,因为我只需要日期。


慕虎7371278
浏览 97回答 1
1回答

泛舟湖上清波郎朗

如果您的文本在日期之前有 STAND DER 信息,如图所示,您可以使用以下内容。法典import rere.findall(r'(?<=STAND DER INFORMATION\s)\D{3,4}\s\d{4}', s, re.MULTILINE)解释# s is text string# <=STAND DER INFORMATION\n - look behind for STAND DER INFORMATION followed by \n# \D is non-digit (so 3 or 4 non-digits)# \d digits (so four digit date)# re.MULTILINE - multiline flag to allow matches across multiple lines测试s = """9.DATUM DER ERTEILUNG DER ZULASSUNG/VERLÄNGERUNG DER ZULASSUNG10.STAND DER INFORMATIONJuni 2019Rezeptpflicht/ApothekenpflichtRezept- und apothekenpflichtig, wiederholte Abgabe verboten."""dates = re.findall(r'(?<=STAND DER INFORMATION\n)\D{3,4}\s\d{4}', s, re.MULTILINE)print(dates)输出['Juni 2019']
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python