我有以下格式的以下文本,但我想要的是从找到的 12 位数字的开头选择和分组单词,并在下一个 12 位数字的开头停止,这些数字也应该组合在一起。
例如,在我下面的文本中,应将以下内容组合在一起:
011111111111 CDGH, LGF ADF : 203 HYT LOREM IPSUM / LOREM IPSUM县 : GTYH CHIDGER L. IPSUM THJ. 日期:07/21/2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM,67TH LOREM IPSUM IPSUM。DTEA: NIGER, GA 12345 LOREM IPSUM DOLOT 97 LOREM IPSUM
DOLOT, KY 35678-8765
并且
0222222222222 CDGH, LGF ADF : 203 HYT LOREM IPSUM / LOREM IPSUM县 : GTYH johjk L. IPSUM THJ. 日期:07/21/2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM,67TH LOREM IPSUM IPSUM。DTEA: NIGER, GA 12345 LOREM IPSUM DOLOT 97 LOREM IPSUM
DOLOT, KY 35678-8765
这是整个文档的样本
LOREM IPSUM LOR IPSUM DDDDDDDDD FG SSSSS 编号
106/03/2019 LOREMFG GH LOREMIPSUMF
LOREM OPFRTE ERTIO
LOREMIPS LOREMIOS 05/30/2019 DERTE TH LOREM (LWA LTD)-- -------------------------------------------------- -------------------------------------------------- ---------------011111111111 CDGH, LGF ADF : 203 HYT LOREM IPSUM / LOREM IPSUM县 : GTYH CHIDGER L. IPSUM THJ. 日期:07/21/2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM,67TH LOREM IPSUM IPSUM。DTEA: NIGER
, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765 0222222222222 CDGH, LGF ADF : 203 HYT LOREM IPSUM / LOREM IPSUM县 : GTYH johjk L. IPSUM THJ. 日期:07/21/2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM,67TH LOREM IPSUM IPSUM。DTEA: NIGER
, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765 011111111111
CDGH, LGF ADF : 203 HYT LOREM IPSUM / LOREM IPSUM THUM COUNTY 日期:07/21/2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM,67TH LOREM IPSUM IPSUM。DTEA: NIGER
, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765
我写的代码只选择了 12 位数字和空格,但忽略了它们之间的文本。链接到我为此目的编写的 regex101
(\b\d{12}\s*\b[A-Za-z0-9_.]*+\s+)
慕斯王
相关分类