我正在使用 Python 学习正则表达式,我想准备一个 RE 来匹配和收集以下输入中的句子:
食品:蛋糕:由面粉、糖和其他成分制成的烘焙甜食品。
电子设备:计算机:执行计算机编程操作的机器。
计算机主要由CPU、显示器、键盘和鼠标组成。汽车:汽车:汽车是用于运输的四轮机动车辆。
我的预期输出应该为我提供类别、项目和该项目的描述。因此,对于第一项“蛋糕”,RE 应将“食品”、“蛋糕”、“由面粉、糖和其他成分制成的烘焙甜食”分组。
我当前的 RE 看起来像这样:
[0-9]+\s*.\s*(\w*)\s*:\s*(\w*)\s*:\s*(.*)
这似乎适用于具有没有换行符的描述的项目。如果它有换行符,即示例中的“计算机”,则 RE 只匹配其到换行符的描述。RE 丢弃该描述中的第二句话。
请帮助我理解我在这里错过了什么。
大话西游666
慕少森
相关分类