使用正则表达式(Python)查找单词中所有可能的 5 个字母组合

我是 Python 和 Regex 的新手。这是我目前的问题,我还没有在网上找到任何直接的答案。我有一个包含 5 个或更多字符的字符串,为此我需要搜索 5 个字符的所有可能组合。


我想知道它是否适用于正则表达式(而不是创建一个包含所有可能的 5 个字符组合的列表,然后用我的字符串循环测试它们)。


例如,假设我的字符串是“stackoverflow”,我需要一个表达式,它可以给我一个包含 5 个连续字母的所有可能组合的列表,例如:['stack', 'tacko', ackov', ... ]. (但不是例如“stcko”或“wolfr”)。


这就是我要尝试的:


import re

word = "stackoverflow"

list = re.findall(r".....", word)

但是打印这个列表只会给出:


['stack', 'overfl']

这样看来一个位置只能匹配一次,5个字符的组合不能涉及已经匹配过的位置。


谁能帮助我更好地理解正则表达式在这种情况下的工作原理,以及我的需求是否可以直接使用正则表达式?


一只萌萌小番薯
浏览 333回答 3
3回答

慕慕森

如果字母总是连续的,这将起作用:wd = "stackoverflow" lst = ["".join(wd[i:i+5]) for i in range(len(wd)-4)]print(lst)输出['stack', 'tacko', 'ackov', 'ckove', 'kover', 'overf', 'verfl', 'erflo', 'rflow']

犯罪嫌疑人X

我想你可以只使用一个简单的循环和一个大小为 5 的滑动窗口word = "stackoverflow"result=[]for i in range(len(word)-5):    result.append(word[i:i+5])print(result)这是非常有效的,因为它在 O(n) 线性时间上运行

慕妹3242003

因为正如我在 findall 文档字符串中看到的那样,它返回所有非重叠匹配项:def findall(pattern, string, flags=0):    """Return a list of all non-overlapping matches in the string.    If one or more capturing groups are present in the pattern, return    a list of groups; this will be a list of tuples if the pattern    has more than one group.    Empty matches are included in the result."""    return _compile(pattern, flags).findall(string)查看主题中没有使用正则表达式的解决方案。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python