result = df['sentence'].apply(lambda x: regex.compile('(keyword){e<4}').findall(x)) #slow
非常感谢你。
至尊宝的传说
浏览 156回答 1
1回答
胡说叔叔
您为什么在应用内部进行编译?这实际上违背了它的目的。另外,加快apply通话速度的最佳方法是不使用apply。在没有上下文与您实际尝试匹配的内容相关的情况下,我向您介绍:p = regex.compile('(keyword){e<4}')result = [p.findall(x) for x in df['sentence']]我的测试表明,基于列表理解的正则表达式匹配str在性能方面取代了方法。好吧,花点儿力气,因为它总是取决于您的数据和您要匹配的内容。re.search如果您只想要一个匹配项(以提高性能),则可能要考虑使用而不是findall。