如何从字符串中过滤出特定的字符串

Python初学者在这里。我为我正在编写的机器人而陷入了这段代码的一部分。


我正在使用Praw制作reddit机器人来梳理帖子,并删除了一组特定的字符(蒸汽CD键)。


我在这里发布了测试文章:https : //www.reddit.com/r/pythonforengineers/comments/91m4l0/testing_my_reddit_scraping_bot/


这应该具有所有密钥格式。


目前,我的机器人可以使用正则表达式来查找帖子。我有这些变量:


steamKey15 = (r'\w\w\w\w\w.\w\w\w\w\w.\w\w\w\w\w')

steamKey25 = (r'\w\w\w\w\w.\w\w\w\w\w.\w\w\w\w\w.\w\w\w\w\w.\w\w\w\w\w.')

steamKey17 = (r'\w\w\w\w\w\w\w\w\w\w\w\w\w\w\w\s\w\w')

我正在查找使用此文本:


subreddit = reddit.subreddit('pythonforengineers')

for submission in subreddit.new(limit=20):


    if submission.id not in steamKeyPostID:        

        if re.search(steamKey15, submission.selftext, re.IGNORECASE):

            searchLogic()

            saveSteamKey()

因此,这只是表明我应该在过滤器函数中使用的东西是steamKey15 / 25/17和submitt.selftext的组合。


所以这是我感到困惑的部分。我找不到能正常工作或正在执行我想要的功能的函数。我的目标是从Submit.selftext(帖子的正文)中删除所有文本,但保留密钥,这些密钥最终将保存在.txt文件中。


有什么建议可以解决这个问题吗?我已经研究过re.sub和.translate,但是我不明白这些部分是如何组合在一起的。


我正在使用Python 3.7(如果有帮助)。


慕的地8271018
浏览 257回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python