如何在多个字符串中查找与列表中的项目匹配的项目

我正在尝试为海盗湾电影 RSS 提要制作一个过滤器,它过滤掉我已经获得的电影并保留我目前没有的电影。稍后它将从提供的磁力链接下载 torrent。问题是我不知道如何从我没有的电影中过滤掉我拥有的电影,因为我试图从一个字符串中过滤一个列表,但不知道如何绕过它。这是一个可运行的示例,其中包含我想在注释中添加的代码:


import feedparser

import ssl


if hasattr(ssl, '_create_unverified_context'):

    ssl._create_default_https_context = ssl._create_unverified_context

feed = feedparser.parse('https://thepiratebay.org/rss/top100/207')

feed_title = feed['feed']['title']

feed_entries = feed.entries

f = open("movies.txt", "r+")

fr = f.readlines()

print(fr)

for entry in feed.entries[:25]:

    el = entry.title.lower()

    # if fr in el:

        # remove_from_titles()

    # else:

    article_title = el

    article_link = entry.link

    print(article_title)

    print(article_link)

电影.txt文件:


aquaman

spiderman


慕工程0101907
浏览 196回答 2
2回答

qq_遁去的一_1

尝试使用 set 而不是 list。如果提要集为A且文件标题为B,则 A 中不在 B 中的标题为A.difference(B)

慕斯王

您可以尝试以下操作:with open("movies.txt", "r+") as f:    fr = f.readlines()if article_title.lower() not in movies_list:    print(article_title)    # do your downloading stuff here    # update your movies.txt file    with open("movies.txt", "a") as f:        f.write('\n' + 'article_title')
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python