News Scraper 总是得到第二篇最新文章而不是最新文章

我制作了一个新闻抓取工具,它获取名为“Phoronix”的网站的 RSS 提要并将其保存在文本文件中。但由于某种原因,它获得了第二篇最新文章而不是最新文章。


这是代码:


import feedparser

import time


def Log():

    f = open("Logs/phoronixdb.txt", "a")

    f.write("\n")

    f.write("\n" + entry.published)

    f.write("\n")

    f.write("\n" + entry.title)

    f.write("\n")

    f.write("\n" + entry.summary)

    f.write("\n")

    f.write("\n" + entry.link)

    f.close()


def CheckDate():

    f2 = open("db/phoronixlastdate.txt", "r")

    date = f2.read()

    if date == entry.published:

        f2.close()

    else:

        Log()

        f2.close()

        f2 = open("db/phoronixlastdate.txt", "w")

        f2.write(entry.published)

        f2.close()


while True:

    NewsFeed = feedparser.parse("https://www.phoronix.com/rss.php")

    entry = NewsFeed.entries[1]

    CheckDate()

    time.sleep(5)


慕尼黑5688855
浏览 138回答 1
1回答

墨色风雨

我的猜测是这个entry = NewsFeed.entries[1]应该entry = NewsFeed.entries[0]这是因为我相信这些条目将文章列表作为数组返回,其中起始索引(0)对应于第一篇文章,依此类推。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python