有没有一种简单的方法可以从文本文件读取行到这个漂亮的 soup lib python 脚本?

如何将 txt.file 中的行读入此脚本,而不必在脚本中列出 url?谢谢


from bs4 import BeautifulSoup

import requests


url = "http://www.url1.com"


response = requests.get(url)


data = response.text


soup = BeautifulSoup(data, 'html.parser')


categories = soup.find_all("a", {"class":'navlabellink nvoffset nnormal'})


for category in categories:

    print(url + "," + category.text)

我的 text.file 内容有换行符分隔符:


http://www.url1.com

http://www.url2.com

http://www.url3.com

http://www.url4.com

http://www.url5.com

http://www.url6.com

http://www.url7.com

http://www.url8.com

http://www.url9.com


千巷猫影
浏览 134回答 3
3回答

千万里不及你

要从中读取 URL a.txt,您可以使用此脚本:import requestsfrom bs4 import BeautifulSoupwith open('a.txt', 'r') as f_in:    for line in map(str.strip, f_in):        if not line:            continue        response = requests.get(line)        data = response.text        soup = BeautifulSoup(data, 'html.parser')        categories = soup.find_all("a", {"class":'navlabellink nvoffset nnormal'})        for category in categories:            print(url + "," + category.text)

郎朗坤

file1 = open('text.file', 'r') Lines = file1.readlines() count = 0# Strips the newline character for line in Lines:     print("Line{}: {}".format(count, line.strip())) 你只需用 url 变量替换你的行

不负相思意

为了这个例子,假设您的文件名为urls.txt. 在 Python 中,打开文件并读取其内容非常容易。with open('urls.txt', 'r') as f:    urls = f.read().splitlines()#Your list of URLs is now in the urls list!after只是告诉 Python 以'r'阅读'urls.txt'模式打开文件。如果您不需要修改文件,最好以只读模式打开它。f.read() 返回文件的全部内容,但它包含换行符 ( \n),因此splitlines()将删除这些字符并为您创建一个列表。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python