我在网络爬虫/抓取方面的知识非常有限,并且正在尝试为此创建一个网络爬虫URL。但是,当我尝试从服务器通常打印响应文本时,我得到了这个:
<html><body><h1>400 Bad request</h1>
Your browser sent an invalid request.
</body></html>
我认为代码没有任何问题,因为它可以在我尝试过的其他网站上运行。希望这里的好人能帮我解决这个问题。这只是一种预感,但这是否是由 url 不以 a 结尾引起的.xml?
import requests
url = 'https://phys.org/rss-feed/'
res = requests.get(url)
print(res.text[:500])
慕村9548890
相关分类