提取 HTML 并在 Python 中搜索

我仍然是 python 的初学者,我正在试验。


我正在寻找一种方法来请求一个 url 并获取网页的数据,这样该页面就不需要打开了。


获得数据后,我需要在数据中搜索标签,例如,如果它在请求的主页某处有“hello”。


这是一个例子:


import urllib.request

fp = urllib.request.urlopen("http://www.python.org")

mybytes = fp.read()


mystr = mybytes.decode("utf8")

fp.close()


x = mystr.find('testing word tag');


print(x)

请耐心等待,因为我还是个菜鸟,找不到我要找的例子。


^ 在这里找到了这段代码,但它似乎无法找到一个字符串。


任何人都知道最好的方法吗?


感谢你们 :)


一只名叫tom的猫
浏览 139回答 2
2回答

慕尼黑8549860

以下是这类工作最常用的库:$ pip install requests bs4在您最喜欢的 IDE 中:import requestsfrom bs4 import BeautifulSoupr = requests.get("http://www.python.org")soup = BeautifulSoup(r.content, "html.parser")sometag = soup.find("sometag")print(sometag)

aluckdog

尝试这个。import requestsurl = "https://stackoverflow.com/questions/63577634/extract-html-and-search-in-python"res = requests.get(url)print(res.text)

精慕HU

另一种方法。from simplified_scrapy import SimplifiedDoc,reqhtml = req.get('https://www.python.org')doc = SimplifiedDoc(html)title = doc.getElement('title').textprint (title)title = doc.getElementByText('Welcome to', tag='title').textprint (title)结果:Welcome to Python.orgWelcome to Python.org
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python