不要着急唉,慢慢往后看着急敲代码完成,根本不需要课件代码哦
没有吧,都是视频直播的呀
CTRL+F 吧
使用find_all() 方法,用一个class名就可以了
PyCharm,下载https://www.jetbrains.com/pycharm/download/#section=windows
from bs4 import BeautifulSoup html_doc = '<ul class=country><li>Area<li>Population</ul>' #soup = BeautifulSoup(html_doc, 'html.parser') soup = BeautifulSoup(html_doc, 'lxml') print (soup.prettify()) 这样就可以了,区别一下HTML与lxml解析器
soup..find_all(class_='a'),class后面跟上一个下划线_就可以了
You are trying to run the Python 2 version of Beautiful Soup under Python 3
你在尝试用版本2运行版本3下的Beautiful Soup。
试试 python3+回车键进入python的编辑环境。直接用python+回车,会搜索path变量最先找到的可执行文件,如果你python2的环境变量在3前面,python+回车进入的是2的环境。
原本我也是遇到这个问题搜索全网发现就这么一个帖子相关-。-
其实程序输出没错,是理解错误的原因。
BS4解析HTML文件,就很直接的,看到<p>这个标签符合条件,返回值为True,打印出来的就是<p>标签里的内容呀,只是恰好包含了几个<a>标签,因为这些<a>标签是<p>标签的子节点呀。
而并没有单独地把<a>标签打印出来就说明程序的输出是没问题的。
这应该是你没有安装 BeautifulSoup4的缘故
他就是方便从网页中提取数据的,只要会用基本的用法就可以了。
如果以后真的有什么特殊的需求,可以去网上搜一下就行了,Python不需要把每个库的所有东西都学完,只需要在用到的时候查一下资料就可以了,也不需要去了解它内部的实现。Python开发的特点就是快,简单。如果前期花费大量的时间去学习这些库所有的东西,实际上很多都用不到,有的可能用一次就不再用了,所以没有必要花太大的信息去把一个库所有的东西研究一遍。
17行修改成 soup = bs(html_doc) 试一下还会报错吗