我在使用BeautifulSoup4时遇到问题...(我是一名Python / BeautifulSoup新手,如果我很笨,请原谅我)
为什么执行以下代码:
from bs4 import BeautifulSoup
soup_ko = BeautifulSoup('<select><option>foo</option><option>bar & baz</option><option>qux</option></select>')
soup_ok = BeautifulSoup('<select><option>foo</option><option>bar and baz</option><option>qux</option></select>')
print soup_ko.find_all('option')
print soup_ok.find_all('option')
产生以下输出:
[<option>foo</option>, <option>bar & baz</option>]
[<option>foo</option>, <option>bar and baz</option>, <option>qux</option>]
我期望得到相同的结果,包含3个选项的数组...但是BeautifulSoup似乎不喜欢文本中的&符?如何在不编辑HTML(或通过转换/转换)的情况下摆脱它并获得正确的数组?
当年话下
冉冉说
慕码人2483693
相关分类