我正在尝试使用 Python 和 Selenium 为 Linkedin 构建一个网络爬虫。我正在尝试打印标题,但输出仅显示一个空列表,我不知道为什么。我尝试打印列表中的所有元素并使用 items.text.replace() 替换常见输出,但是,输出仍然是所有元素。我也尝试过打印父 div,但输出仍然是一个空列表。
这是我写的代码:
#search
driver.find_element_by_xpath("//*[@id='ember16']/input").send_keys("Steve Jobs")
driver.find_element_by_xpath("//*[@id='ember16']/input").send_keys(Keys.RETURN)
driver.implicitly_wait(3)
#result count
resultCount = driver.find_element_by_xpath("//*[@id='ember64']/div/h3")
print("\n" + str(resultCount.text))
#printing
results = driver.find_elements_by_xpath('//*[@id="ember64"]/div/ul')
for items in results:
print(str(driver.find_elements_by_xpath('//*[@id="ember552"]/div/div[2]/p[1]'))+"\n")
这是输出:
About 43,000 results
[]
Process finished with exit code 0
无论如何,在迭代列表时是否可以指定要打印的元素?
编辑:这是此代码的最小可重现示例:
# search url
url = 'https://www.linkedin.com/search/results/people/?keywords=Steve%20Jobs&origin=GLOBAL_SEARCH_HEADER'
driver.get(url)
# print job title
results = driver.find_elements_by_xpath('//*[@id="ember64"]/div/ul')
for items in results:
print(driver.find_elements_by_xpath('//*[@id="ember552"]/div/div[2]/p[1]'))
这是输出:
[]
Process finished with exit code 0
狐的传说
相关分类