我正在制作一个简单的抓取程序。
首先,用户会写下 a 的名字footballer,然后我会创建一个链接到transfermarkt.com网络搜索,然后我想输入第一个链接并从足球运动员的个人资料中抓取数据。不幸的是,我对硒有疑问。如何以编程方式进入网站并从网站上抓取数据?
这是我的代码:
from urllib.request import urlopen
import bs4
from bs4 import BeautifulSoup
from selenium import webdriver
data = input('Enter name: ')
data = data.replace(" ", "+")
print(data)
link = 'https://www.transfermarkt.pl/schnellsuche/ergebnis/schnellsuche?query='
search = link + data + '&x=0&y=0'
print(search)
driver = webdriver.Chrome("/usr/lib/chromium-browser/chromedriver")
driver.find_element_by_css_selector('.spielprofil_tooltip tooltipstered').click()
name_box = soup.find('h1', attrs={'class': 'dataValue'})
print(name_box)
它只适用于 line print(search),但后来我迷路了。浏览器是打开的,但只有data:,在地址栏中。
慕哥9229398
慕田峪9158850
白衣染霜花
随时随地看视频慕课网APP
相关分类