我作为数据分析师从事数字营销工作。我的部门使用第三方来帮助吸引更多客户。这些第三方中的每一个都有一个网站,用于显示他们为我们公司带来了多少客户。我的部分工作是从每个网站收集数字并将它们放入报告中,这是一个漫长的手动过程。到目前为止,我已经成功登录了我们的一些第三方网站并提取了一些数据。但是,有一个网站我在登录时遇到了一些问题... https://inspire.flg360.co.uk/SignIn.php。我还需要将会话重定向到另一个 URL 以从中抓取数据。
我编写了一些代码,可以成功登录到我需要从中获取信息的其他网站。
import requests
from bs4 import BeautifulSoup
import re
username = 'username'
password = 'password'
scrape_url = 'https://portal.mvfglobal.com/index.php/dashboard'
login_url = 'https://portal.mvfglobal.com/index.php/login/login'
login_info = {'login_name': username, 'login_pass': password}
#Start session.
session = requests.session()
#Login using your authentication information.
session.post(url=login_url, data=login_info)
#Request page you want to scrape.
url = session.get(url=scrape_url)
soup = BeautifulSoup(url.content, 'html.parser')
print(soup)
但是,当我尝试使用相同的方法登录https://inspire.flg360.co.uk/SignIn.php 时,我遇到了一些问题。
import requests
from bs4 import BeautifulSoup
username = 'username'
password = 'password'
login_url = 'https://inspire.flg360.co.uk/SignIn.php'
login_info = {'strEmail': username, 'strPassword': password}
scrape_url = 'https://inspire.flg360.co.uk/AuthUser.php'
#Start session.
session = requests.session()
#Login using your authentication information.
session.post(url=login_url, data=login_info)
#Request page you want to scrape.
url = session.get(url=scrape_url)
soup = BeautifulSoup(url.content, 'html.parser')
print(soup)
当我检查页面元素时,我注意到 302 响应重定向到https://inspire.flg360.co.uk/AuthUser.php。但是,当我尝试使用上面的代码登录时,我仍然遇到错误。
我完全难倒任何想法?
SMILET
相关分类