我尝试创建一个程序来提取 Spotify 中 Daily Mix 1 中的所有歌曲。我知道我必须使用的逻辑,但我无法获得整个源代码。
这是我写的代码:
import requests
from bs4 import BeautifulSoup
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"}
result = requests.get("https://open.spotify.com/playlist/37i9dQZF1E38L6D2gtQHWw", headers=headers)
src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup.prettify())
这是我得到的输出:
我使用的标题适用于亚马逊和维基百科等其他网站,所以我认为这不是问题。我也不认为问题与 javascript 有关,因为在其他用于抓取网站(例如亚马逊(也包含很多<script>
标签))的程序中,代码显示得非常好。
请告诉问题是什么。
PS - 请不要在您的解决方案中推荐 selenium 或 scrapy。
隔江千里
相关分类