猿问

Python逐行读取txt中的url文件并进行爬虫

毕设项目需要爬取coursera的课程数据,已经把所有课程的url链接爬下来了,存在了txt中,一行是一个课程的url,现在想要获取每门课程的详细信息,如instructor,syllabus 和detail information这几项,但是都需要点进各个课程的网页链接中取爬取。码渣求大神指导一下,来段伪码就更好啦!thx

鸿蒙传说
浏览 2763回答 1
1回答

月关宝盒

你好!不知道这是不是你想要的答案:f = open("coursera.txt","r")urlList = f.readlines()for url in urlList:&nbsp; &nbsp; r = requests.get(url)&nbsp; &nbsp; ''''''Good Luck ! ^_<
随时随地看视频慕课网APP

相关分类

Java
我要回答