请帮我看看这段爬取怎么错了

请帮我看看这段爬取怎么错了

# coding=utf-8

def getHTMLlines(htmlpath):

f=open(htmlpath,"r",encoding="utf-8")

ls=f.readlines()

f.close()

return ls

def extractImageUrls(htmllist):

urls=[]

for line in htmllist:

if "img"in line:

url=line.split("src=")[-1].split('"')[1]

if "http"in url:

urls.append(url)

return urls

def showResults(urls):

count=0

for url in urls:

print("第{:2}个的URL:{}".format(count,url))

count +=1

def saveResults(filepath,urls):

f=open(filepath,"w")

for url in urls:

f.write(url+"\n")

f.close()

def main():

inputfile="F:/html/nationalgeographic.html"

outfile="F:/html/ues.txt"

htmlLines=getHTMLlines(inputfile)

imageUrls=extractImageUrls(htmlLines)

showResults(imageUrls)

saveResults(outputfile,imageUrls)

main()

慕仔8323353

浏览 1118回答 2

2回答

随时随地看视频慕课网APP

相关分类

爬虫: 爬虫抓取网页内容时，如何保证登陆状态？ 1 回答; 学习Python编程有哪些爬虫技术需要掌握？ 1 回答