请帮我看看这段爬取怎么错了

# coding=utf-8

def getHTMLlines(htmlpath):

         f=open(htmlpath,"r",encoding="utf-8")

         ls=f.readlines()

         f.close()

         return ls

def extractImageUrls(htmllist):

         urls=[]

         for line in htmllist:

                  if "img"in line:

                           url=line.split("src=")[-1].split('"')[1]

                           if "http"in url:

                                    urls.append(url)

         return urls

def showResults(urls):

         count=0

         for url in urls:

                  print("第{:2}个的URL:{}".format(count,url))

                  count +=1

def saveResults(filepath,urls):

         f=open(filepath,"w")

         for url in urls:

                  f.write(url+"\n")

         f.close()

def main():

         inputfile="F:/html/nationalgeographic.html"

         outfile="F:/html/ues.txt"

         htmlLines=getHTMLlines(inputfile)

         imageUrls=extractImageUrls(htmlLines)

         showResults(imageUrls)

         saveResults(outputfile,imageUrls)

main()


慕仔8323353
浏览 1049回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP