在 _get_new_urls方法中,links = soup.find_all('a',href=re.compile(r"/item/*?"))中的links为列表,new_url = link['href']但是却可以这样赋值,这是什么原因
贴上代码:
def _get_new_urls(self,page_url,soup):
new_urls = set()
links = soup.find_all('a',href=re.compile(r"/item/*?")) #返回一个list
for link in links:
new_url = link['href']
new_full_url = urllib.parse.urljoin(page_url,new_url)
new_urls.add(new_full_url)
return new_urls
产品经理不是经理
相关分类