for link in links:
if('href'in dict(link.attrs)):
url = urljoin(page,link['href'])
if url.find("'")!=-1:continue #就是这就话,为什么要找"'"?
url=url.split('#')[0]
if url[0:4]=='http' and not self.isindexed(url):
ewpages.add(url)
LinkText=self.gettextonly(link)
self.addlinkref(page,url,LinkText) <span></span>
还是这段话,下面这段话
if('href'in dict(link.attrs))
这里面
dict
的作用是什么,没有dict会怎么样?
阿晨1998
繁星淼淼