猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
有没有童鞋遇到过同样的问题:xpath下怎么提取包含某个字符串的属性值
1.最近在爬取某个网站时,遇到了一个问题,怎么提取包含了某个字符串的属性值?2.大致内容是这样的:
白衣染霜花
浏览 315
回答 2
2回答
精慕HU
不知道题主用BeautifulSoup可不可以?类似这种。In[1]:frombs4importBeautifulSoupIn[2]:soup=BeautifulSoup("""...:...:...:""")In[3]:res_list=[]...:foriteminsoup.find_all("a"):...:if"thread"initem["href"]:...:res_list.append(item["href"])...:In[4]:res_listOut[4]:['thread-115861-1-1.html']
0
0
0
胡说叔叔
已经找到了答案,之前是自己没有了解语法,可以用xpath下的语法,用starts-with或者contains都可以。具体语法如下://a[starts-with(@href,"thread")]/@href//a[contains(@href,"thread")]/@href
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
JavaScript
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续