我在div“td_module_5”中有一个标题为“.entry-title”的网站。
我写了一个通过jsoup“.entry-title”进行parcing的代码,但是这个“entry-title”包含在另一个div中,例如“td_mega_menu”。
doc = Jsoup.connect(blogUrl).get();
title = doc.select(".entry-title");
titleList.clear();
for (Element titles : title) {
titleList.add(titles.text());
}
} catch (IOException e) {
e.printStackTrace();
}
如何仅从div“td_module_5”中通过jsoup“.entry-title”进行parce?
示例 html 代码:
<div class="td_module_5 td_module_wrap td-animation-stack" >
<div class="td-module-image td-module-image-float">
<div class="td-module-thumb"><a class="td-admin-edit" href="https://unspecific.ru/wp-admin/post.php?post=7148&action=edit">edit</a><a href="https://unspecific.ru/bakteriofagi-smogut-vylechit-nyak-i-bk/" rel="bookmark" title="Бактериофаги смогут вылечить НЯК и БК?"><img width="260" height="195" class="entry-thumb" src="https://unspecific.ru/wp-content/uploads/2018/07/bacf-260x195.jpg" srcset="https://unspecific.ru/wp-content/uploads/2018/07/bacf-260x195.jpg 260w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-300x225.jpg 300w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-80x60.jpg 80w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-245x184.jpg 245w, https://unspecific.ru/wp-content/uploads/2018/07/bacf.jpg 640w" sizes="(max-width: 260px) 100vw, 260px" alt="Бактериофаг и бактерия" title="Бактериофаги смогут вылечить НЯК и БК?"/></a></div> </div>
<div class="td-item-details td-category-small">
<a href="https://unspecific.ru/category/news/" class="td-post-category">Новости в лечении ВЗК</a>
<h3 class="entry-title td-module-title"><a href="https://unspecific.ru/bakteriofagi-smogut-vylechit-nyak-i-bk/" rel="bookmark" title="Бактериофаги смогут вылечить НЯК и БК?">Бактериофаги смогут вылечить НЯК и БК?</a></h3>
相关分类