如何通过jsoup对div中的特定元素进行解析?

我在div“td_module_5”中有一个标题为“.entry-title”的网站。


我写了一个通过jsoup“.entry-title”进行parcing的代码,但是这个“entry-title”包含在另一个div中,例如“td_mega_menu”。


doc = Jsoup.connect(blogUrl).get();

title = doc.select(".entry-title");

titleList.clear();

for (Element titles : title) {

titleList.add(titles.text());

}

} catch (IOException e) {

e.printStackTrace();

}

如何仅从div“td_module_5”中通过jsoup“.entry-title”进行parce?


示例 html 代码:


<div class="td_module_5 td_module_wrap td-animation-stack" >

            <div class="td-module-image td-module-image-float">

                <div class="td-module-thumb"><a class="td-admin-edit" href="https://unspecific.ru/wp-admin/post.php?post=7148&amp;action=edit">edit</a><a href="https://unspecific.ru/bakteriofagi-smogut-vylechit-nyak-i-bk/" rel="bookmark" title="Бактериофаги смогут вылечить НЯК и БК?"><img width="260" height="195" class="entry-thumb" src="https://unspecific.ru/wp-content/uploads/2018/07/bacf-260x195.jpg" srcset="https://unspecific.ru/wp-content/uploads/2018/07/bacf-260x195.jpg 260w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-300x225.jpg 300w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-80x60.jpg 80w, https://unspecific.ru/wp-content/uploads/2018/07/bacf-245x184.jpg 245w, https://unspecific.ru/wp-content/uploads/2018/07/bacf.jpg 640w" sizes="(max-width: 260px) 100vw, 260px" alt="Бактериофаг и бактерия" title="Бактериофаги смогут вылечить НЯК и БК?"/></a></div>            </div>


            <div class="td-item-details td-category-small">

                <a href="https://unspecific.ru/category/news/" class="td-post-category">Новости в лечении ВЗК</a>                

                <h3 class="entry-title td-module-title"><a href="https://unspecific.ru/bakteriofagi-smogut-vylechit-nyak-i-bk/" rel="bookmark" title="Бактериофаги смогут вылечить НЯК и БК?">Бактериофаги смогут вылечить НЯК и БК?</a></h3>



狐的传说
浏览 235回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java