猿问

如何加载 HTML 的全部内容 - Jsoup

我试图使用 jsoup 下载 html 表格行,但它只解析部分 html 内容。我也尝试使用下面的代码来加载完整的 html 内容,但不起作用。任何建议将不胜感激。


public class AmfiDaily {

    public static void main(String[] args) {

        AmfiDaily amfiDaily = new AmfiDaily();


        amfiDaily.extractAmfiTable("https://www.amfiindia.com/intermediary/other-data/transaction-in-debt-and-money-market-securities");

    }


    public  void extractAmfiTable(String url){

        Document doc;


        try {

            FileWriter writer = new FileWriter("D:\\FTRACK\\Amfi Report " + java.time.LocalDate.now() + ".csv");

            Document document = Jsoup.connect(url)

                    .userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")

                    .maxBodySize(0)

                    .timeout(100000*5)

                    .get();


            Elements rows = document.select("tr");  


                 for (Element row : rows) {              


                Elements cells1 = row.select("td");                   


                for (Element cell : cells1) {


                    if (cell.text().contains(",")) {


                        writer.write(cell.text().concat(","));


                    }

                    else

                    {

                        writer.write(cell.text().concat(","));

                    }                       


                }                   


                writer.write("\n");                   

                 }

            writer.close();

        } catch (IOException e) {

            e.getStackTrace();

        }

    }

}


当年话下
浏览 119回答 1
1回答

牛魔王的故事

禁用 JavaScript 以准确查看 Jsoup 看到的内容。部分页面使用 AJAX 加载,因此 Jsoup 无法访问它。但是有一种简单的方法可以检查附加数据的来源。您可以使用浏览器调试器检查网络选项卡并查看请求和响应。
随时随地看视频慕课网APP

相关分类

Java
我要回答