java网页抓取提取网页部分信息

仔细查看该页面的HTML代码，你就会发现货件托运历史记录被保存在一个叫 detailInfoObject 的JavaScript对象中，所以不需要特殊的HTML解析器，使用正则即可截取到这个对象，然后用jackson这样的JSON解析器即可反解析到Bean。解析HTML代码一定要观察代码的构成，才能有效的解析出你要的信息。var detailInfoObject = {"shipDate":"Jun 16, 2012","emailResults":false,"scans":[{"scanStatus":"已送达","scanLocation":"CANADA, ON","scanTime":"11:36 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"货件已装车，派送途中","scanLocation":"MISSISSAUGA, ON","scanTime":"9:30 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"位于当地的FedEx工作地点","scanLocation":"MISSISSAUGA, ON","scanTime":"8:44 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"国际货物放行 - 进口","scanLocation":"MISSISSAUGA, ON","scanTime":"6:35 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"位于目的地分拣中心","scanLocation":"MISSISSAUGA, ON","scanTime":"5:27 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"正在运输","scanLocation":"INDIANAPOLIS, IN","scanTime":"3:55 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"离开联邦快递工作地点","scanLocation":"INDIANAPOLIS, IN","scanTime":"3:32 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"到达联邦快递工作地点","scanLocation":"INDIANAPOLIS, IN","scanTime":"2:00 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 19, 2012"},{"scanStatus":"离开联邦快递工作地点","scanLocation":"ANCHORAGE, AK","scanTime":"4:15 PM","GMTOffset":"-08:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"到达联邦快递工作地点","scanLocation":"ANCHORAGE, AK","scanTime":"12:06 PM","GMTOffset":"-08:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"正在运输","scanLocation":"NARITA-SHI JP","scanTime":"10:38 PM","GMTOffset":"+09:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"清关延误 - 进口","scanLocation":"MISSISSAUGA, ON","scanTime":"4:16 AM","GMTOffset":"-04:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"正在运输","scanLocation":"SHANGHAI CN","scanTime":"4:58 AM","GMTOffset":"+08:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"正在运输","scanLocation":"SHANGHAI CN","scanTime":"12:06 AM","GMTOffset":"+08:00","showReturnToShipper":false,"scanDate":"Jun 18, 2012"},{"scanStatus":"国际货物放行 - 出口","scanLocation":"SHANGHAI CN","scanTime":"11:40 PM","GMTOffset":"+08:00","showReturnToShipper":false,"scanDate":"Jun 17, 2012"},{"scanStatus":"已离开发件地FedEx站点","scanLocation":"SHANGHAI CN","scanTime":"4:40 PM","GMTOffset":"+08:00","showReturnToShipper":false,"scanDate":"Jun 16, 2012"},{"scanStatus":"已取件","scanComments":"在FedEx截件时间之后才收到包裹","scanLocation":"SHANGHAI CN","scanTime":"3:34 PM","GMTOffset":"+08:00","showReturnToShipper":false,"scanDate":"Jun 16, 2012"},{"scanStatus":"托运资讯发送给FedEx ","scanTime":"12:40 AM","GMTOffset":"-05:00","showReturnToShipper":false,"scanDate":"Jun 16, 2012"}],......

java网页抓取 提取网页部分信息

3回答

java网页抓取提取网页部分信息