继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

Huginn监测网页变化并推送

全栈测试之路
关注TA
已关注
手记 19
粉丝 1
获赞 3

以图灵社区每周特价页面为例: https://www.ituring.com.cn/tag/36527

抓取内容

这个页面每周一都会更新三个半价电子书,先分析页面xpath,找出规律.
image.png

复制后粘贴,可以看到三本书的xpath分别是:

//*[@id="tag-book"]/div/ul/li[1]/div[2]/h4/a

//*[@id="tag-book"]/div/ul/li[2]/div[2]/h4/a

//*[@id="tag-book"]/div/ul/li[3]/div[2]/h4/a

只有中间的li[]内容不一样.

因此options部分,xpath部分可以用li[*]匹配所有情况.可以这样写:

{
  "expected_update_period_in_days": "2",
  "url": "https://www.ituring.com.cn/tag/36527",
  "type": "html",
  "mode": "on_change",
  "extract": {
    "url": {
      "xpath": "//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a",
      "value": "@href"
    },
    "title": {
      "xpath": "//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a",
      "value": "@title"
    }
  }
}

推送内容

使用slack agent推送.
options部分:

{
  "webhook_url": "https://hooks.slack.com/services/xxxx/xxxxxxxx",
  "channel": "#book",
  "username": "Huginn",
  "message": "{{title}}    https://www.ituring.com.cn{{url}}",
  "icon": ""
}

效果

image.png

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP