我想从如下内容中提取url:
{"code": 0, "data": {"cdnFileUrl": "http://download.example.com.cn/download/product/mi/rules/example_url_201902123.pkg", "code": 0, "message": "success", "packageVersion": "20190219141705"}, "message": "success"}
使用如下命令可以得到正确结果:
cat info1.txt | grep -Po '"cdnFileUrl": "[0-9a-zA-Z/-:._]+"' | awk -F'"' '{ print $(NF-1) }'
http://download.example.com.cn/download/product/mi/rules/example_url_201902123.pkg
可是现在对接的部门更改了连接形式,在链接中加了个问号,我搜了下问号应该要特殊处理,但是不知道如何搞,更改后的信息如下:
{"code": 0, "data": {"cdnFileUrl": "http://download.example.com.cn/download/product/mi/rules/example_url_201902123.pkg?secret3u4o3dbhj", "code": 0, "message": "success", "packageVersion": "20190219141705"}, "message": "success"}
那么如何提取出来
http://download.example.com.cn/download/product/mi/rules/example_url_201902123.pkg?secret3u4o3dbhj
12345678_0001
相关分类