用正则表达式确定字符串是否以数字结尾/是否包含'//'之间的数字

我正在尝试评估跳出率,为了做到这一点,我遍历了网址列表。我的问题是我有这样的字符串,例如:

  • www.example.com/43/test-1

  • www.example2.com/32/test-2

我无法找出一个正则表达式来测试字符串是否以这种格式结尾:

  • 斜杠号斜杠字符串-> /number/string

到目前为止,我设法得到的所有URL都带有斜线之间的数字:

[x["page"] for x in data if re.search(r'\d/+$', x["page"])]

就是这样


海绵宝宝撒
浏览 470回答 2
2回答

慕姐8265434

我认为您很亲近,只需要稍作修改即可:re.search(r'\d/[^/]+$', x["page"])这将匹配倒数第二个路径位置中带有数字的所有URL,最后一个位置中是一个或多个任何类型的字符。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python