我的 URL 中有一个未编码的 URL。看起来像这样
https://myhost.mydomain.com/pnLVyL7HjrxMlxjBQkhcOMr2WUs=/400x400/https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png
我的域名可以是mydomain.com
或mydomain.io
. 此外,该/400x400/
部件实际上可能会有所不同并且相似,/blahblah/XxY/blahblah
或者可能完全缺失。图像可以是jpg, jpeg, png
我想提取最后的 URL 的第二部分
https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png
我有这样的正则表达式
https://myhost.mydomain.com/[a-zA-Z0-9=]*/.+[\/a-zA-Z0-9]?(/https://[a-zA-Z0-9=-]*.mydomain.(com|io)/images/[a-zA-Z0-9-]*.(png|jpg|jpeg))
这将其标识为 4 组
但是,我想将第二个 URL 作为一个组提取 - 所以整个https://myhost.mydomain.com/images/98f9a734-52e2-4616-adf7-bf0165bbf738.png
你能帮我修复我的正则表达式吗?谢谢 !
慕少森
隔江千里
海绵宝宝撒
相关分类