我写的这段代码有很多情况都未考虑到,希望各位提出比较全面的方法:
import re
reg = r'^https?:\/\/([a-z0-9\-\.]+)[\/\?]?'
url = 'http://segmentfault.com/blog/biu/1190000000330941'
m = re.match(reg, url)
uri = m.groups()[0] if m else ''
print uri[uri.rfind('.', 0, uri.rfind('.')) + 1:]
# 输出结果:segmentfault.com
相关分类