从Python中的字符串中剥离HTML
from mechanize import Browserbr = Browser()br.open('http://somewebpage')html = br.response().readlines()for line in html: print line
在HTML文件中打印一行时,我试图找到一种方法只显示每个HTML元素的内容,而不是格式本身。如果它发现'<a href="whatever.com">some text</a>',它只会打印“一些文本”,'<b>hello</b>'打印“你好”等等。你会怎么做呢?
'<a href="whatever.com">some text</a>'
'<b>hello</b>'
手掌心
动漫人物
相关问题
相关分类