我需要从网页中嵌入的 Javascript 中解析一些值。我试图用这样的东西标记 HTML,但它没有标记 Javascript 部分。
func CheckSitegroup(httpBody io.Reader) []string {
sitegroups := make([]string, 0)
page := html.NewTokenizer(httpBody)
for {
tokenType := page.Next()
fmt.Println("TokenType:", tokenType)
// check if HTML file has ended
if tokenType == html.ErrorToken {
return sitegroups
}
token := page.Token()
fmt.Println("Token:", token)
if tokenType == html.StartTagToken && token.DataAtom.String() == "script" {
for _, attr := range token.Attr {
fmt.Println("ATTR.KEY:", attr.Key)
sitegroups = append(sitegroups, attr.Val)
}
}
}
}
HTML 正文中的脚本如下所示,我需要广告系列编号(如果没有编号或根本没有 test.campaign =,则为 nil / "" - 站点组也是如此)。有没有简单的方法来获取信息?我想过正则表达式,但也许还有别的东西?从未使用过正则表达式。
<script type="text/javascript" >
var test = {};
test.campaign = "8d26113ba";
test.isTest = "false";
test.sitegroup = "Homepage";
</script>
饮歌长啸
相关分类