Python urllib2.Request 标题响应对于 instagram 不可读

我在下面有这个代码:


def check_proxy(input_queue):

    while 1:

        prx = input_queue.get()

        try:

            proxy_handler = urllib2.ProxyHandler({'http': prx})

            opener = urllib2.build_opener(proxy_handler)

            opener.addheaders = [('User-agent', 'Mozilla/5.0')]

            urllib2.install_opener(opener)

            req = urllib2.Request("http://www.google.com")

            sock = urllib2.urlopen(req, timeout=7)

            rs = sock.read(1000)

            if '<title>Google</title>' in rs:

                print '[OK]', prx

                input_queue.task_done()

我已将检查 Google.com 更改为 instagram.com


我把标题改成了 Instagram


但由于某种原因它不起作用。


我已经检查了 Instagram 的“打印 rs”。并得到了这个标题:


        <title>

Instagram

</title>

只是想知道如何检查https://www.instagram.com而不是 google.com


谢谢


Qyouu
浏览 133回答 1
1回答

翻阅古今

与 Instagram 的 HTML 中的标题匹配的字符串应该是'<title>\nInstagram\n<title>.&nbsp;Google 的 HTML 中没有换行符,但 Instagram 有。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python