网络爬虫返回多个错误

因此，您正在抓取的 auto/models 端点存在一些奇怪的差异。例如，https ://www.citibanamexchubb.com/api/chubbnet/auto/models/7/8/2019返回：{  "TIPO": {    "ID": "381390223",    "DESC": "MINI COOPER"  }}虽然https://www.citibanamexchubb.com/api/chubbnet/auto/models/1/1/2019返回此：{  "TIPO": [    {      "ID": "364026215",      "DESC": "MDX"    },    {      "ID": "364026216",      "DESC": "RDX"    },    {      "ID": "364031544",      "DESC": "ILX"    },    {      "ID": "364031613",      "DESC": "TLX"    },    {      "ID": "364031674",      "DESC": "NSX"    }  ]}所以在第一个中，“TIPO”是一个字典，而在第二个中，“TIPO”是一个列表。我对您的脚本进行了修改，使其运行而不会引发任何错误。我敢肯定这不是你想要的，但它至少处理了这两种类型之间的差异：import requestsimport timeimport jsonsession = requests.Session()request_marcas = session.get('https://www.citibanamexchubb.com/api/chubbnet/auto/brands-subbrands')data = request_marcas.json()fileCSV = open("webscraper_test.csv", "a")fileCSV.write('Modelo' + ';' + 'ID_Marca' + ";" + 'ID_Submarca' + ";" + "ID_Tipo" + ";" + "Marca" +";"+ "Tipo"+ 'Descripcion' + "\n")for i in range(2019, 2020):        for marca in data['MARCA']:            for submarca in marca['SUBMARCAS']:                modelos = []                modelos.append('https://www.citibanamexchubb.com/api/chubbnet/auto/models/' + marca['ID'] + '/' + submarca['ID'] + '/' + str(i))                for link in modelos:                    json_link = []                    request_link = session.get(link).json()                    json_link.append(request_link)                    #print(request_link)                    # here's where I've made some changes:                    desc_detail = []                    if isinstance(request_link['TIPO'], dict):                        desc_detail.append(session.get(                            'https://www.citibanamexchubb.com/api/chubbnet/auto/descriptions/' + request_link['TIPO'][                                'ID'] + '/2018').json())                        print(request_link['TIPO']['DESC'])                    elif isinstance(request_link['TIPO'], list):                        for item in request_link['TIPO']:                            desc_detail.append(session.get('https://www.citibanamexchubb.com/api/chubbnet/auto/descriptions/' + item['ID'] + '/2018').json())                            print(item['DESC'])希望有帮助！

网络爬虫返回多个错误

1回答