如何从网络抓取输出创建整数值

我正在制作一个简单的抓取算法来提取产品的 GTIN。我能够抓取 html 并精确定位 GTIN 编号,但我想知道将其抓取为整数的最佳方法是什么。此外,我如何抓取像content=这样的内容并获取其指定的编号?


import requests

from bs4 import BeautifulSoup


testing_link = 'https://www.walmart.com/ip/Better-Homes-Gardens-Leighton-Nightstand-Rustic-Cherry-Finish/54445647'


URL = testing_link

page = requests.get(URL)


soup = BeautifulSoup(page.content, 'html.parser')


results = soup.find(itemprop='gtin13')


print(results.prettify())

当我运行这个时,我得到


<span content="0042666029322" itemprop="gtin13"></span>

我希望能够获得0042666029322作为整数供以后使用,有什么建议吗?


蛊毒传说
浏览 69回答 1
1回答

冉冉说

你不能这样做,前导零意味着 Python 中的八进制。您可以保存为字符串,然后将其转换为 int。>>> content = results.get('content')>>> print(content)0042666029322>>> print(int(content))42666029322
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python