我正在尝试将抓取的数据转换为 pd 数据帧(表)。信息通过beautifulsoup从不同标签(a、span、div)中检索。对于soup_level1.find('ul', {'class':"fix3"}) 中的ul:
divjt=ul.find('div',{'class':"topb"})
a=divjt.find('a')
trajectory=a.text.strip()
divloc=ul.find('div',{'class':"under"})
d=divloc.find('div')
sp=ul.find('span',{'class':"blk"})
object=sp.text.strip()
try:
sas=ul.find_all('span',{'class':"f1"})
timex=sas[0].text
except IndexError:
timex=''
datalist.append[jobtitle,city,timex]
headers=['Traj', 'Object', 'Time']
A=[trajectory]
B=[object]
C=[timex]
datac=A+B+C
df = pd.DataFrame(datac)
print(df)
我现在得到的结果是
0
0 BRD - TWD
1 MER
2 11/10/2018
0
0 SFX - NYT
1 MER
2 10/05/2016
0
0 GER - BEN
1 MER
2 05/06/2016
我基本上想将这些结果“转储”在一个适当的数据帧表中,其中每一行都被打印出来以相应地表现出色。
0 BRD - TWD MER 11/10/2018
1 SFX - NYT MER 10/05/2016
2 GER - BEN MER 05/06/2016
谢谢!
慕尼黑5688855
心有法竹
相关分类