我正在尝试使用 python 中的雪花包创建一个熊猫数据框。
我运行一些查询
sf_cur = get_sf_connector()
sf_cur.execute("USE WAREHOUSE Warehouse;")
sf_cur.execute("""select Query"""
)
print('done')
输出大约为 21k 行。然后使用
df = pd.DataFrame(sf_cur.fetchall())
即使只有 100 行的限制样本,也需要永远。有没有办法优化这一点,理想情况下,更大的查询将在循环中运行,因此处理更大的数据集将是理想的。
繁星点点滴滴
相关分类