猿问
回到首页
个人中心
反馈问题
注册登录
下载APP
首页
课程
实战
体系课
手记
专栏
慕课教程
Pyarrow 数据集读取特定列和特定行
有没有办法使用 pyarrow parquet 数据集来读取特定的列,如果可能的话过滤数据而不是将整个文件读入数据框?
白猪掌柜的
浏览 258
回答 1
1回答
慕桂英546537
截至目前pyarrow==2.0.0,这至少是可能的pyarrow.parquet.ParquetDataset。要读取特定的列,它的read和read_pandas方法有一个columns选项。您也可以使用pandas.read_parquet.要读取特定行,它的__init__方法有一个filters选项。
0
0
0
打开App,查看更多内容
随时随地看视频
慕课网APP
相关分类
Python
继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续