空 dask 数据帧的 len 引发异常

我需要知道 dask 数据帧的长度,但如果我正在读取空文件 - 代码会产生异常:


import dask.dataframe as dd



if __name__ == '__main__':

    ddf = dd.read_csv(r'empty_file.csv', names=['x'])

    print(len(ddf))

结果我收到错误:


TypeError: 'numpy.float64' object cannot be interpreted as an integer

但是,如果文件不为空,上面的代码可以正常工作。


有没有更好的方法来获取 dask 数据帧的长度来处理文件为空的情况?


更新:


堆栈跟踪

https://img1.sycdn.imooc.com/652fd9de0001e7d216790366.jpg

慕桂英4014372
浏览 74回答 1
1回答

饮歌长啸

您可以使用.empty来验证您的数据框是否为空。像这样:import dask.dataframe as ddif __name__ == '__main__':    ddf = dd.read_csv(r'empty_file.csv', names=['x'])    if not ddf.empty:        print(len(ddf))    else:        print("Empty dataframe")
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python