具有 2 种不同数据类型的结构化 numpy 数组

我将 csv 文件导入到 numpy 数组中,需要将其转换为结构化数组,其中仅第一列作为 dtype 字符串,所有其他 47 列作为 float。如何在单个操作中定义其他 47 列的数据类型?我是否必须逐列指定 dtype?



千巷猫影
浏览 80回答 1
1回答

繁华开满天机

您可以像结构化数组一样读取源文件。假设您输入的文件包含:一个字符串字段,命名为Id,只有四个&nbsp;浮点字段,分别命名为F1、F2等。所以它的内容是:ABCD,160.72,180.21,260.13,451.48EFGH,252.42,132.21,150.11,612.56IJKL,541.77,455.21,268.76,543.81要读取这样的文件,您可以使用np.loadtxt方法,将dtype作为结构化类型(定义列表)传递,可以在列表理解中生成:nFloats = 4a = np.loadtxt('Input.csv', delimiter=',',&nbsp; &nbsp; dtype=[('Id', 'U10')] + [( f'F{i+1}', '<f4' ) for i in range(nFloats)])请注意,我传递了U10作为Id列的类型(10 个字符)。如果需要,请设置该字段的其他大小。结果是:array([('ABCD', 160.72, 180.21, 260.13, 451.48),&nbsp; &nbsp; &nbsp; &nbsp;('EFGH', 252.42, 132.21, 150.11, 612.56),&nbsp; &nbsp; &nbsp; &nbsp;('IJKL', 541.77, 455.21, 268.76, 543.81)],&nbsp; &nbsp; &nbsp; dtype=[('Id', '<U10'), ('F1', '<f4'), ('F2', '<f4'), ('F3', '<f4'), ('F4', '<f4')])当然,在代码的目标版本中相应地增加nFloats(可能应该是47)。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python