猿问

从数据文件中获取具有列标题和数据列的python映射

我有一个具有以下格式的文件:


# a, b, c

0.1   0   0

0.2 0.4 0.5

  4   5 0.9

0.3   0  10

这是与数据的3列的文件和这些列的名称是a,b和c。


当前要读取这些数据,我使用:


def readdata(filename):

    a, b, c = np.loadtxt(filename, unpack=True)

    return a, b, c

但是相反,我想readdata返回一个映射mydata,{column title, numpy array}以便可以调用mydata["a"]以获取第一列。如果文件具有新列(d, e, f...),我希望此功能正常工作。


如何做到这一点(尽可能避免不必要的复制)?


红颜莎娜
浏览 212回答 3
3回答

MMTTMM

np.genfromtxt如果您使用关键字numpy调用此功能,则此功能将提供该功能names=True。例子:>>> s = """# a, b, c... 0.1 0 0... 0.2 0.4 0.5... 4 5 0.9... 0.3 0 10... """>>> data = np.genfromtxt(StringIO(s),names=True)>>> data['a']array([ 0.1,  0.2,  4. ,  0.3])>>> data['b']array([ 0. ,  0.4,  5. ,  0. ])>>> data['c']array([  0. ,   0.5,   0.9,  10. ])

HUWWW

使用此文件:#a, b, c0.1&nbsp; &nbsp;0&nbsp; &nbsp;00.2 0.4 0.5&nbsp; 4&nbsp; &nbsp;5 0.90.3&nbsp; &nbsp;0&nbsp; 10假设您的第一行定义了标题行,在Numpy中,您可以执行以下操作:首先,阅读标题行:>>> with open('/tmp/testnp.txt','r') as f:...&nbsp; &nbsp; header=[n.strip() for n in f.readline().strip().lstrip('#').split(',')]...&nbsp;>>> header['a', 'b', 'c']现在,在Numpy中创建一个结构化数组,其名称与标题中的字段相同:>>> import numpy as np>>> struct=[(name,'float') for name in header]>>> data=np.loadtxt('/tmp/testnp.txt',dtype=struct,comments='#')>>> dataarray([(0.1, 0.0, 0.0), (0.2, 0.4, 0.5), (4.0, 5.0, 0.9), (0.3, 0.0, 10.0)],&nbsp;&nbsp; &nbsp; &nbsp; dtype=[('a', '<f8'), ('b', '<f8'), ('c', '<f8')])>>> data['a']array([ 0.1,&nbsp; 0.2,&nbsp; 4. ,&nbsp; 0.3])
随时随地看视频慕课网APP

相关分类

Python
我要回答