有没有更简单的方法可以将DataFrame行的值分配给自定义对象中的相应变量?

假设我有以下带有一些示例行的DataFrame:


         id    first_name   last_name   age

   0     1     John         Doe         18

   1     2     Joe          Shmuck      21

假设我还有一个自定义的Python类Person,它应该代表上面的DataFrame的值。为了方便起见,DataFrame的列名与该类的属性完全对应。


class Person:

    id

    first_name

    last_name

    age

我知道我可以通过提供列索引或列名称来直接从(数据帧的)行中检索值,例如:df.iloc[0]['age']但是,我希望在我的整个应用程序和调用中有一个稍微安全些的编码实践,person.age甚至最好是一个getter person.get_age()。


我正在做的唯一的原始方法是遍历DataFrame的一行的列,检索每个单元格并将它们逐个分配给新Person对象的变量。例如:person.first_name = df.loc[0]['first_name']


DataFrame或Series或任何其他Python库提供了有用的工具来简化此过程吗?即一些如意算盘person = df.loc[0].transform(type=Person)


富国沪深
浏览 215回答 1
1回答

小怪兽爱吃肉

您真的需要一堂课吗?您可以df.itertuples用来创建“ Person”namedtuple的列表:>>> list(df.itertuples(index=False, name='Person'))[Person(id=1, first_name='John', last_name='Doe', age=18), Person(id=2, first_name='Joe', last_name='Shmuck', age=21)]在您可以访问其属性(p.age,p.id等)的意义上,namedtuple的行为与类非常相似。for p in df.itertuples(index=False, name='Person'):    print(p.first_name)JohnJoe
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python