猿问

如何在 Python 中将基于 pandas 字符串的 DataFrame 转换为基于列表

我已经根据加载的 CSV 文件构建了一个 DataFrame。数据框大约有 60 行和 7 列。此时DF中的所有对象都是字符串。

这是现在的样子: DF

数据框稍后将被送入 DNN,因此我需要 DF 中的每个对象都是元组或列表(我更喜欢元组,但我希望两种方式都有,以防万一)。

如何拆分字符串中的值,以便将它们制成元组?

这是我的代码:

import pandas as pd

import datetime

from os import listdir



filepaths = [f for f in listdir("C:/Users/user/PycharmProjects/NDVI/data/") if f.endswith('.csv')]

df = pd.concat(map(pd.read_csv, filepaths))


df_v = pd.DataFrame(columns=['S2T0', 'S3T0', 'S3T1', 'S3T2', 'S3T4', 'S3T5', 'S2VAL'])

num_columns = len(df_v.columns)

row = 0



while row < len(df)-7:

    temp_data = {'S2T0': [df.iloc[row, 3].replace('[', '').replace(']', '')],

                 'S3T0': [df.iloc[row+1, 3].replace('[', '').replace(']', '')],

                 'S3T1': [df.iloc[row+2, 3].replace('[', '').replace(']', '')],

                 'S3T2': [df.iloc[row+3, 3].replace('[', '').replace(']', '')],

                 'S3T4': [df.iloc[row+4, 3].replace('[', '').replace(']', '')],

                 'S3T5': [df.iloc[row+5, 3].replace('[', '').replace(']', '')],

                 'S2VAL': [df.iloc[row+6, 3].replace('[', '').replace(']', '')]}

    temp_df = pd.DataFrame(temp_data)

    row += 7

    df_v = df_v.append(temp_df, ignore_index=True)



print(df_v.loc[0, 'S2T0']) #I did this to see the structure of one object in the DF

df_v.loc[:, :] = df_v.loc[:, :].apply(split, ", ")

print(df_v.loc[0, 'S2T0']) #Was hoping the split will work...

我得到这个例外:NameError: name 'split' is not defined (obviously because this is not the proper use of split..)


顺便说一句:如果您有比我做的更优雅的方法来清除“[”和“]”并构建 df_v - 我会很高兴听到。


请注意:由于缺少数据,我的一些对象是“[]”。我需要传递空列表\元组或 NULL(都可以)


慕侠2389804
浏览 166回答 1
1回答

繁星coding

对于 split 遇到的问题,没有 split&nbsp;function。字符串有一种拆分方法。您可以做的是传递一个 lambda 函数,然后返回将该方法应用于每一行中的字符串的每个结果。此外,applymap像下面这样使用应该可以让您将函数应用于 DataFrame 中的所有单元格。df_v&nbsp;=&nbsp;df_v.applymap(lambda&nbsp;x:&nbsp;x.split(",&nbsp;")&nbsp;if&nbsp;x!=""&nbsp;else&nbsp;[])
随时随地看视频慕课网APP

相关分类

Python
我要回答