如何在熊猫中做到这一点:
我extract_text_features在单个文本列上有一个函数,返回多个输出列。具体来说,该函数返回6个值。
该函数有效,但是似乎没有任何合适的返回类型(pandas DataFrame / numpy array / Python list),以便可以正确分配输出 df.ix[: ,10:16] = df.textcol.map(extract_text_features)
所以,我想我需要回落到与迭代df.iterrows(),按照这个?
更新:进行迭代的df.iterrows()速度至少要慢20倍,所以我放弃了该功能并将其拆分为六个不同的.map(lambda ...)调用。
更新2:这个问题是在v0.11.0左右问的。因此,许多问题和答案不太相关。
相关分类