通过 DataFrame 中的 ForLoop 赋值

无需使用 for 循环。相反，您可以使用pandas矢量化函数。您可以与库fillna()一起使用。本质上，您正在用从描述列中提取的信息替换值。.str.extract()pandasNaN您可以传递一个标志，flags=re.IGNORECASE以在匹配时忽略大小写。最后，我们必须使用, expand=False返回一个系列，因为返回一个数据帧，这在处理数据帧而不是系列str.extract()时会导致错误。.fillna()import pandasimport rekeyword = ['gmc', 'toyota', 'cadillac']df['manufacturer'] = df['manufacturer'].fillna(    df['description'].str.extract('(gmc|toyota|cadillac)', flags=re.IGNORECASE, expand=False))df['cylinders'] = df['cylinders'].fillna(    df['description'].str.extract('(\d+\s+cylinders?)', flags=re.IGNORECASE, expand=False))dfOut[1]:   manufacturer     cylinders                        description0       toyota   5 cylinders          toyota, gmc 10 years old.1          gmc           NaN   gmc, Motor runs and drives good.2          NaN   4 cylinders  Motor old, in pieces. 4 cylinders3     Cadillac  12 cylinders          2 owner 0 rust. Cadillac.如果您需要输出为小写，您可以将str.lower()或添加str.casefold()到每列上面每行代码的末尾。操作与符号和不同语言casefold()类似lower()，但更可靠。

通过 DataFrame 中的 ForLoop 赋值

1回答