我有一个包含重复字符串列的数据框。我想取第一个单词并从我拥有的所有行中删除其余单词。我使用了 unique 方法,因为它返回所有唯一值,并且我只查找行中第一次出现的单词。
代码:
import pandas as pd
import numpy as np
import re
df=pd.read_csv("file name")
new_data=df['Category'].unique()
changed_data=df['Category'].str.replace('[^a-zA-Z]+', '')
这就是我所做的一切,对此的任何帮助都会很棒。
杨__羊羊
相关分类