我有一个像这样的数据框:
col1 col2
[abc, bcd, dog] [[.4], [.5], [.9]]
[cat, bcd, def] [[.9], [.5], [.4]]
列表中的数字col2描述了 中的元素(基于列表索引位置)col1。所以“.4”col2描述了“abc” col1。
col1我想创建 2 个新列,其中一列仅提取中 >= .9 的元素col2,另一列作为col2;中的数字。所以两行都是“.9”。
结果:
col3 col4
[dog] .9
[cat] .9
我认为选择从中删除嵌套列表的路线col2就可以了。但这比听起来更难。我已经尝试了一个小时来移除那些指状支架。
尝试:
spec_chars3 = ["[","]"]
for char in spec_chars3: # didn't work, turned everything to nan
df1['avg_jaro_company_word_scores'] = df1['avg_jaro_company_word_scores'].str.replace(char, '')
df.col2.str.strip('[]') #didn't work b/c the nested list is still in a list, not a string
我什至还没弄清楚如何提取列表索引号并过滤 col1
开心每一天1111
慕村9548890
相关分类