我有一个字典,它的键是一个字符串元组,值是它的频率,例如
{('this','is'):2,('some','word'):3....}
我需要消除一些包含这些子键的键,例如:
d={('large','blue'):4,('cute','blue'):3,('large','blue','dog'):2,
('cute','blue','dog'):2,('cute','blue','elephant'):1}
我需要消除,('large','blue')因为它只出现在'large blue dog'但是我不能删除“可爱的蓝色”,因为它出现在'cute blue dog'和'cute blue elephant'
d={('large','blue'):4,('cute','blue'):3,('large','blue','dog'):2,
('cute','blue','dog'):2,('cute','blue','elephant'):1}
final_list=[]
for k,v in d.items():
final_list.append(' '.join(f for f in k))
final_list=sorted(final_list, key=len,reverse=True)
completed=set()
for f in final_list:
if not completed:
completed.add(f)
else:
if sum(f in s for s in completed)==1:
continue
print(final_list)
print(completed)
但这只给了我 ['可爱的蓝象'] 我需要
[large blue dog] :2
[cute blue dog]:2
[cute blue elephant]:1
[cute blue]:3
慕容3067478
暮色呼如
江户川乱折腾
相关分类