seaborn:选定的 KDE 带宽为 0。无法估计密度

import pandas as pd

import seaborn as sns


ser_test = pd.Series([1,0,1,4,6,0,6,5,1,3,2,5,1])

sns.kdeplot(ser_test, cumulative=True)

上面的代码生成以下 CDF 图形:

http://img1.mukewang.com/63071dfa0001206903720248.jpg

但是,当该系列的元素被修改为:

ser_test = pd.Series([1,0,1,1,6,0,6,1,1,0,2,1,1])
sns.kdeplot(ser_test, cumulative=True)

我收到以下错误:

值错误:无法将字符串转换为浮点数:“scott”

运行时错误:选定的 KDE 带宽为 0。无法估计密度。

这个错误是什么意思,我该如何解决它来生成CDF(即使它非常偏斜)。


哔哔one
浏览 177回答 4
4回答

呼啦一阵风

这里发生的事情是Seaborn(或者更确切地说,它用来计算KDE的库 - scipy或statsmodels)并没有设法找出“带宽”,这是计算中使用的扩展参数。您可以手动传递它。我玩了几个值,发现1.5给出了一个与你之前相同比例的图表:sns.kdeplot(ser_test, cumulative=True, bw=1.5)另请参阅此处。如果您没有它,值得安装。statsmodels

吃鸡游戏

如果您不想等待seaborn git更新以稳定版本发布,则可以尝试问题页面中的解决方案之一。特别是henrymartin1的建议,尝试在try/catch块(由hartikainen建议)内手动传递一个小带宽,该块会抓取此特定错误的文本(因此其他错误仍然会被提出):try:    sns.distplot(df)except RuntimeError as re:    if str(re).startswith("Selected KDE bandwidth is 0. Cannot estimate density."):        sns.distplot(df, kde_kws={'bw': 0.1})    else:        raise re这对我有用。

人到中年有点甜

您有三种选择可以尝试第一个:使用默认设置显示 KDE 块sns.distplot(ser_test, hist = False, rug = True, rug_kws = {'color' : 'r'})第二:带宽窄的KDE,显示单个概率块sns.distplot(ser_test, hist = False, rug = True, rug_kws = {'color' : 'r'}, kde_kws = {'bw' : 1})第三:选择不同的三角形核函数(块状)sns.distplot(ser_test, hist = False, rug = True, rug_kws = {'color' : 'r'}, kde_kws = {'bw' : 1.5, 'kernel' : 'tri'})

回首忆惘然

出现此问题是由于 .statsmodels无论如何,要解决从0.10.0开始的seaborn版本的问题,只需将arg放置即可。diag_kws={'bw': 1}尝试找出带宽的最佳值。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python