我正在尝试计算两个 256*256 图像标签之间的归一化互信息,并将其展平为一个数组。
在 sklearn 的文档中,很明显函数 normalized_mutual_info_score 应该只输出 0 到 1 之间的值。
但是我意识到当比较包含大量元素的列表时,有时它会给我负值或大于 1 的值。
是上溢/下溢问题吗?(我意识到,如果我将 average_method 更改为“算术”、“最小”或“最大”,我会得到一个更现实的答案,但不确定哪一个最适合我的情况。)
使用 sklearn 0.20.0,我将提供一个合成示例来重现该问题:
metrics.normalized_mutual_info_score([0]*100001, [0]*100000 + [1])
metrics.normalized_mutual_info_score([0]*110001, [0]*110000 + [1])
我希望下面的答案是 0,但我分别得到了 7.999 和 -7.999。
江户川乱折腾
相关分类