计算两对 X 和 y 之间相似度的最佳实践是什么

我对一个元素有一些价值观。例如,element1: values1, values2。对于每个元素,我需要计算给定数量的特征的“分数”。想象一下,我们有一个特征表示为:

  • 特征 1 的高分由 value1 的高分和 value2 的低分给出。

因此,如果我假设 value1 (1) 的高分和 value2 (0) 的低分对应于“feature1”的高分,那么计算 feature1 的得分的最佳实践是 value1 和 value2 两个不同分数?(例如 value1=0.7,value=0.2)。我使用 Python 作为编程语言,并且我更喜欢使用 sklearn 广告模块,但所有适合的解决方案都被接受。


守着一只汪
浏览 55回答 1
1回答

慕斯709654

首先标准化您的数据。一种规范化是使您的 values1、values2 适合范围 [0,1]。假设基于归一化数据的特征 1 的平均 2 值表征为 (.7, .2)。对于任何新的 2 值 (x,y),计算 (x,y) 和 (.7,.2) 之间的距离在机器学习中计算距离时,通常不计算 sqrt 分量。dist^2 = (x-.7)^2 + (y-.2)^2您可能还对计算 2 值 (x,y) 与 (.7,.2) 的误差感兴趣,并且可以查看分类交叉熵。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python