两个数组电影之间的距离

我想创建一个函数来计算两个数组电影之间的距离。


这是我的数据帧:


movie_title  movieId   Action  Adventure  Fantasy  Sci-Fi Thriller

Avatar         1        1.0      1.0        1.0     1.0     0.0

Spectre        2        1.0      1.0        0.0     0.0      1  

John Carter    3        1.0      1.0        0.0     1.0     0.0

然后我将电影表示为一个数组:


df_array = userGenreTable.as_matrix(columns=userGenreTable.columns[2:])

输出 :


array([[1., 1., 1., ..., 0., 0., 0.],

       [1., 1., 1., ..., 0., 0., 0.],

       [1., 1., 0., ..., 0., 0., 0.]])

我将数据集表示为字典:


df_2_dict = userGenreTable_2.to_dict('records')

所以我的问题是如何计算两个数组电影之间的距离?


收到一只叮咚
浏览 161回答 1
1回答

函数式编程

要获得 中所有可能对之间的距离df_array,您需要计算一个距离矩阵。使用scipy.spatial:from scipy.spatial import distance_matrix# p = 2 for euclidean distances distance_matrix(df_array, df_array, p = 2)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python