我想创建一个函数来计算两个数组电影之间的距离。
这是我的数据帧:
movie_title movieId Action Adventure Fantasy Sci-Fi Thriller
Avatar 1 1.0 1.0 1.0 1.0 0.0
Spectre 2 1.0 1.0 0.0 0.0 1
John Carter 3 1.0 1.0 0.0 1.0 0.0
然后我将电影表示为一个数组:
df_array = userGenreTable.as_matrix(columns=userGenreTable.columns[2:])
输出 :
array([[1., 1., 1., ..., 0., 0., 0.],
[1., 1., 1., ..., 0., 0., 0.],
[1., 1., 0., ..., 0., 0., 0.]])
我将数据集表示为字典:
df_2_dict = userGenreTable_2.to_dict('records')
所以我的问题是如何计算两个数组电影之间的距离?
函数式编程
相关分类