线性回归训练/形状输出不正确

我正在尝试使用线性回归来预测未来几年的节目发行量。我有一个数据框,其中每一行都是一个版本,其中包含发布年份、流派等信息的列......我想用它来预测即将发布的版本的数量,所以我所做的就是制作一个新的数据框所有唯一年份和 count_values 的总和,以获得当年的发行量。所以现在我有 85 行 2 列 1 是年份,另一列是发行量。


我正在为此唱 sklearn,这是我到目前为止所做的代码。


x = ML_content.drop('releases', axis = 1)

#x = ML_content['years']

y = ML_content['releases']

x_train, y_train, x_test, y_test = train_test_split(x, y, test_size = 20)

x_train.shape, y_train.shape

model = linear_model.LinearRegression()

model.fit(x_train, y_train)

我认为形状过程的结果不符合我的要求(这是结果:)((42, 1), (43, 1)),因此以下代码也不起作用。任何人都可以向我解释我做错了什么或需要发生什么来改变这一点。


谢谢你的时间和帮助


哆啦的时光机
浏览 123回答 1
1回答

holdtom

根据https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html,train_test_split的返回顺序与您的顺序不同。返回的顺序是:X_train, X_test, y_train, y_test你得到:x_train, y_train, x_test, y_test
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python