Golearn 模型对自变量(预测变量)和目标(预测)是隐含的

我正在用 Go 学习机器学习。我正在探索 Go 中的 Golearn 包,以获得 ML 支持。我对 model.fit 和 model.predict 函数的实现方式感到非常困惑。


例如,在来自Golearn 存储库的 Knn 分类器的示例实现中:


    rawData, err := base.ParseCSVToInstances("../datasets/iris_headers.csv", true)

    

    cls := knn.NewKnnClassifier("euclidean", "linear", 2)


    trainData, testData := base.InstancesTrainTestSplit(rawData, 0.50)

    cls.Fit(trainData)


    predictions, err := cls.Predict(testData)

我很困惑哪个是模型的 x 和 y。如何有选择地传入预测变量并进行预测?我几乎被互联网文章冻结了,没有提供任何线索。


我是 Golang ML 开发人员的新手。在 Go 中有过 Web 和数据库工作的经验。我在 python 中编写 ML 模型。最近我发现 GO 在数据处理方面速度更快,适合 ML 应用,同时速度比 python 快。我渴望对此作出解释。如果没有,一个不太复杂但有足够 ML 支持的 Go 库也可以。


拉丁的传说
浏览 133回答 1
1回答

SMILET

golearn->knn实现 k 最近邻算法。它是由将 csv 文件解析为矩阵(Predict函数) 使用不同算法计算向量之间的距离在执行此步骤时,所有非数字字段都将被删除。非数字字段被假定为该模型正在训练的标签。欧几里得曼哈顿余弦类别/标签或Attributes定义在csv, 在预测列表中返回,一对形式的值(index,predicted Attribute)。我如何有选择地传入预测变量并预测在knn您可以通过将 csv 中的预测目标标记为非整数值来做到这一点。例如 ( Iris-setosa, Iris-versicolor)。线性回归你可以使用AddClassAttribute(),这个方法是在DenseInstancesstruct 上定义的,它是base.ParseCSVToInstances()方法的输出。这样做的代码看起来像   instances, err := base.ParseCSVToInstances("../examples/datasets/exams.csv", true) // true: means first line of csv is headers.      attrArray:=instances.AllAttributes()    instances.SetClassAttribute(attrArray[4])//setting final column as class attribute, note that there cannot be more than one class attribute for linear regression.   trainData, testData := base.InstancesTrainTestSplit(instances, 0.1)    lr := NewLinearRegression()   err := lr.Fit(instances)   if err!=nil{      // error handling   }   predictions, err := lr.Predict(testData)   if err!=nil{      // error handling   }警告:-> 在线性回归给出的测试文件中,所有这些都没有完成。我不会声称上述方法是分配回归目标的正确方法或最佳方法。这是一种可能的方式。它成为线性回归函数的候选对象Fit(),这是该模型的计算发生的地方。Predict()函数仅将有限的线性回归系数集相乘并将该值存储为预测。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Go