在h2o树图中,叶数代表什么?

http://img4.mukewang.com/60a3801b0001b86019160586.jpg

我的分类是0-1分类。那么底部的数字到底是什么告诉我[为什么它们都是负数?NA也意味着什么?他们是否说这个特殊功能没有在数字比较中分类,因此不像BreedName这样分类?

这是我的数据列,“ L”是0-1列,即我的y。

http://img1.mukewang.com/60a3802f0001198e08570292.jpg

Ques2-因为我完成了cv(n = 3)并且我有4棵树[0,1,2,3],所以这棵树0是主要模型,对我的解释应该基于第0棵树吗?


蝴蝶不菲
浏览 224回答 3
3回答

慕婉清6462132

在节点链接附近显示的[NA]表示所有nan值都将通过此链接。我不确定h2o树如何处理nan目标值。无论如何,保留它们永远不是一个好主意。您应该尝试将其删除或根据您的问题将其替换为0和1。您的树的“底部数字”似乎很奇怪...为什么在树的顶部写有“ 0级”?您是否分别训练班0和班1?您能说明如何进行树训练吗?我不确定您所说的“我有四棵树”是什么意思。交叉验证仅用于检查您的模型可以预测数据的质量。但是,您用来预测未来数据的模型不是您用来交叉验证的模型。它必须是适合您当前所有数据的其他模型。

冉冉说

内联回答,因为有几个问题:我的分类是0-1分类。那么底部的数字到底是什么告诉我[为什么它们都是负数?您正在显示树0的图像,这是第一个构建的树(因此不是您的主模型)。树叶值是校正值,您应该使用它h2o.predict()来查看最终模型的预测。NA也意味着什么?该[NA]指数据集来港定居。您在树拆分中看到的只是指定NA应该走的路。这棵树0是主要模型,因为我完成了cv(n = 3)并且我有4棵树[0,1,2,3],而我所解释的应该基于第0棵树吗?树0是构建的第一棵树,而不是最终模型。请参阅有关交叉验证的文档,以获取有关CV模型构建过程的详细说明
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python