手记

【学习打卡】第3天 数据挖掘 - 重要系数与重要因子选择

模块一:Python全能工程师2022,7-2正负样本,数据调优

模块二:掌握Python数据读取、预处理、分析、挖掘与模型搭建的全流程必备知识。

模块三:

用于训练集与非训练集,输入与输出数据

imbalanced-learn 用于不平衡的

算法逻辑可在官网查看,可看样本的概率有多大

可以预测样本是正负样本的概率

可以用DecisionTreeClassifier来让人做判断,随机森林解决这个问题判断的统计后预测偏差问题

XGBoost调取,有准确率,precision_score查准率(预测正样本里面的真正样本率),查证率recall_score
模块四:


0人推荐
随时随地看视频
慕课网APP