继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

【九月打卡】第1天 - 数据诊断

慕码人5253727
关注TA
已关注
手记 28
粉丝 0
获赞 2

模块一:Python制作数据分析工具 - 2 数据诊断 - Alex Cen

模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.

模块三:必要包 - numpy, pandas, scipy

数据读取用Kaggle,下载网页https://www.kaggle.com/c/santander-customer-satisfaction


数据诊断:最小最大均值中位数;计数类;方差,缺失值;分位点的频数

计数类 先避免缺失值,然后计算所有的独有值,可以用iloc来找到数值

如果需要对多个数组进行操作,可以用pandas里面的lambda函数,返回true/false值,np.sum把true的函数加起来

实际操作时,iloc找合适的时候,可以返回head(3)先看看数列怎么样,再用lambda函数对所有的进行操作apply

模块四:

http://img2.sycdn.imooc.com/63271d150001deba03310162.jpghttp://img1.sycdn.imooc.com/63271d3100014a4503510237.jpg


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP