继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

数据分析概述

青春有我
关注TA
已关注
手记 1239
粉丝 205
获赞 1008

1、数据分析师的特点

①好奇:从数据中能够获取哪些信息,哪些想法

②谨慎:不急着公布结论,多维数据验证

    “没有完美的数据,没有完美的方法”

③责任:个人、企业、社会

2、避免对数据可视化的误解

“把图做得复杂、更大数据、弄个大新闻,什么软件可以做图、找到别人没有发现的秘密”

3、图表的四大类

比较、分布、构成、联系

——《exel图表之道》

webp

使用图表的目的不外乎这四种

4、数据工作流程

webp

数据工作流程

5、数据可视化的方式

下列列出了一些图表需求及对应的工具,普通数据工作可能excel就能够解决,不过如果向数据发展,还是应该多接触几种工具的使用,至少每种类型的图表要熟悉一种工具。

图中列了很多可视化图表的方式,不过我觉得吧,日常的工作报表excel足够了,在此基础上进一步做到自动化报表,可以考虑python+pandas/seaborn的组合,几乎可以应对所有的数据处理层面的问题。

webp

图表可视化

6、数据研究的套路

webp

数据工作的套路

数据工作流是一个很虚但是非常重要非常重要非常重要的概念,厘清自家业务的数据流是很一件很重要的基础工作

webp

数据工作流

7、利用机器学习进行数据处理的一些介绍

webp

常用python库

webp

缺失值处理


webp

特征工程


webp

特征选择


webp

训练流程



webp

训练流程

评估方法:

    分类:准确率、召回率、精确度

    回归:均方差

webp

评价方法-留出

webp

评价方法-交叉验证



作者:Rockelbel
链接:https://www.jianshu.com/p/c02cb5fe55af


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP