手记

数据分析概述

1、数据分析师的特点

①好奇:从数据中能够获取哪些信息,哪些想法

②谨慎:不急着公布结论,多维数据验证

    “没有完美的数据,没有完美的方法”

③责任:个人、企业、社会

2、避免对数据可视化的误解

“把图做得复杂、更大数据、弄个大新闻,什么软件可以做图、找到别人没有发现的秘密”

3、图表的四大类

比较、分布、构成、联系

——《exel图表之道》

使用图表的目的不外乎这四种

4、数据工作流程

数据工作流程

5、数据可视化的方式

下列列出了一些图表需求及对应的工具,普通数据工作可能excel就能够解决,不过如果向数据发展,还是应该多接触几种工具的使用,至少每种类型的图表要熟悉一种工具。

图中列了很多可视化图表的方式,不过我觉得吧,日常的工作报表excel足够了,在此基础上进一步做到自动化报表,可以考虑python+pandas/seaborn的组合,几乎可以应对所有的数据处理层面的问题。

图表可视化

6、数据研究的套路

数据工作的套路

数据工作流是一个很虚但是非常重要非常重要非常重要的概念,厘清自家业务的数据流是很一件很重要的基础工作

数据工作流

7、利用机器学习进行数据处理的一些介绍

常用python库

缺失值处理


特征工程


特征选择


训练流程



训练流程

评估方法:

    分类:准确率、召回率、精确度

    回归:均方差

评价方法-留出

评价方法-交叉验证



作者:Rockelbel
链接:https://www.jianshu.com/p/c02cb5fe55af


0人推荐
随时随地看视频
慕课网APP