1、数据分析师的特点
①好奇:从数据中能够获取哪些信息,哪些想法
②谨慎:不急着公布结论,多维数据验证
“没有完美的数据,没有完美的方法”
③责任:个人、企业、社会
2、避免对数据可视化的误解
“把图做得复杂、更大数据、弄个大新闻,什么软件可以做图、找到别人没有发现的秘密”
3、图表的四大类
比较、分布、构成、联系
——《exel图表之道》
使用图表的目的不外乎这四种
4、数据工作流程
数据工作流程
5、数据可视化的方式
下列列出了一些图表需求及对应的工具,普通数据工作可能excel就能够解决,不过如果向数据发展,还是应该多接触几种工具的使用,至少每种类型的图表要熟悉一种工具。
图中列了很多可视化图表的方式,不过我觉得吧,日常的工作报表excel足够了,在此基础上进一步做到自动化报表,可以考虑python+pandas/seaborn的组合,几乎可以应对所有的数据处理层面的问题。
图表可视化
6、数据研究的套路
数据工作的套路
数据工作流是一个很虚但是非常重要非常重要非常重要的概念,厘清自家业务的数据流是很一件很重要的基础工作
数据工作流
7、利用机器学习进行数据处理的一些介绍
常用python库
缺失值处理
特征工程
特征选择
训练流程
训练流程
评估方法:
分类:准确率、召回率、精确度
回归:均方差
评价方法-留出
评价方法-交叉验证
作者:Rockelbel
链接:https://www.jianshu.com/p/c02cb5fe55af