手记

数据分析体系构建

一、数据分析的目的

1.验证产品模式是否可行

2.验证用户对产品功能的满意度

3.挖掘新的需求,帮助产品、运营进行迭代


二、数据分析流程

1.数据采集

友盟+事件埋点

2.数据清洗

Excel清洗

3.数据分析

Excel + SPSS

4.数据可视化

Excel图表

5.数据迭代


三、数据分析工具


四、数据分析指标

1.定性指标vs量化指标

2.探索性指标vs报告性指标

3.先见性指标vs后见性指标

4.相关性指标vs因果性指标

5.虚荣性指标vs可付诸行动指标


①整体

北极星指标:核心指标

一级指标:衡量公司战略和目标

二级指标:一级指标的路径

三级指标:二级指标的路径


AARRR模型:

A:用户获取

渠道相关:

渠道规模、访问量、访问用户量、拉新能力、新访问用户量、新访问用户量/访问用户总量、渠道质量、访问时长、每次会话浏览页面数、跳出率、用户注册转化率、用户其他转化率、渠道留存率


激活相关:

下载量:已下载应用的用户数量,以及应用商店排名和评分

安装激活量:安装并打开应用的设备数

激活率:激活设备数/安装设备数

新增用户数:新增设备的数量(激活数量,唯一)

注册用户数:所有激活用户中注册成功的用户占比

用户获取成本:每获取一个用户所需要的费用

抛出一个疑问:何为真正的激活?

安装之后打开就算激活吗?注册成功就算激活吗?还是必须得首次体验到产品核心功能才算激活?


A:用户活跃

产品使用规模:

日活、周活、月活跃用户量:一段时间内启动过应用的设备数,表示用户规模

访问量,启动次数:启动应用的次数

活跃系数:日活跃用户数/月活跃用户数(大于0.2比较合适)

平均使用时长:平均每个用户一天使用应用的时间

功能使用率:使用某功能的用户数占活跃用户的比例


新手引导效率:

新手任务完成率

新手任务完成耗时


用户活跃度:

活跃访次/全部访次

各模块用户活跃度


产品转化率:

核心流程转化率

核心转化步骤流失率


R:用户留存

N日留存计算:统计日期新增的用户或活跃用户,在第N天又来使用的比例。

次日留存率

7日留存率

30日留存率


产品留存率:

核心产品功能留存率


抛出一个疑问:当留存率非常低时,如何利用指标发现问题?

次日留存比较低时,说明用户对我们的产品不感兴趣,或者说我们的产品做得太差

7日留存比较低时,说明用户觉得我们的内容不耐玩,不好玩

30日留存比较低时,说明我们的版本迭代规划做得不够好,没有及时给用户更新内容


R:获取收入

销售额、转化率


R:用户传播

推荐用户数量

推荐用户/全部线索用户

NPS

K因子

口碑指数(百度,谷歌)


②局部

1.产品每一个具体功能的用户体验评估

heart模型:


2.产品每一个具体业务的指标

电商类:


UGC内容类:

游戏类:

平均同时在线人数(ACU: Average concurrent users):即在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。[例如:系统每一小时抓取一次数据,全天24小时共24个不同时刻的在线数据,则每天的ACU是这24个数据的平均值(每个公司有每个公司的定义,一般ACU取平均值,若针对某一时刻,则直接在某时刻内直接统计用户数)

最高同时在线人数(PCU:Peak concurrent users)即在一定时间内,抓取最高在线数据。(例如:单天最高在线:系统每小时统计一次数据,全天24小时共24个不同时刻的在线数据,则24个时间段内最高的用户在线数据为PCU)

充值金额(RMB):即在一定周期内充值总金额。

元宝消费金额(RMB):即在一定周期内,玩家在游戏商城中的消费总金额(仔细看,充值金额与元宝消费金额有着明显区别,上者受活动影响,下者受商城道具需求影响。)

每付费用户平均收益(ARPPU: Average Revenue Per Paying User):相似于下载游戏的消费比率,(国内很多人以“ARPU”称呼,个人定义不同),此类数据主要衡量付费用户收益(公式:月总收入/月付费用户数)

平均每活跃用户收益(ARPU: Average Revenue Per User):主要衡量游戏整体贡献收益;毕竟除了付费收益,活跃用户也能产生收益,(一般国内以此数据为核心,各家算法不同)(公式:月总收入/月活跃用户)

平均生命周期:有新增账户在首次进入游戏到最后一次参与游戏的时间天数。比如记录某一个月,这个月里,每个新增用户的生命周期之和/MAU=平均生命周期。

LTV生命周期价值(LTV: Life Time Value):约定一个计算的生命周期值(比如上个月的平均生命周期,或者约定为15日,即这个月有15日登陆记录的账户数),符合这个生命周期条件的账户数中,充值金额的和/条件账户数。

每日注册并登陆的用户数(DNU: Daily New Users):这个言简意赅,就不详谈了,直接从后台抓取即可。

新登用户中只有一次会话的用户(DOSU: Daily One Session Users):这个也很简单,此类数据主要衡量新用户的质量,买量的可以参考一下。

每日登陆过游戏的用户数(DAU: Daily Active Users):直接从字面就能了解了,一般从后台抓取。

七天内登陆过游戏的用户数(WAU: Weekly Active Users):这个还是很好理解,就不废话了,此类数据主要衡量周变化。

30天内登陆过游戏的用户数(MAU: Monthly Active Users):浅显易懂,主要衡量产量的粘性以及用户的稳定性。



四、数据分析中的误区

1.忽略沉默用户

2.过度依赖数据

3.错判因果关系

4.通过数据表达方式欺骗

5.妄谈大数据



五、数据分析方法

从统计学的角度看:

按照难易程度分为:基础统计分析、高级统计分析、数据挖掘方法。


常见的分析方法有如下:

①画像分群:聚合符合某种特定行为/画像的用户,聚类分析

②趋势分析:实时快速了解多维度趋势,便于进行产品、市场迅速迭代

③对比分析:与竞争对手比,与过去的自己/版本比



④交叉分析:多维度交叉分析

⑤漏斗分析:按照已知转化路径,分析每一步骤转化情况

⑥回归分析:预测性的建模技术,研究因变量和自变量之间的关系

⑦聚类分析:物以类聚,人以群分,将相似或距离相近的对象/数据归为一类

⑧相关性分析:对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度

⑨行为事件分析/用户路径分析:探索性了解某组用户的行为轨迹

⑩留存分析:了解行为/行为组与回访之间的关联

⑩①A/B测试:对比不同产品设计/算法对结果的影响

⑩②优化建模:建立预测模型优化商业结果



六、数据分析框架/思维

①AARRR模型

不解释了。

②逻辑分层拆解




七、数据应用的场景

产品设计前:通过数据分析发现问题

产品设计中:辅助决策,判断思路(A/B测试)

产品设计后:数据验证方案


数据驱动产品闭环


所谓的数据驱动,其实就是一套量化的发现问题和解决问题的流程,在产品设计的重要环节,数据都在发挥着主观臆断无法替代的作用。


八、回归实际,解决重要的三个问题

①数据如何科学的采集?(关于埋点方式的探讨)

目前市面上有的埋点方式主要是三种:

a.可视化/全埋点

所谓全埋点,就是在产品中嵌入一段SDK,做一个统一的埋点,也叫“无埋点”。

优势:

可视化展示宏观指标,满足基本的数据分析需求;技术门槛较低,使用与部署较简单;用户友好性强

缺陷:

只能采集到用户交互数据,自定义的某些属性无法采集;无埋点兼容性有限,同一按钮可能出现不同名称,造成混乱;属于前端采集的方式,有天然的缺陷,如数据采集不全面、传输时效性差、数据可靠性无法保障等。


b.代码埋点

又分为前端代码埋点和后端代码埋点。前端类似全埋点,所不同的是,对于每一个关键行为,都需要调用SDK,将必要的事件名、属性字段写入代码;后端代码埋点则将相关的事件、属性等通过后端模块调用SDK的方式,发送到后台服务器,这种方式更适合安全性要求高、精细化分析的场景,如金融服务。


c.导入辅助工具

还可以采用日志、数据库的方式生成数据,然后对数据进行转换,通过实时或批量工具完成数据的导入。


那么,如何选择合适的采集方式呢?因企而异。

一般三种都是结合起来用的,只不过看全埋点是用第三方现成的,如友盟、神策数据、growthingio等,还是用官方自己搭建数据分析平台,这要根据公司具体业务来定。


②一款产品在什么时期就要开始做埋点工作了?(尤其是早期冷启动产品)

建议在早期就要有数据分析体系搭建的意识,可能暂时还用不上,如果产品验证还不错,公司资源又跟的上,那建议尽早去做。


③数据深度挖掘算法

现在大家都在谈大数据,大数据该怎么做?怎么智能化?有以下几个方向:

a.决策树模型

b.神经网络

c.机器学习

因为涉及的领域太深、太难,此处不做过多分析。



作者:会弹琴的小哥哥
链接:https://www.jianshu.com/p/ef251a518fdf


0人推荐
随时随地看视频
慕课网APP