当我们说数据敏感度时,我们到底在说什么?
最近一直在看范冰和曲卉老师的增长黑客实战笔记,干货很足。增长黑客是非常典型的以数据驱动决策的岗位,随便翻一翻各大招聘网站关于增长黑客的要求,都必然要求一条“拥有优秀的数据敏感度”。有兴趣的朋友可以留意一下这条要求。
当然,我今天并不是讨论如何成为一名优秀的增长黑客,而是我每次看到“数据敏感度”这个词的时候,内心都无比复杂,总是会想起那会儿刚入行没多久,给某款游戏做留存预测的事儿。那个时候的上级说了句令我记忆犹新的话,“你不适合做数据分析,没有数据敏感度”,我当时特别好奇,反问他什么叫数据敏感度,什么才算好的数据敏感度,遗憾的是,他支支吾吾说了半天也没能说清楚。
时过境迁,现在回头来看,到底什么叫数据敏感度呢?
在我看来,所谓的数据敏感度,其实就是在大脑内建立了数字和业务之间的联系,而优秀的明数据敏感度,就是能够一眼看出数据的问题和背后可能的原因。
什么叫一眼看出?
如果你是游戏行业的,我告诉你这款MMORPG的次留是20%,你能知道我款产品在行业里处于什么样的水准,游戏前期可能存在什么样的问题等;
如果你是O2O行业的,我告诉你外卖订单量相比于昨天下跌了10%,你能很快判断出问题的影响面和造成订单量下跌的可能原因;
如果你是电商行业的,我告诉你我这款产品的复购率是40%,你能很快判断出我这款产品大概是什么类型的产品,在行业内是什么样的水准;
做到这程度,就叫优秀的数据敏感度。
那如何培养数据敏感度呢?
培养数据敏感度,其实就是在大脑里培养建立数字和业务之间的联系,多做业务,多实践永远是提升数据敏感度的不二法门,对业务逻辑越了解,对数据之间的逻辑关系理解越透彻。
但是对于想转行的新人,或者说应届生来说,这个时候还没有接触到具体业务的机会,怎么办?
说说我对这个问题的理解,首先对于新人或面临转行的人来说,这两种类型的人都缺少对本行业的通识,第一件要做的事就是背数据,记住这个行业的行业平均数据和各项通用指标的定义,这么做是为了对整个行业有个总体的认知。
以我自己为例,当时从游戏策划转游戏运营,查询了talkingdata、易观、dataeye等数据平台和应用宝、360、硬核等各家平台发布的游戏数据,对当时市面上的各种游戏类型的留存、付费等数据做了个整理和记忆,比如Arppu、Arpu、次日留存、三日留存、七日留存、月留存、付费率等等。
如果是其他行业,比如电商行业,流量*转化率*客单价*复购率这个公式则是重中之重等等。
本质上,背诵数据是对行业AARRR模型的一个整体记忆,是在脑海里刻画这个行业的专属模型。每个行业的流量漏斗都大抵离不开以下的模型图和步骤拆解:
Acquisition(用户获取):渠道曝光、下载、安装、启动、注册、(创角,游戏行业特有)
Activation(用户激活):这里的激活,一般着重指完成了某个关键的行为,才视为一个激活。比如facebook关注了5个好友、阅读APP浏览了多少条新闻、理财APP进行一次理财等。需要特别说明的是,游戏行业的一个激活,一般是指完成注册或者创角,重点强调用户获取层面。
Retention(用户留存):同样的,这里的留存仍是指在一定周期内回来完成一次关键行为。游戏行业一般只关注用户是否回来。
Revenue(付费):完成关键行为的用户付费概率更高,也就是所谓的留下来的用户才可能付费。
Referral(用户推荐):指产品内的用户推荐机制,一般更加系统化,和病毒传播不太一样。
在已经对行业AARRR模型已经有所了解的基础上,对于已经在工作岗位的人来说,就是熟悉公司业务数据了,从大盘到细分数据,都应该做到心中有数,最后按照一定的分析思路来分析数据。
以《增长黑客实战笔记》中的例子为例,来谈谈具体遇到具体数据问题的时候的思路:
假如你是百度外卖的运营负责人,某天移动端的订单量比前一日下降了5%,你的老板要求你对这一变动做出合理解释,你如何应答?
其次先明确指标变动的异常程度和影响面,订单量比前一日下跌5%,是否大到必须加以重视。
以2015年百度外卖B轮融资计划书展示的数据看,其拥有3000万的注册用户,日订单数量超过110万,客单价可达50元左右。以此数据估算,假设2016年底注册用户数达到6000万,日订单数据量突破200万,客单价基本不变,那么5%的订单量下滑意味着当日损失500万营收。天然的单一突发事件几乎不可能造成这么大的损失,因此足以引起团队的重视(这里只是以融资计划书的付费数据为例,实际上作为运营负责人,这些数据都是内部可直接获取的)。
确定需要引起重视后,就需要寻求数据分析的角度,排查异常原因,影响数据异常变动的原因可能有哪些?这里的思考模式其实就是金字塔结构思维模式:
PS:强烈推荐职场新人看看这本书
先考虑全局指标:包括一定时间内新增用户量、总体付费率、总留存率、用户活跃度、各环节总转化率、搜索功能使用率、翻页率、崩溃率等。全局指标用于分析对全体用户产生影响的共性原因,绝大部分问题都会在全局指标上体现出来;
再看分渠道指标:可以按不同用户属性(新老用户)、用户来源(下载渠道)、用户自然属性(地域、性别)网络环境(网络运营商、网络接入方式)等维度观察不同渠道数据是否存在异常。
举个例子,曾经运营某款游戏的时候,突然某段时间有大量用户投诉无法登录,经过大量技术排查工作之后,最后确认是该地区的移动网络出现故障;
在上述两项指标基础上,再考虑用户行为数据:重点观测用户在不同时间段、不同需求类型下的行为,从而定位到由于某一细分人群的定向变化产生的数据异常;
时间因素:外界环境的影响也可能对产品数据造成影响,因此观测环比和同比数据都很重要。典型如“月末效应”,即一定规模的用户群体因月底流量耗尽而减少上网行为,造成整体流量的下滑。另外,对于一款外卖产品而言。天气变化也会造成数据波动,通常阴雨天气的订单量会走高。
同样的,“周一效应” “寒暑假效应”也是游戏行业比较常见的效应,游戏dau在周一往往会走低,在寒暑假往往会走高;
其他产品线监控:百度集团旗下的其他产品线变动也可能成为造成订单量下滑的原因,例如91应用市场改变了App广告的展示位置,或是搜索引擎的算法调整降低了网民常用关键词的权重等(通过下载来源的分渠道数据可以明显看到哪个下载来源的数据有减少);
舆情监控:包括但不限于通过人工或机器方式,从内部反馈渠道如客服系统到论坛、贴吧、微博、朋友圈等处采集大众对产品的实时意见。极有可能因此发现导致产品数据骤然降低或飙升的特殊舆情,如竞争对手有了哪些动作、母公司运作重大纰漏等;
定位到具体的问题和原因后,给出对应的结论和解决方案,比如修复某个bug,针对竞争对手的营销策略做出同等力度的折扣反击等。
分析出问题原因只是第一步,提出解决问题的方案才是最关键的。