第 2 章 创业的记分牌

数据分析离不开对企业关键指标的跟踪。这些指标与你的商业模式(即营收来源、支出成本、客户数量以及客户获取策略的效果等)有关,因此往往十分重要。

但有时创业公司的关键指标却并不容易判定,因为你连自己所处的商业模式都没有办法完全确定。你不停地修改自己分析的活动,并且仍在寻找正确的产品或目标客户。对于创业公司而言,之所以进行数据分析,是为了在资金耗尽以前,找到正确的产品和市场 。

什么是好的数据指标

好的数据指标能带来你所期望的变化,下面就是衡量其好坏的一些重要准则。

好的数据指标是比较性的 。如果能比较某数据指标在不同的时间段、用户群体、竞争产品之间的表现,你可以更好地洞察产品的实际走向。“本周的用户转化率比上周高”显然比“转化率为2%”更有意义。

好的数据指标是简单易懂的 。如果人们不能很容易地记住或讨论某指标,那么通过改变它来改变公司的作为会十分困难。

好的数据指标是一个比率 。会计和金融分析师仅需迅速查看几个比率就能对一个公司的基本状况1 做出判断。你也需要几个这样的比率来为自己的创业公司打分。

1 这些基本状况包括市盈率、销售利润率、销售成本、员工平均营运收入,等等。

比率之所以是最佳的数据指标,有如下几个原因。

  • 比率的可操作性强,是行动的向导 。以开车为例:里程透露的只是距离信息,而速度(距离/小时)才真正具有可操作性。因为速度告诉你当前的行驶状态,以及是否需要调整速度以确保按时抵达。
  • 比率是天生的比较性指标 。如果将日数据与一个月的数据相比较,你会得知该数据当前所经历的是一个短期的突跃,还是一个长期的渐变。再以开车为例:速度是一个数据指标。可只有将当前速度与最近一小时的平均速度进行比较时,才能确知你在加速还是减速。
  • 比率还适用于比较各种因素间的相生和相克(正相关和负相关) 。就开车而言,单位时间内行驶的里程/罚单数这个比率显示了二者的关联性。你开得越快,行驶的里程就越多,但收到的罚单也越多。这个比率可以帮你决定是否应该超速。

以上均以开车为例,现在再来设想一个创业公司:其软件产品采取免费加收费的模式,即同时拥有免费和收费两个版本。公司面临一个选择:是该在免费版中提供尽量丰富的功能以吸引新用户,还是该将这些功能保留在收费版本中,以促使用户为高级功能付费。两种做法各有利弊:推出功能丰富的免费版不利于销售额的增长;而免费版功能过简又不利于新用户的增加。此时,你需要一个结合了二者的数据指标来帮助自己理解,产品的改动对公司的整体业绩会有怎样的影响。否则,你可能会片面地为增加销售额而牺牲新用户的增长。

好的数据指标会改变行为 。这是最重要的评判标准:随着指标的变化,你是否会采取相应的举措 ?

  • 将日销售额之类的“会计”指标纳入财务报表,有助于进行更准确的财务预测。这些指标是精益创业中创新会计 的基础,它们能告诉你当前的状态离理想的商业模型有多远,实际结果是否印证了你的商业计划书。
  • “试验”指标,如一个测试的结果,其作用在于帮助你优化产品、定价以及市场定位。这些数据的变化会极大地影响你接下来的动作。这要求你在收集数据之前就先行确定好针对各种不同情况的应变措施。例如,如果把网站做成粉色调能带来更多的营收,你就该把它做成粉色调;如果半数以上的反馈表明用户不会为某功能付费,你就要决定不去开发此功能;如果悉心打造的最小可行化产品不能将订单量提高30%,你就该试试其他方法。

学会根据数据确定一条做与不做的准绳,对规范你的创业行为大有裨益。一个好的数据指标之所以能改变商业行为,是因为它与你的目标是一致的:保留用户,鼓励口碑传播,有效获取新用户,或者创造营收。

不过可惜,这招并不是任何时候都管用。

知名作家、企业家、演讲家赛思·戈丁曾在一篇名为“Avoiding false metrics”的博文2 中举过几个这样的例子。有趣的是(或许无趣),其中一个汽车销售员例子就发生在了本(本书作者之一)的身上。

2 http://sethgodin.typepad.com/seths_blog/2012/05/avoiding-false-metrics.html

本去买新车。在签写购车协议时,销售员对他说:“下周,您会接到一个询问购车体验的电话。时间很短,也就一两分钟。评分从低到高为1到5。您会给我们打5分,对吗?我们的服务还不错,够得上5分,不是吗?如果有不周到的地方,我确实很抱歉,但如果您能给我们打5分,那是最好的。”

本并没有太把这当回事(奇怪的是,也没有人“如约”打来电话)。赛思认为,这种评分机制就是一个错误的数据指标,因为它并没有促使汽车销售员为客户提供更优的服务,反而让他的口舌浪费在了说服客户给他好评上(这显然对他很重要),这与设计评价机制的初衷——提高服务质量——背道而驰。

由错误数据指标引导的销售团队也会犯同样的错误。阿利斯泰(本书作者之一)就见过某公司的销售总监将销售员的季度奖金与其正在接洽中的订单数量挂钩,而不是与已签订单数量或订单的利润率挂钩。销售员都是靠金钱驱动的,总是跟着钱走。在这个案例中,这就意味着销售团队会为了个人收入制造大量低质量的潜在客户,并将其停在“接洽”状态长达两个季度,这就浪费了本来可以多谈拢几个高质量客户的大好时间。

当然,客户的满意和确保接洽足够多的客户都对公司的成功至关重要。但是,如果想要改变公司员工的商业行为,就必须选择那些与你希望促成的改变相关联的指标。如果衡量的指标与目标不相关,员工的商业行为就不会随之发生改变,这无异于浪费时间。更可怕的是,你可能还在沾沾自喜、自欺欺人地以为一切都干得还不错。这样是不可能成功的。

另外,数据指标之间的耦合现象也值得注意。譬如转化率 (访客中真正发生购买行为的比例)通常就是和购买所需时间 (客户需要花多长时间才能完成购买)相绑定的;二者相结合可以告诉你很多关于现金流的信息。类似地,病毒式传播系数 (viral coefficient,平均每个用户邀请来的新用户数)和病毒传播周期 (viral cycle time,用户完成一次邀请所需的时间)共同推动产品的普及率。当你开始探寻生意背后的关键数字时,就会注意到这些数据对;它们的背后隐藏着最重要的数据指标:营收、现金流,或产品普及率。

想要找出正确的数据指标,有五点需要牢记在心。

  • 定性指标与量化指标

定性指标通常是非结构化的、经验性的、揭示性的、难以归类的;量化指标则涉及很多数值和统计数据,提供可靠的量化结果,但缺乏直观的洞察。

  • 虚荣指标与可付诸行动的指标

虚荣指标看上去很美,让你感觉良好,却不能为你的公司带来丝毫改变。相反,可付诸行动的指标可以帮你遴选出一个行动方案,从而指导你的商业行为。

  • 探索性指标与报告性指标

探索性指标是推测性的,提供原本不为所知的洞见,帮助你在商业竞争中取得先手优势。报告性指标则让你时刻对公司的日常运营、管理性活动保持信息通畅、步调一致。

  • 先见性指标与后见性指标

先见性指标用于预言未来;后见性指标则用于解释过去。相比之下,我们更喜欢先见性指标,因为你在得知数据后尚有时间去应对——未雨绸缪,有备无患。

  • 相关性指标与因果性指标

如果两个指标总是一同变化,则说明它们是相关的;如果其中一个指标可以导致另一个指标的变化,则它们之间具有因果关系。如果你发现你能控制的事(比如播放什么样的广告)和你希望发生的事(比如营收)之间存在因果关系,那么恭喜你,你已拥有了改变未来的能力。

分析师特别关心那些能推动公司业绩增长的指标,即关键绩效指标 (KPI)。每个行业都有自己的关键绩效指标:如果你是餐馆老板,该指标是每晚用掉的桌布量(翻台量);如果你是投资者,该指标是你的投资回报率;如果你运营媒体网站,该指标是广告的点击率;等等。

定性指标与定量指标

不难理解,定量数据是指那些我们跟踪和衡量的数字,比如体育比赛的比分和电影的评分。每当进行排名、计数或衡量时,数据就被量化了。量化数据使用方便,具有科学性,也(假设你算得没错)易于归类、外推和置入电子表格。然而,量化数据在创业初期恰恰是最为匮乏的。你不可能在街上随便找个人问他有什么棘手的问题,然后就得到一个量化的答案。这时,你需要收集定性的数据。

定性数据是杂乱的、主观的、不精确的。它类似从采访或辩论中获得的信息,极难量化。如果定量数据回答的是“什么”和“多少”这样的问题,那定性数据回答的就是“为什么”。定量数据排斥主观因素;定性数据吸纳主观因素 。

最开始,你想要的只是一些定性数据。你取得的成绩并不以数字衡量。恰恰相反,你在和真人对话,确切来讲,你在和目标市场中的潜在用户对话。这意味着你在探索,你在突破固定思维 。

收集高质量的定性数据需要很多准备工作。比如你向潜在客户提出的问题就很有讲究,问题既要具体,又不能带有诱导性,使他们偏离初衷。在提问的过程中,还必须避免他们被你的热情和现实扭曲场所感染。准备不充分的客户访谈,可能会得出误导性或是无意义的结论。

虚荣指标与可付诸行动的指标

很多公司都声称自己是由数据驱动决策的企业。可惜,它们大多只重视这句互联网谚语中的“数据”,却很少有公司真的把注意力集中在“驱动决策”上。如果你有一个数据,却不知如何根据它采取行动,该数据就仅仅是一个虚荣指标。它毫无意义,唯一的作用是让人自我膨胀。你需要利用数据揭示信息,指明方向,帮助你改进商业模式,决策下一步的行动。

每当看到一个指标,就应该下意识地问自己:“依据这个指标,我将如何改变当前的商业行为?”如果回答不了这个问题,你大抵可以不用纠结于这个指标了。换言之,如果你并不明白哪个指标能够改变企业的行为,那你压根就不是在用数据驱动决策,而只是在数据的流沙里挣扎。

考虑这样一个例子:“总注册用户数”(或“总用户数”)其实就是一个虚荣指标,这个数字只会随着时间增长(经典的“单调递增函数”)。它并不能传达关于用户行为的信息:他们在做什么?是否对你有价值?他们中的很多人可能只是注册了一下,就再没有使用过。

“总活跃用户数”稍微好些,前提是你对“活跃用户”定义正确。但它依然是一个虚荣指标,也只会随着时间增长,除非你犯了什么严重的错误。

这里真正应该关注的指标,即可付诸行动的 指标,是“活跃用户占总用户数的百分比”(活跃用户占比)。这个指标揭示了产品的用户参与度,因而显得格外关键。当产品作出调整时,这个指标也会相应地变化。如果调整的思路是正确的,这个占比就应该上升。这就意味着,它可以指导你试验、学习和迭代。

另一个值得关注的指标是“单位时间内新用户的数量”(或“新用户增速”),它对比较不同营销手段的优劣往往很有帮助。举一个网上营销的例子:第一周将广告投放在Facebook上,第二周改投在社交新闻网站reddit上,第三周试试谷歌关键字(Google AdWords),第四周轮到了职业社交网站LinkedIn。在不同时间段进行对照试验得到的结果并不一定精确,但相对而言比较简单。3 更重要的是,它能指导你的行动:如果Facebook确实比LinkedIn更具广告效应,那么接下来该怎么做就不言自明了。

3 一个更好的办法是同时在这四家网站投放广告,使用数据分析将新用户分类。你在一周内就能得到答案,并且控制了其他变量,如季节变化。我们之后将详细介绍市场细分和同期群分析。

可付诸行动的指标不是魔法,它不会直接告诉你该做什么;在上面的例子中,你可以试着改变定价,替换广告媒介,或重写广告语。关键在于:你是在根据收集到的数据行动。

8个需要提防的虚荣数据指标(模式)

创业者容易迷恋“看上去很美”的单调增指标。以下是八个臭名昭著的虚荣指标,对它们敬而远之吧。

1. 点击量 。这是互联网洪荒年代所使用的指标,随便什么网站,只要上面可点的东西多,这个数字都会很高。相比之下,你更应统计点击的人数。

2. 页面浏览量(PV值) 。这个指标只比点击量稍好一点点,因其统计的是网页被访客请求的次数。除非你的商业模式直接与PV值挂钩(即展示广告),你还是更应统计(访问的)人数。

3. 访问量 。你的100访问量究竟来自于1个访问了100次的用户,还是100个访问了1次的用户?它无法指导行动。

4. 独立访客数 。只能显示有多少人访问了网页,却不能告诉你这些人在页面上做了什么?他们为什么停留?是否离开了?

5. 粉丝/好友/赞的数量 。计算粉丝/好友的数量只是一场毫无意义的人气比赛,除非你能让他们做对你有利的事。你在社交平台上振臂一呼时,有多少粉丝会响应?只有知道了这个数字,他们才对你有意义。

6. 网站停留时间(time on site)/浏览页数(number of pages) 。用这两个指标来替代客户参与度或活跃度并非明智之举,除非你的商业模式与这两个指标相绑定。而且,它们并非一定能说明问题。比如,客户在客服或投诉页面上停留了很长时间,不见得是什么好事。

7. 收集到的用户邮件地址数量 。有很多人对你的创业项目感兴趣,这很好。但是,如果不知道他们中有多少人会真正打开你的邮件(并为你邮件中的内容买单),纵使有再多人在你的邮件列表上也是枉然。更好的做法是:向一部分注册用户发送测试邮件,看他们是否会按照邮件中的提示去做。

8. 下载量 。尽管有时会影响你在应用商店中的排名,但下载量本身并不带来价值4 ;你需要衡量的是:应用下载后的激活量、账号创建量,等等。

4 付费应用除外。——译者注

探索性指标与报告性指标

阿维纳什·考希克是谷歌的数字营销先行者,同时也是一位作家。他认为美国前国防部长唐纳德·拉姆斯菲尔德早在冷战时期就对数据分析颇有见解。唐纳德曾说:

世界上的事物可以分为这样几类:我们知道我们知道的,我们知道我们不知道的;此外,还有我们不知道我们知道的,以及我们不知道我们不知道的。

图2-1描述了这四种信息。

00027.jpg

00027.jpg

图2-1:唐纳德·拉姆斯菲尔德发言中蕴藏的智慧

“我们知道我们不知道的”意味着某种度量行为,比如数钱、清点用户量、计算代码的行数都是度量行为。因为我们知道 我们不知道这一类指标的具体值,所以才要度量它。这一类指标可应用于核算(今天卖了多少小插件)或用于衡量试验的结果(红色的和绿色的小应用软件,哪个卖得更好)。不论以上哪种情况,我们事先都知道我们需要了解这些指标。

相比之下,“我们不知道我们不知道的”与创业的关系最紧密;它意味着在一系列探索之后,我们得到了一个能撼动市场的新产品。如下面的案例分析所示,创业公司“朋友圈”(Circle of Friends)正因使用了这个方法而找到了它的最佳消费群体——妈妈群体。“我们不知道我们不知道的”是创业魔法的真正所在。虽然以此为信条,你会走不少弯路,犯很多错误,可当你的想法恰到好处时,它能指引你如愿地“发现新大陆”。正如史蒂夫·布兰克所说:创业公司应该把时间花在探索并得出一个可扩展、可复制的商业模式上。

数据分析在唐纳德理论的四个象限中都有重要的应用,能够:

  • 检验我们手头上的事实和假设(如打开率或转化率),以确保我们不是在自欺欺人,我们的商业计划是切实可行的;
  • 验证我们的直觉,把假设变成证据;
  • 为业务预测表、瀑布式开发流程图和董事会议提供数据;
  • 帮助我们发现黄金机遇,大展宏图。

在创业早期,“我们不知道我们不知道”的东西为最重要,它们会转变为未来的秘密武器。

“妈妈圈”的成功之路(案例分析)

“朋友圈”的构想很简单:它允许你将Facebook好友分类到不同的圈子,以便进行指定圈子的分享。2007年9月,在Facebook发布开发者平台后不久,麦克·格林菲尔德等人共同创办了这家公司。这个时机近乎完美:Facebook正在成为一个极速获取用户的病毒式开放平台,同时也成就了很多创业公司。在这之前,从没有一个平台像Facebook一样既拥有巨大的用户数量,又如此开放(当时Facebook已有约5000万用户)。

到2008年中期,“朋友圈”已经拥有1000万用户。麦克视用户增长为首要使命,他说“这就像是在抢地盘”,“朋友圈”显然已在病毒式传播。然而,一个问题出现了:只有很少的用户在真正地使用这个产品。

麦克发现,只有不到20%的圈子在创建后有过活动的迹象。“1000万的注册用户每月能为我们带来几百万的独立访客数,可我们深知这个成绩对于一个通用社交网络来说还不够好。一旦收费,变现效果可能不佳。”

麦克开始探寻背后的原因。

他首先查看了用户数据库,想搞清楚用户们都做了些什么。当时,公司还没有一套可以做深度数据分析的系统,但这并不妨碍麦克进行一些探索性的分析。最后他发现,有一个用户群体在其他群体活跃度较低的情况下,撑起了整个产品的用户参与度——这就是妈妈群体。以下是他的发现:

  • 妈妈群体之间所发的站内信平均比其他站内信长50%;
  • 她们在帖子中附图片的概率比其他人群高115%;
  • 她们在Facebook上进入多回合深入对话的概率比其他人群高110%;
  • 她们的好友在被邀请入应用后,成为高参与度用户的概率比其他用户高50%;
  • 她们点击Facebook提醒的概率比其他人群高75%;
  • 她们点击Facebook新鲜事内容的概率比其他人群高180%;
  • 她们接受应用邀请的概率比其他人群高60%。

这些数字实在是太有说服力了。于是,在2008年6月,麦克和他的团队完全调整了产品重心,作出了关键转型。2008年10月,他们在Facebook上发布了“妈妈圈”社交产品。

起初,由于产品的大转型,各项数据都有所下降。然而,到2009年底,“妈妈圈”的社区用户数已增至450万;与那些在转型中丢掉的用户不同,这些都是些参与度很高的活跃用户。在这之后,Facebook开始限制站内应用通过其平台进行病毒式传播,过分依托Facebook推广的“妈妈圈”也是几经沉浮。最终,它摆脱Facebook,成立了一个独立的网站,并于2012年初被Sugar公司收购。

总结

  • “朋友圈”这个社交图谱应用出现在了正确的时间(Facebook刚启动开放平台时)和正确的地点(Facebook站内应用),只是找错了市场。
  • 通过分析用户的行为模式和理想行为的分布,发掘高活跃度用户的共同点,公司找到了与自身产品相匹配的市场。
  • 在找准目标以后,不遗余力地聚焦,直至更改产品名称。要么坚定地转型,要么缴械投降,准备好放弃部分已有的成就,这就是“妈妈圈”成功的秘诀。

数据分析启示

麦克成功创办“妈妈圈”的关键在于,他有能力深入挖掘数据,寻找有意义的用户行为模式和机遇。麦克发现了一个“他不知道自己不知道”的事实,这促使他下了大赌注,听起来骇人却颇显胆识(放弃面向所有人的“朋友圈”转而深耕于一个特定的人群/市场)。毫无疑问,这是一次赌博,但它以调研数据为基础。

想要让一款社区产品极速启动就需要相当高的用户参与度。不温不火的用户表现无法提供足够的“逃逸速度”,让你的产品冲上云霄。在这种情况下,更好的做法是:在一个更小的、更容易触及的目标市场中培养更多具有黏性的高活跃度用户。病毒式传播需要专注。

先见性数据指标与后见性数据指标

无论先见性指标还是后见性指标都是有意义的,只不过解决的问题不同。

先见性指标(或称先见性指示剂 )可用于预测未来。比如,透过“销售漏斗”中现有的潜在客户数,你能大致预测将来所能获得的新客户数。如果目前潜在客户很少,那么将来也不会增加多少新客户。眼前,你可以努力增加潜在客户,这样将来就能得到更多的新增客户。

另一方面,后见性指标能提示问题的存在,比如用户流失 (即某一时间段内离开某产品或服务的客户量);不过,等到你有机会收集数据,找出问题,往往为时已晚。已流失的用户不会再回头。但是,这并不意味着你就只能眼睁睁地看着后见性指标而无可作为(比如,你可以尝试降低用户流失率,再测试是否见效),只不过这有点像亡羊补牢:你不会再丢新的羊,但已丢失的找不回来了。

创业之初,你所拥有的数据不足以预测未来,这时可以先关注后见性数据。在这个阶段,后见性数据还比较管用,可为你产品的表现提供一个基准。如果要启用先见性数据指标,你需要首先进行同期群分析并比较客户对照组在不同时间段的表现。

举一个用户投诉量的例子。你可以跟踪每日接到的客服电话数,这个数字不能太小,以保证统计学价值。在这之前,你可能以90天为期来跟踪用户投诉量。以上二者均可以作为用户流失的先见性指示剂:如果投诉量增加,很有可能更多的客户会停用你的产品或服务。作为一个先见性指示剂,客户投诉还能帮你深入了解产品和服务的真实状况,分析投诉量上升的原因,然后解决问题。

有关账号注销和产品退货的数据是很重要的指标,只不过比较滞后。它们能精确地指出问题所在,但为时已晚,用户已经离开。用户流失量是非常重要的数据指标(贯穿全书),但如果只是目光短浅地看待它,反而不能如你所愿地提高迭代和产品调整的速度。

“指示剂”无处不在。在一个企业级软件公司,就销售业绩而言,季度新订单量是一个后见性指标。相对应地,新增潜在客户量是一个先见性指标,它能帮助你提前预测未来的销售业绩。不过,任何在B2B销售领域工作过的人都会告诉你,除了培养有价值的潜在客户外,你还需要对潜在客户转化率和销售周期有很好的把握。只有这样,你才能对销售前景做务实的预判。

在一个公司中,某一团队的后见性指标有时是另一个团队的先见性指标。例如,季度订单量对于销售团队而言是一个后见性指标(合同已经签订了),但对于财务部门来说,它是一个可以指示营收预期的先见性指标(因为客户还没有支付合同金)。

最后,你需要确定你所跟踪的这些数据是否能真正帮助你更好更快地做出决定。如上所述,一个真正的数据指标必须是可付诸行动的。后见性和先见性的数据都可以指导行动,区别只是先见性数据能预示将来会发生什么,缩短迭代周期,精益求精。

相关性指标与因果性指标

在加拿大,冬季轮胎的使用率和交通事故的减少量是一对相关数据。人们会在寒冷的季节换上更软的冬季轮胎,而夏天是交通事故的高发季。5 这是否意味着我们应该要求加拿大的司机一年四季都装着冬季轮胎?当然不是,因为软轮胎在夏天的刹车性能很差,会导致事故量增加。

5 http://www.statcan.gc.ca/pub/82-003-x/2008003/article/10648/c-g/5202438-eng.htm

实际上,很有可能有一些其他的因素导致了夏天事故率的上升,如开车时间的延长和暑假的来临。仅仅关注单一的关联而不追溯因果关系会导致错误的决定。比如,冰激凌的消费量和意外溺亡人数具有相关性,难道这意味着我们应该禁止销售冰激凌来避免意外溺亡吗?或者以冰激凌销售量预测殡仪馆的股价走势?当然不是:冰激凌消费和意外溺死率的升高都是因为 夏天来了。

在两个数据指标之间发现相关性不是一件坏事,发现相关性可以帮助你预测未来,而发现因果关系 意味着你可以改变未来。通常,因果关系并不是简单的一对一关系,很多事情都是多因素共同作用的结果。在加拿大夏天交通事故增加的例子中,我们需要考虑酒精消费量、新手司机数量、白昼变长和暑假等因素。所以,现实中很难找到100%的因果关系。你会掌握一些独立的数据指标(分析多个独立的数据指标作为自变量),其中每个都能在一定程度上“解释”某个依存的数据指标(因变量)。但是,即便只发现部分因果关系也是很有价值的。

你可以通过如下方法来证明一个因果关系:找到一个相关性,进行控制变量试验并测量因变量的变化。这是一项很有挑战性的工作,因为没有两个客户是相同的,所以你很难在试验中控制输入的一致性。在现实中,想要让有统计学意义的一大批被试客户都满足试验的良好控制条件几乎是不可能的。

如果拥有一个足够大的用户样本,你甚至可以不用太考虑变量控制就能完成一个很可靠的测试,因为其他自变量对因变量的影响最终会被样本数量拉平,这就是为什么谷歌有能力测试超链接颜色等细微影响因素6 ,为什么微软能够很明确地知道网页加载速度快慢对搜索量的影响7 。但是对于大多数创业公司而言,你需要尽量简化你的测试,在很小的样本容量下进行试验,并比较这些测试为你的生意带来的改变。

6 http://gigaom.com/2009/07/09/when-it-comes-to-links-color-matters/

7 http://velocityconf.com/velocity2009/public/schedule/detail/8523

我们之后将看到一些不一样的测试和细分种类,不过现阶段你只需要知道:相关性很好,因果性更佳。有时,你只能找到一些相关性,但你永不应停止寻找因果性。

移动的目标

你在早期所选定的目标往往是尝试性的,不是板上钉钉。你追逐的是一个移动的目标,因为此时你根本无法定义何为成功。

在创业过程中,调整目标和关键数据指标都是可行的;只要你能够做到实事求是,了解此番调整对企业的影响,而不是无视事实,降低期望值,得过且过。

你的最初版产品(最小可行化产品)面市之初,你还在获取产品的早期接受者,测试他们对产品的使用体验,这时你甚至不知道他们会用你的产品来做什么(尽管你在脑子里有一些假设)。有时用户对你的产品的真实用法会和你的假设大相径庭。你可能以为大家愿意玩你的多媒体游戏,结果却发现他们只把你当成了一个照片上传服务。不相信?这就是图片分享网站Flickr创业初期的真实故事。

然而,你的假设和用户真实行为之间的差别有时会更细微。你可能以为只有做到让用户每天都使用你的产品才能成功,结果却发现并不是这样。在这些情况下,及时调整你所观察的指标是明智之举,前提是你能证明此举的意义。

HighScore House对“活跃用户”的定义(案例分析)

HighScore House始于一个简单的应用程序:家长能通过它罗列出希望孩子们完成的家务活及挑战,为其打分;而孩子们则能完成任务,获取分值,并将这些虚拟的分值兑换成他们想要的奖励。

当HighScore House发布他们的最小可行化产品时,有几百个志愿家庭愿意参与内部测试。当时,几位创始人摸着石头过河,为最小可行化产品的成功下了这样的定义:家长和孩子每周每人使用产品至少四次。达到这一阈值的家庭称为“活跃用户”。这个成功的标准定得很高,但清晰扼要。

然而,一个多月过去了,活跃家庭的百分比他们预期目标的要低。几位创始人很失望,但决心继续试验下去,努力提高用户的参与度:

  • 他们调整了注册流程(使之更明了、更富教育软件特色以吸引高质量用户;同时,使用户更容易上手);
  • 他们给家长发送每日邮件提醒;
  • 他们根据孩子在系统中所触发的行动,给家长发送事务性邮件。

虽然每一个新的尝试都为产品带来了一些改善,但都没能充分地推动产品使创始团队宣称:产品成功了。

这时,创始人之一、时任CEO的凯尔·希曼做出了一个关键的决定:他拿起了电话 。凯尔与几十位家长通了话,从那些已注册却并不活跃的家长们开始。首先,他打给那些完全抛弃了High Score House的家长(所谓的流失用户),了解到很多人离开的原因是HighScore House解决的并不是他们的紧要问题。这没什么大不了的,创始团队从未假设过这款产品适用于所有家长——对于一个创业产品而言,“所有家长”这个市场显然定义得过大了。凯尔将精力放在寻找家长中的一个子市场,一个能认同HighScore House价值的家长人群,方便他聚焦于更加细分的领域。

接下来,凯尔给那些正在使用HighScore House,但不够活跃的家庭去了电话。他们中的很多家长都对产品给予了正面评价:“我们在使用HighScore House。它是一个很棒的产品。因为有了它,我的孩子终于能够坚持每天叠被子了!”

从这些家长处得到的回应令创始团队十分惊喜。尽管他们中的大多数每周仅使用HighScore House一到两次,但这已经足以使他们认可产品的价值了。从这些电话访谈中,凯尔学到了细分市场,了解了产品对哪类家庭更具吸引力。他开始认识到,他们一开始设定的划分活跃/ 非活跃用户的准绳实际上并不能很好地反映实际用户的参与度。

这并不是说HighScore House团队不该在一开始提出这样一条准绳。如果没有那个设想,他们也就不会为了修正准绳而学到这些东西,凯尔也不可能拿起电话。然而现在,他真正地理解了他的用户,定量数据与定性数据相结合是他成功的关键。

在这次经验的基础上,HighScore House团队重新定义了区分“活跃”和“非活跃”用户的阈值,用以更好地反映现有用户的行为。在这个案例中,调整关键指标对HighScore House团队而言是可行的,因为他们真正理解此举的原因,并且能够应对随之而来的变化。

总结

  • HighScore House团队过早、过于激进地划了一条用于区分用户活跃度的准绳——一个不可能完成的任务;
  • HighScore House团队通过快速试验提高了活跃用户的数量,但是活跃用户的百分比总体没有很大提高;
  • 他们开始明智地拿起电话联系客户,发现那些低于假设“活跃度”阈值的用户能够从产品中获取很大价值。

数据分析启示

首先,了解你的客户。没有比直接与客户和用户对话更有效的手段了。任你得到的数据再多,它们也解释不了事情发生的原因。现在就拿起电话拨通一位客户的号码,即使是一位参与度不高的用户,也会对你很有帮助。

其次,尽早做出一些假设并定下你认为可称为“成功”的目标,但切忌在试验中迷失自己。如果需要,可以降低指标的阈值,但并不是为了制造达到这个阈值的假象:这样只会自欺欺人。使用定性数据来理解你为用户创造的价值是什么。只有调整后的阈值或准绳可以更好地反映(某个细分市场中的)用户使用产品的习惯,调整才是合理的、必要的。

市场细分、同期群分析、A/B测试和多变量分析

测试是精益数据分析的灵魂。通常,测试就是通过市场细分、同期群分析或A/B测试来比较两个样本的不同。对于需要通过科学的比较法来证明某种改变合理性的人来说,这些概念都显得格外重要。我们下面就将对其进行深入的讨论。

市场细分

简言之,细分市场就是一群拥有某种共同特征的人。共同特征可以是:使用火狐浏览器,喜欢去餐馆前先预约,坐头等舱,或者家里有孩子并且开多功能休旅车。

以运营网站为例,你需要根据一系列的技术、人口信息对访客进行细分,然后比较各个细分市场之间的差异。如果发现“使用火狐浏览器”群体的购买行为明显少于其他群体,你可以通过进一步测试找出背后的原因。如果有特别多的高参与度用户来自澳大利亚,你就可以开展调查,找出原因,再将成功要素复制到其他人群中。

市场细分不仅可应用于网站,它对任何行业、任何形式的营销都大有裨益。美国的直邮营销(通过传统纸质信件进行的营销)早在几十年前就开始了市场细分的实践,并取得了巨大成功。

同期群分析

市场细分之外的第二种分析方法是同期群分析,比较的是相似群体随时间的变化。产品会随着你的开发和测试而不断迭代,这就导致在产品发布第一周就加入的用户和后来才加入的用户有着不同的体验。比如,每个用户都会经历一个生命周期:从免费试用,到付费使用,最后停止使用。同时,在这期间里,你还在不停地对商业模式进行调整。于是,在产品上线第一个月就“吃螃蟹”的用户势必与四个月后才加入的用户有着不同的上手体验。这对用户流失率会有什么影响?我们用同期群分析来寻找答案。

每一组用户构成一个同期群,参与整个试验过程。通过比较不同的同期群,你可以获知:从总体上看,关键指标的表现是否越来越好了。下例说明同期群分析对创业公司的重要意义。

假设你经营着一家网店。你每月能获取1000位新客户,他们每人都会买一些东西。表2-1显示了前五个月中平均每位客户带来的营收。

表2-1:5个月平均每位客户营收

1月 2月 3月 4月 5月
客户总数 1000 2000 3000 4000 5000
平均每位客户营收 5美元 4.5美元 4.33美元 4.25美元 4.5美元

然而,表格传达的信息十分有限。网店的生意究竟是日益红火还是每况愈下?这并不容易回答,因为你并没有对比新客户和老客户的表现;而且,在这个表格中,新客户和5个月前注册的老客户的数据是混在一起的。这几组数据仅显示:营收在经历小幅下降后又回升,而平均每位客户带来的营收值几近均一。

现在,仍旧使用相同的数据,但根据客户首次光顾的时间按月进行分段。在表2-2中,我们可以发现一些重要的变化。在第五个月光顾网店的客户,其首月平均消费为9美元——是第一个月光顾客户消费额的近2倍。这是一个巨大的增长!

表2-2:按照客户首次光顾月份比较营收

1月 2月 3月 4月 5月
新客户数 1000 1000 1000 1000 1000
总客户数 1000 2000 3000 4000 5000
第1个月 5美元 3美元 2美元 1美元 0.5美元
第2个月 6美元 4美元 2美元 1美元
第3个月 7美元 6美元 5美元
第4个月 8美元 7美元
第5个月 9美元

同期群的概念还可以表现为,根据用户的体验划分数据。在表2-3中,我们根据用户在网店上的“店龄”来划分数据。这显示了另一个重要的数据指标:用户消费是如何自首月起迅速衰减的。

表2-3:营收数据的同期群分析

同期群 使用月份
1 2 3 4 5
1月 5美元 3美元 2美元 1美元
2月 6美元 4美元 2美元 1美元
3月 7美元 6美元 5美元
4月 8美元 7美元
5月 9美元
平均值 7美元 5美元 3美元 1美元

同期群分析为我们提供了一个更加清晰的视角。如前例所示,前几个月中用户变现的疲软表现已经损害到了网店营收指标的总体状况。1月份的同期群(表2-3第一行)首月消费了5美元,然后逐月递减,到第五个月仅消费0.5美元。不过,随着网站的发展,新客户的首月花费有显著增长,接下来的消费下降趋势也有所缓解:4月份的同期群在首月消费8美元,次月消费7美元。如果只看表2-1,网店的发展似乎进入了瓶颈,但经过同期群分析得出,实际上网店正在茁壮成长。而且,你还明白了值得关注的关键数据:在首月注册消费后,客户消费的递减量。

同期群分析使你能够观察处于生命周期不同阶段客户的行为模式,而非忽略个体的自然生命周期,对所有客户一刀切。同期群分析适用于营收、客户流失率、口碑的病毒式传播、客户支持成本等任何你关注的数据指标。

A/B和多变量测试

如表2-2中所示,比较不同群体的同期群试验被称为纵向 研究,因为数据是沿着 客户群体的自然生命周期收集的。相对应地,横向 研究指在同一时间段对不同被试群体提供不同的体验。例如,向半数用户展示一个绿色链接,对另一半用户展示蓝色链接,观察哪种颜色的链接点击率更高就是一种横向研究。假设其他条件保持不变,仅考虑体验中的某一属性(如链接的颜色)对被试用户的影响,就是A/B测试。

你可以测试产品的所有细节,但最好首要关注那些关键的步骤和假设。A/B测试的结果会为你带来巨大的回报。众筹公司Picatic的创始人之一杰·帕玛对此深有体会。他将用于触发访客行为的立即试用产品 链接文字从“免费开始”改成了“免费试用”,仅仅这一简单的改动,就使链接点击率在10天内飙升了376%。

A/B测试看似简单易行,实则有一个软肋。只有用户流量巨大的大型网站(如微软必应、谷歌)能对单一的因素(如链接颜色、网页速度)进行测试并迅速得到答案。如果没有庞大的用户流量,你将需要测试很多因素。这可能包括网页的色调,触发用户行为的链接文字,图片效果等。

进行一连串的单独测试会延长你走向成熟的周期。与其如此,不如采用多变量分析法 同时对多个属性进行测试,其原理为,用统计学方法剥离出单个影响因子与结果中某一项指标提升的相关性。

图2-2展示了四种划分用户并进行分析或测试的方法。

00031.jpg

00031.jpg

图2-2:同期群、细分市场、A/B测试和多变量分析

精益数据分析周期

精益数据分析的核心在于如何找到一个有意义的指标,然后通过试验改善它,直到令你满意;之后,转而解决下一个问题,或步入创业的下一个阶段。整个周期如图2-3所示。

00035.jpg

00035.jpg

图2-3:强数据分析型创业公司所经历的生命周期

最终,你将找到一个可将续、可复制、持续增长的商业模式,并且学会如何迭代它。

本章涵盖了大量有关数据指标和分析方法的背景知识,即时将其理顺可能是个不小的挑战。简言之,本章讨论了:

  • 什么是好的数据指标;
  • 什么是虚荣指标,如何规避它;
  • 定性指标和定量指标的区别,探索性指标和报告性指标的区别,先见性指标和后见性指标的区别,相关性指标和因果性指标的区别;
  • 什么是A/B测试,为什么多变量测试更常用;
  • 细分市场和同期群之间的区别。

接下来,我们将会把这些问题具体到各种商业模式和初创企业的不同成长阶段中进行讨论。

对你所跟踪的数据指标进行评估(练习)

找出并写下你一丝不苟地遵循并每天回顾的三到五个关键数据,回答以下问题:

  • 哪些是好的数据指标?
  • 哪些指标帮助你进行商业决策,又有哪些是虚荣指标?
  • 你能剔除那些不能为你带来任何价值的指标吗?
  • 是否存在你尚未想到但可能更有意义的指标?

划掉那些不好的指标,并把新发现的指标加到你的列表里。在阅读本书的过程中,都要坚持这样的思考和行动。

powered by Gitbook该文件修订时间: 2020-03-05 17:42:59

results matching ""

    No results matching ""