第 4 章 以数据为导向与通过数据获取信息

数据很强大,甚至能够让人走火入魔,陷入过度分析的渊薮。但实际上,更多时候我们还是基于早先的经验和实践,靠本能在无意识中做出决策。这其实不无道理,毕竟在日常生活中我们靠的就是直觉和经验,而不是严密的数学分析。你总不至于靠A/B测试决定今天早上穿什么裤子,倘若真用的话,恐怕你这一天都出不了门了。

精益创业也面临很多批评的声音,其中之一就是过于以数据为导向。这些批评认为创业不应沦为数据的奴隶,而应将其作为工具;不应被数据牵着鼻子走,而应通过数据获取信息。之所以会出现这样的批评,大都是因为批评者太懒,还反过来为自己的避重就轻开脱。但有些时候这些人的顾虑也不无道理:滥用数据容易导致局部优化,进而忽视大局,这是极其危险乃至致命的。

考虑这样一个案例:在线旅行社Orbitz曾通过数据发现Mac用户比PC用户更有可能预订较为昂贵的酒店,其首席技术官罗杰·里欧就曾在《华尔街日报》的一篇报道中提到:“我们发现Mac用户预订四至五星级酒店或较昂贵房间的概率比PC用户高40%,而且有数据支持这一点。”1

1 http://online.wsj.com/article/5B100014240527023044586045774888225667325882.html

一方面,如果分析数据的算法忽略了某个貌似无关的数据(譬如在该例中,网站访客是否为Mac用户),就失去了一个增加营收的机会。另一方面,如果算法一味盲目地根据客户数据优化产品,置其他与销售相关联的因素于不顾,则有可能导致意料之外的结果,如糟糕的公关。单纯依靠机器,以数据为导向进行的产品优化会导致许多问题发生。

早在许多年前,数据分析巨头Omniture的前市场总监盖尔·恩尼斯就曾告诉笔者,作为其内容优化软件的客户,笔者必须坚持用人类的判断来调和机器的自动优化。如果单纯依靠Omniture公司的软件,很快就能算出,网页上衣着暴露的女人图片带来的点入率远比其他形式的内容高得多。但这样得来的高点入率只会是短期的成功,迟早会被其对品牌形象造成的损害所抵消。所以,Omniture软件的背后还有专职的内容运营人员负责在大局上把关,同时为机器的自动测试提供素材元。人类提供灵感,机器负责验证 。

在数学上,局部最大值点的定义是函数在给定邻域内最大的取值2 。也就是说,局部最大值并不是你能取到的最大值,只是在某一范围内最大。这可以类比为群山中的一汪湖水,湖水的水位并不如海平面那么低,但已然是群山中的最低点了。

2 http://wikipedia.org/wiki/Maxima_and_minima

优化的核心是找到给定函数的最大值或最小值。机器虽然具备一定寻找最优解的能力,但其解的范围不可能超过约束条件所规定的区间。这和群山中湖水的最低水位不如海平面那么低有异曲同工之妙,周围的限制导致湖水只是群山中的最低点。

为了使受到限制的优化更易理解,请想象有人给你三个车轮,并要求你制造出最好、最稳定的交通工具。在对不同车轮布局进行迭代之后,你想到了一个类似三轮车的配置。这就是最佳的三轮配置。

以数据为导向的优化在进行迭代式的产品改进方面没什么问题,问题在于它不会告诉你:“嘿!你知道吗?四个车轮比三个更好!”数学在优化已知系统方面可以做得很好,而人类更善于发现新的系统。换言之,渐进式的改变可以达到局部极限,创新则可能导致全局洗牌 。

在《伊甸园之河》(Basic Books)一书中,理查德·道金斯3 用一条流淌的河作为比喻来介绍进化。他在书中解释道,生物的进化创造出了眼这一器官。事实上,进化创造出了数十种不同的眼:黄蜂的、八足类动物的、人类的、鹰的、鲸鱼的,等等。进化的缺点是没法倒退的,只要进化到够用的程度,细微的基因突变就无法使视力得到进一步提升。人类之所以进化不出鹰那样的双眼,是因为人类视觉系统在向鹰的视觉系统衍化时会导致视力的下降,进而不会被进化所选择。

3 牛津大学生物学家。——译者注

单纯依靠机器的优化与进化具有相似的局限性。如果优化只是为了取得局部的极限,那代价可能是错失一个更大、更重要的机会。人的职责就是在数据优化的背后做个聪慧的设计者。

在我所认识的创业者中,有许多人都对完全基于数据的创业有一种天生的抵触。他们更愿意相信自己的直觉。他们不喜欢毫无灵魂、单纯机械式的优化,而是深知需要放眼更大的市场,重视正在解决的问题以及基础商业模式。

归根结底,数据是检验假设的极佳工具,除非结合人类的反思,否则很难在产生新假设方面有建树。

数据科学家的思维方式(模式)

莫尼卡·罗加蒂是LinkedIn公司的一位数据科学家,她根据经验总结出了10条创业者需要避免的数据圈套。

1. 假设数据没有噪声 。为获取的数据去噪是很耗时的一道工序,而回报通常是巨大的,往往简单的一步去噪就可能揭示重要的规律。莫尼卡问:“一次统计工具故障是导致你30%数据无效的真凶吗?你真的有那么多邮编是90210的用户吗?”在卷起袖子分析之前,先好好检查你的数据是否有效、实用。

2. 忘记归一化 。譬如,统计一个热门婚礼目的地列表。你大可以统计每个城市每年有多少人乘坐飞机来结婚,但如果不根据该城市每年的旅客量进行归一化,你得到的只会是一个热门旅游城市列表。

3. 排除异常点 。那21个每天使用你产品超过一千次的用户要么是你产品最大的粉丝,要么是自动浏览网络的程序。不论他们是什么,简单将其排除不讨论都是不妥的。

4. 包括异常点 。尽管那21个每天使用你产品一千多次的用户从定性的角度讲十分有趣,因为其揭示了一些你意料之外的事情,但不适合用于建立一个普适的模型。莫尼卡提醒到:“你在打造基于数据的产品时,或许会需要排除这些点。不然,网站的‘猜你喜欢’功能会给所有人推荐相同的东西:你的忠实粉丝所喜欢的东西。”

5. 忽视季节性 。“哇,‘实习生’是今年增长最快的职位吗?噢,等一等,现在是6月。”在寻找规律时未能考虑一天中不同时间、一周中星期几、一年中不同月份对数据的影响,会导致糟糕的决定。

6. 抛开基数侈谈增长 。基数很关键。如莫尼卡所说:“你的产品刚上线时,从严格意义上讲,你爸爸注册一个账号也可以使你的用户量翻倍。”

7. 数据呕吐 。如果你不知道什么数据对你更重要,那么即便你的数据统计板再大也没有用。

8. 谎报军情的指标 。你希望做到快速响应,于是设置了很多警报,在任何数据看起来不正常时都给你提醒,以保证能够快速处理。但倘若设置的阈值过于敏感,警报就会不停地聒噪,你也会渐渐开始无视各种异常。

9. “不是在这儿收集的”综合征 。莫尼卡说:“将你的数据与其他来源的数据合在一起能带来很多独到的见解。高质量客户的邮编地址是否集中于寿司店多的地区?”这可能给你带来极好的新想法用于试验,甚至影响你的增长决策。

10. 关注噪音 。“人类与生俱来的模式识别能力,容易使我们误以为无规律的事物是有规律的,”莫尼卡提醒创业者,“把虚荣指标放在一边,退后一步,站在更高的角度看问题。”

精益创业与大愿景

有些创业者对数据极度痴迷,几乎到了强迫症的程度,陷于数据分析中跋前疐后,不知所措;另一些则过于随意,拍脑瓜做决策,只看对自己有利的数据,转型信马由缰。这种二分背后的根本原因,也是精益创业理论所面临的最大质疑:你如何在只开发一个最小可行化产品的同时保持一个大的愿景?

现在不少创业者都把精益创业作为在没有愿景的情况下就创业的借口。“如今创业太简单了,”他们辩解道,“门槛已经低到了所有人都可以一试的程度,不是吗?”然而抱有一个大愿景仍然是很重要的:没有愿景的创业太容易受外界的干扰,客户、投资人、竞争者、媒体的任何风吹草动都可能影响你的决策。没有大的愿景,创业将变得缺乏目的,时间久了,你就会发现你其实只是在漫无目地游走。

如果一个大的、坚实的、无畏的愿景很重要,带有挑战世界的梦想,那这跟走一步看一步、不停质疑自身的精益创业方法又该如何兼容呢?

答案其实很简单。你只需把精益创业当作达成创业愿景的必经过程。

笔者偶尔会提醒处于创业早期的创业者:在许多方面,他们并不是在打造一个产品。他们在打造一个能帮助他们认知到“究竟该打造什么”的工具 。这有助于他们从繁琐的界面、代码、邮件列表中,提炼出手头真正重要的任务:找到一个可持续的商业模式。

精益创业把认知放在高于一切的位置,并鼓励发散思维、积极探索、试验求证。精益创业不等于不假思索地重复“开发→测试→认知”循环,而在于真正理解发生了什么并接受新的可能性。

要精益,但不能小。一些和笔者谈过的创业者说他们想要成为省内或市内领先的服务商。为什么不是世界领先?二战中的同盟国都必须建立滩头堡,但选择诺曼底登陆并不意味着同盟国缺乏大的愿景。他们只是找到了一个很好的起点而已。

有些人以为精益创业鼓励的是着眼于小处,但事实上,如果使用得当,精益创业有助于扩大 你的视野,因为它鼓励你质疑一切。当你深挖、更深刻地了解到你在做什么时,不论你是在考虑问题、解决方案、客户,还是营收,都很可能比预期中找到的还要多。如果你觉得它能给你带来一些机会,那么可以扩大你的视野并理解如何能够更快地达到你的目标。

powered by Gitbook该文件修订时间: 2020-03-05 17:26:56

results matching ""

    No results matching ""