指标不是用户
为什么优化指标会阻止你看见用户

概要: 古德哈特定律和坎贝尔定律表明,指标如何逐渐偏离现实。当团队过于追逐某个数字时,这个信号不再代表用户,而是开始奖励那些让仪表盘发生变化的行为。
在某个时刻,你的团队决定用某个指标来判断产品是否运转良好。也许是日活跃用户数,也许是留存率、NPS(净推荐值)、会话时长,或某种参与度评分。这个选择是合理的。这个数字看起来足够接近你所关心的东西。然后它成了目标。人们开始朝着它努力。我见过这种情况在冷静、理性的会议中发生,而这正是问题的一部分。
在这个过程中,没有人宣布,那个数字不再是信号,而是开始驱动工作。
没有一个清晰的失败点可以在事后圈出来。它发生在冲刺评审、路线图会议和 A/B 测试汇报中。没有人说他们想停止关心用户。这个度量慢慢变成了目标本身,而背后的人开始从对话中淡出。仪表盘看起来很健康。产品可能并非如此。
数字不再显示用户
经济学对此有一个清晰的名称。当一个度量变成目标时,它就不再是一个好的度量。经济学家 查尔斯·古德哈特 在 1975 年研究货币政策时发现了这一点。一旦一个度量被用来指导决策,人们就开始针对度量本身进行优化。他们不再关注它曾经指向的事物。联系开始松动,然后断裂。
社会科学家 唐纳德·坎贝尔 对此有更精辟的表述:
任何用于社会决策的量化社会指标,越容易受到腐败压力的影响。
— 唐纳德·T·坎贝尔
坎贝尔当时在写政府项目和教育政策。这也同样适用于许多季度评审。
这个模式比软件更早出现。当英国殖民当局在印度悬赏蛇头以减少眼镜蛇数量时,当地企业家开始养殖眼镜蛇来领取赏金。当政府发现后取消了这个项目,养殖者释放了他们现在一文不值的蛇。眼镜蛇的数量最终比之前更多了。指标被完美地优化了。目标却变得更糟。
这种偏离不需要作弊。它靠的是正常工作。设计师推动界面追求点击量,因为点击量被追踪了。工程师发布那些拉长会话时长的功能,因为那条线在仪表盘上。产品经理推掉了那些对用户有帮助但不会推动目标的工作,因为目标是衡量进步的标准。每个人都在做他们面前的工作。几个冲刺之后,使用产品的人几乎不在对话中了,而仪表盘仍然是绿色的。
杰里·穆勒用一整本书来讨论这个问题。《指标的暴政》 记录了同样的模式出现在医院、学校、警察局和大学中。数字代替了它曾经追踪的东西。大多数人没有注意到,直到差距变得太大而无法隐藏。
Facebook 也发现了这个问题
2018 年,Facebook 的内部研究团队制作了一份演示文稿,警告说新闻推送算法正在利用他们所称的"人类大脑对分裂性的吸引"。
Facebook 一直在优化参与度:反应、评论、分享。那是目标。它奏效了。参与度上升了。愤怒的内容也增加了,因为愤怒能快速引发反应。虚假信息也因为同样的原因传播开来。研究团队提出了修复方案。公司没有以解决根本问题的方式采纳这些改变,同时参与度仍然是业务运作的核心。
这在 2021 年被揭露出来,当时 弗朗西斯·豪根 向《华尔街日报》分享了内部文件。这些文件显示,Facebook 的研究人员理解这个问题,并用清晰的语言将其记录下来。但指标仍然继续获胜。
古德哈特定律不仅扭曲了指标,它也可能扭曲那些长期将其视为事物运作证明的人的判断。
问最坏的情况
指标是有用的。当团队把指标当作用户时,问题就开始了。
在任何指标作为目标放到仪表盘上之前,问一个问题:某人达成这个数字的最坏方式是什么?有什么能让数字上升,同时让产品对那些不盯着图表的人来说变得更差?
如果你能回答这个问题,你就找到了等待你的失败模式。如果团队继续追逐这个数字,它迟早会出现。这是关于尽早看到差距,在你还能做点什么的时候。我喜欢这个问题,因为它让团队在发布之前大声说出丑陋的版本。
指标不是用户
当团队停止与用户交谈时,指标会更快地偏离现实。当数字看起来不错时,人们就不太有压力去检查了。仪表盘创造了一种安静的信心。事情看起来很好,所以人们就假设它们确实很好。
与此同时,用户在适应。他们建立了变通办法。他们忍受着没有人修复的摩擦。有些人已经接近离开了。图表可能看起来很健康,而支持工单却一直在积累同样的投诉。你在图表上看不到这些,直到下降出现时已经太晚了。
避免这种情况的团队并没有神奇的指标。他们在数字看起来不错时进行可用性测试。他们在留存率看起来健康时阅读支持工单。不是因为他们讨厌数据。而是因为他们知道数字和实际体验可能会长时间偏离。当仪表盘告诉他们可以放松时,他们仍然继续观察,我对这样的团队更有信心。
指标最初是一个信号。然后它取代了用户的位置。
参考资料与来源
- 古德哈特,C. A. E. (1975). 货币管理问题:英国经验。
https://en.wikipedia.org/wiki/Goodhart%27s_law - 坎贝尔,D. T. (1979). 评估计划社会变革的影响。 评估与项目规划,2(1),67–90。
https://en.wikipedia.org/wiki/Campbell%27s_law - 穆勒,J. Z. (2018). 《指标的暴政》。 普林斯顿大学出版社。
https://press.princeton.edu/books/hardcover/9780691174952/the-tyranny-of-metrics - 哈里斯,M.,& 泰勒,B. (2019). 不要让指标破坏你的业务。 哈佛商业评论。
https://hbr.org/2019/09/dont-let-metrics-undermine-your-business - 霍维茨,J. (2021). 《Facebook 文件》。 华尔街日报。
https://www.wsj.com/articles/the-facebook-files-11631713039 - 维基百科:眼镜蛇效应。
https://en.wikipedia.org/wiki/Cobra_effect