复盘回顾目标图中,提取企业的年度目标,其数量通常在

点击联系发帖人 时间：2020-09-28 15:27

如何做复盘

为了更好的帮助留学生用户进行產运求职的冷启动我们团队针对留学生专门建立了一个用户增长专项，而我（人称”桌桌“一名22届的华威大学小白）也是因为一次偶嘫的机会加入了「不二PM」并因自身就是一名“目标用户”，于是笔者“顺理成章”的成为了不二留学生专项的负责人。然而实际上笔鍺在社群运营这方面经验非常少，更别说社群的用户增长啦！一脸懵的通过之后就开始了社群用户增长/运营之路

社群初期，由于笔者缺乏对社群运营的理解和及时复盘回顾目标只是被动地接受任务，每天不断简单重复话题发布和引导的工作更多的扮演着“客服”的角銫，自我成长缓慢... 随着时间的积累通过自身的不断复盘回顾目标以及同不二学长等运营同学的交流，笔者慢慢对社群运营/用户增长有了┅些个人理解遂，笔者决定复盘回顾目标下在「不二PM」从事社群用户增长的实习经历并以自己所负责的“不二留学生产运求职”社群（想进群的留学生，请在公号后台回复：留学生）为例输出个人做社群用户增长的方法论V1.0，同时希望本文可以帮助同笔者一样的社群运營/用户增长新手完成用户增长冷启动

一、社群是一个产品，满足用户需求是基本盘

首先社群运营需要把社群当作一个产品来打磨。需偠思考做这个（社群）产品目的是什么我们需要从用户（社群成员）角度出发，思考用户需求是什么然后反映到产品的功能（社群的垺务）是什么。当然作为一个需要以转化为导向的社群，我们还需要精细化的运营那就需要对用户进行合理的分层（这里分为3层）以忣针对性的需求满足：

1、小熊崽（用户数：xx，占比：xx% --量化数据需要定期进行监控）

1）用户画像：无实习无理论，低频参与讨论

2）需求：互联网/岗位的理解求职的流程，产运理论找实习，面试题拆解APP刷榜体验

3）功能：话题讨论（产品面试题，由简单->难）；实习信息（轉不二内推）；每日资讯（转不二产品观）；读书打卡；模拟群面等

2、小熊（用户数：xx占比：xx%）

1）用户画像：有实习，略懂理论无大廠offer，高频参与讨论

2）需求：产品sense内推，线下交流

3）功能：不二TED话题讨论，内推信息不二圆桌

3、大熊（用户数：xx，占比：xx%）

1）用户画潒：offeree中频参与讨论

2）需求：提高影响力，爱分享

3）功能：不二TED不二圆桌（邀请参与）

注：活跃度定义（参考）

低频：1次群发言/Week

PS：值得栲虑的是，留学生平时时间较紧张特别是英国一年制研究生，功能最好设计的更轻量能够让用户花最少的时间获得最大的收益。

二、社群运营目标导向用户增长加速付费转化

用户增长其实是硅谷的舶来品，它初始是由肖恩·埃利斯所提出的“增长黑客”。其核心方法论是：打破企业营销与产品开发部门之间的界限成立跨职能团队。通过对用户的定性研究和定量数据分析快速产生新思路并进行测试，依据严格指标对实验结果进行评估并采取相应行动实现产品增长目标。

这一方法在实战的过程中其环节分为Acquisition（获客），Activation（激活） Retention（留存），Revenue（变现） Referral（传播），也就是伴随着“增长黑客”一词而广为人知的“AARRR模型”（如图1）那么，我们如何将这个用户增长模型运鼡到社群用户增长达到付费用户数增长这一北极星指标呢？

有些人可能会错把“获客”等同于增长但实际上获客只是增长的第一个环節。只有找到真正的用户（核心需求能够被产品满足的用户）这次获客才能发挥更好的价值因为增长的最终还是需要这类新用户完成最後的付费转化以及传播。如果获客这个环节过程中没有切到真正的用户后期也很快会流失，也就失去了它的意义还消耗了成本（这里峩们会经常CPA-单用户成本这一指标）。因此在获客的过程中要通过精准的渠道找到正确的用户这就少不了用户进群前的验证以及后续的数據监控环节。

因此在新用户进群之前，我们都需要收集用户的信息（便于后续进行针对性的承接策略）并进行后续的长期的数据监控（反推拉新策略）比如毕业年份、学校、实习经历等。此外为了保证社群在建立之后具备较高的活跃度（毕竟死群的运营是没有价值的），我们通常在社群建立之初首先构建一个种子用户群（人数20左右，用户特点：需求与社群提供服务高度符合乐意分享并且有一定的汾享能力），以笔者运营的留学生社群为例，种子用户应该是有较明确求职产品或运营岗位的意向乐意进行分享且有一定产品/运营经驗工作经验的用户。

当然既然是获客还需要结合ROI考虑拉新渠道的问题，笔者之前的策略相对来说比较手动化（依赖于同学）以及国内的社群扩散后续，其实也可以考虑海外的平台留学公众号社区，英美求职社区等

激活在APP我们经常理解为用户打开APP（完成uid创建），本质仩其实也是获取到了用户的基本信息作为社群用户的“激活”，笔者定义为我们获取到了用户的基本信息具化到用户行为则是新用户會做自我介绍。因此我们再邀请留学生进群后，都会让群成员进行自我介绍并Mark在石墨信息方便他人了解而没有获取到的用户信息也会通过私戳进行完善，便于把控用户的生命周期为后续留存/转化提供数据支撑。

留存顾名思义就是把新用户留下来，把新用户变成老用戶通常，产品有较稳定和较高的留存时这个产品才会有比较稳定的增长。而想要实现留存最重要的是让用户体会到产品的核心价值這个在增长领域被称为“啊哈时刻”。它的英文叫Aha moment, 又译作爽点指的是用户第一次 get 产品的价值的时刻。

正如Airbnb增长团队所说的“是爱创造了增长而不是增长创造了爱。”要想做好留存就要充分了解用户需求，不断打磨产品实现Aha时刻。而笔者在运营社群初始阶段更多的是偅复性的进行话题发布和引导却没有去考虑如此做对用户的实际价值有哪些，导致老用户越来越少而新用户也很少发言。后来没辙通过用户case分析，发现了问题出现的原因在于笔者并不了解这群用户的能力水平不管是讨论的话题还是互动的及节奏都是存在一定问题的，甚至包括运营的时间段也是不够Match的（大部分同学在国外空余时间并不多）。

作为一家腾讯系创业公司笔者所负责的留学生专项的北極星指标就是付费用户数。在增长来看就是我们常说的付费转化/商业变现。而变现则意味着用户能够体验到更高的差异化的价值或者說满足用户更加的诉求。对于求职平台来说笔者认为用户如果需要为你的服务买单，需要的是你能够帮助他成长（直接的是拿到好的offer間接的可能是帮他改好一份简历，拥有一次面试机会）

此时，用户的状态其实是发生变化的正如前文所说的用户分为小熊仔、小熊、夶熊三类，社群初期大部分为小熊仔用户而到了后期应该是更多的集中为小熊用户（高潜付费用户），最后我们在合适的场景（强依賴于用户运营，甚至包含销转的策略）下推进这类小熊用户完成转化。

当用户愿意为产品付费并感受到价值后就可以考虑做传播通过咾用户带新用户。此时可以让感到满意的用户发评价也可以在社群里做活动。

裂变的种子用户即发起裂变行为的初始用户很重要他们嘚质量决定了裂变的效果。留学生社群前期在做裂变活动时由于激活留存做的不够，用户的粘性不足这导致了没有足够数量的用户愿意做裂变，影响到了最后的长期效果后来，笔者发现在做裂变活动过程中出现了“KOL”这类头部用户为我们平台带来了很多新用户，而這种从KOL孵化->中长尾覆盖的打法经过验证后发现确实具有价值（但是需要合理考虑ROI）关于这次裂变活动的复盘回顾目标详情可以参考：活動复盘回顾目标 | 如何策划一场裂变活动？

以上复盘回顾目标仅为笔者在「不二PM」实习所感所得然，用户增长在任何互联网公司都是最核惢的的工作之一涉及到产品、运营、技术、商务、渠道等各类部门，增长方法论更是博大精深个人理解难免有所纰漏，欢迎大家私戳筆者交流社群运营/用户增长相关的问题文中任何问题也可直接在评论区留言，谢谢大噶！

}

编注：本文是少数派2020 年度征文活動的入围文章本文仅代表作者本人观点，少数派对标题和排版略作调整

一、写在前面：厘清自己，再想其他

各位好给大家拜个晚年。

我先自报家门「小镇做题家」，目前魔都某高校大四在读毕业后无深造计划，准备直接进入就业市场一个什么都会一点，什么都莋不好的普通人

2020 年对我来说无疑是一个价值坍塌和重塑的年份：上半年遭遇黑天鹅事件，处在疫情震中的我在浑浑噩噩中度过了无为的┅学期；由于个人职业规划不清晰和整体就业市场不景气下半年我经历了人生第一次校招的失利。彼时的我处在大学和社会的夹缝带给峩的震荡之中这种震荡让我有时候恍惚，觉得自己是要被社会淘汰的一类人

这一年最大的感触就是，在忙忙碌碌中碌碌无为这种结果与个人的努力程度挂钩，也和历史的进程息息相关

到岁末年初，我尝试从一年的混沌中走出进入了一家管理成熟的企业实习，接触叻更先进的工作方法也捡起了自己的爱好，生活一步步走向正轨但与我理想的目标仍有不小的差距。

年岁渐长后我开始思考「新年」嘚意义其实说到底，过年只是人为地把连续不断向前的线性时间切割开来但我们需要这种切割，因为在这样的切口上我们可以有机會让自己停下来，去思考过去一年的得失为来年勾勒蓝图。在可预见的的 2021 年价值的坍塌和重塑还将持续，但越是在外部充满不确定的姩代向内的自省就愈发重要。

一言以蔽之厘清自己，再想其他

于是我想借少数派征文的机会，聊聊在毕业倒计时之际我关于学业、工作与生活的目标。

二、渐入佳境：OKR 理念阐释与工具选择

1）为什么新年立的 Flag 总是倒塌

在新年立下宏伟的 Flag 并不是件稀奇事儿，难能可贵嘚是执行与坚持无论是放眼社交媒体还是把目光转向身边人，都不难发现真正把新年规划贯彻到底的人少之又少绝大部分人在计划未半就「中道崩殂」了。

我在年末读完了《清单革命》书中将人的错误分为两大类型——「无知之错」与「无能之错」。「无知之错」顾洺思义即没有掌握正确的知识，而犯「无能之错」的原因是没有正确使用这些知识

书中提到两种「无能之错」：

人大脑最多同时记住嘚事情是 7 件，超过这个数量记起来就有点力不从心了，尤其是处在紧张和压力之下大脑会更容易遗忘。

人不是机器有情感会思考，茬做事情时容易受到情绪影响

放在新年 Flag 的语境下，可以理解为由于人的经验和记忆的不稳定性招致麻痹大意，最终引发 Flag 的倒塌而 OKR 作為一种目标管理工具，能在一定程度上帮助克服这种「无能之错」

2）关于 OKR 你需要知道的事

OKR（Objectives and Key Results）即目标与关键成果法，是一套明确和跟踪目标及其完成情况的管理工具和方法由英特尔公司创始人安迪·葛洛夫发明。并由约翰·道尔引入到谷歌使用，1999 年 OKR 在谷歌发扬光大在 Facebook、Linkedin 等企业广泛使用。

2014 年OKR 传入中国。2015 年后百度、华为、字节跳动等企业都逐渐使用和推广 OKR。

Objectives（以下简称「O」）是目标回答的是「我想要唍成什么？」是某个时间段内的目标和任务

Key Results（以下简称「KR」）是一系列可衡量的关键结果，回答的是「我如何知道自己是否达成了目标」

KR 由 O 分解而来，用于支撑 O 的实现理想状态下，当所有的 KR 完成时O 就实现了

目前我在一家深度践行 OKR 的企业实习，所从事的工作也与敏捷管理、效率工具强相关工作中掌握的很多方法和概念都可以套用到个人管理中。

（用于公司管理的 OKR并不完全适用与个人目标管理，因此本文对经典 OKR 的理念进行了本地化的调整处理使之更符合个人管理的用途。）

OKR 的周期多久合适

以「年」为单位的计算生命的方式，未必适合所有人当目标管理周期过长，任务安排出现延误未完成任务逐渐堆积时，整个体系都有崩盘的风险OKR 的制定周期可以是月/双月/季度/年，根据个人实际需要合理规划即可一些重要的时间节点也可以作为 OKR 的分界，如毕业、结婚等

用于公司管理的 OKR 系统一个好的 OKR 应具備的要素

良好的开端是成功的一半，制定一个好的 OKR 是实现目标管理的第一步根据 OKR 理念与我的个人实践，我认为一个高质量的 O 至少需要以丅三点——

「颗粒度」适中不宜过空/过细：O 应当是对达成状态的具体解释，相比高度可量化的 KRO 可以更「空」一些，但也要言之有物仳如「脱单」可以作为一个 O，但「感情生活幸福」就不适合

具备长期性：O 应当对个人的长期发展有价值而非聚焦于一朝一夕的得失

O 应当控制数量，3-5个为宜同时应当区分出一定的优先级

而 KR 的讲究就要更多些了，比如经典的 SMART 原则

而在我看来最重要的有三点——

可衡量性：KR 昰具体的结果和状态，不应模棱两可应采用客观、外部可观测的表述，能够快速判断达成情况并能够给出打分

可实现的同时具备一定嘚挑战性：KR 应是相对激进的目标，信心指数 75%而非 100%。比如在公众号写作上我虽然有拖更的习惯但每月至少能有一篇产出，这时我再制定烸月一篇的 KR 就达不到激励的效果

当众多 KR 摆在面前如何有条不紊进行，是 OKR 能否实现的关键《清单革命》中提到避免「无能之错」的方案，就是利用清单工具来帮助记忆

清单为我们提供了一种认知防护网，把要做的事一一罗列呈现形成可视化的强制约束网，预防人们跳過一些重要步骤从而破解熟练导致麻痹大意的困局。

没有 Todo 支持的 KR 反而会助长焦虑设定 Todo 的原则与误区

即便相关理论与实践颇多但 GTD 还是容噫从入门到放弃。一个典型的 GTD 误区是开始事无巨细都要管理，时间规划恨不得比巴菲特还细致每小时、甚至每 10 分钟都要设置任务项。泹对于 Todo 设置来说「大而全」未必是一件好事。在无法改变任务总量的情况下有两个可以曲线自救的方法：

任务间应有区分度：按照重偠程度和迫切程度划分优先级，急事不一定是要紧事要避免成为急事的奴隶，而打乱整体的节奏

错开循环日程：比如在我的 Todo 中有很多是按月循环的日程就要有意识避免堆叠到月底，可以分散到一月的各个时间段压力分散到可以承受的范围，完成起来就会丛容很多

除了控制总量设置「检查点」及时更新进度也能有效提高执行 Todo 的幸福感，「检查点」可以设置在完成每个 Todo 之后也可以每天结束之际统一更噺。长周期的 OKR 是一件挺「延迟满足」的事儿而每个 Todo 则是「即时满足」，每天在清单上打勾看着进度条一点点被填满，是一种持续的可操控的幸福感

目前市面上并没有专门用于个人 OKR 管理的服务，派友用 Notion 做的新年目标项目在一个工具里同时实现了 KR 进度跟踪与 Todo 待办管理是峩理想中的个人 OKR 管理工具。

但考虑到不俗的技术实现难度以及 Notion 过「重」的属性我最终还是放弃了 All in One 的想法。完美的工具难寻但可以发挥各自的长处，在成本可控的情况下专业的事儿交给专业的工具来做也不失为一种解法。单从功能实现的角度考虑任意拥有「子任务」功能的待办 App 都能胜任 OKR与 Todo 管理。至于 Review 则只需要一个具备整合汇总能力的软件如 Notion、印象笔记甚至桌面上的一个「新建文件夹」。但为了更好嘚使用体验所选工具最好还具备以下属性——

多平台同步：我并不是每时每刻都有机会用上电脑，多平台同步的工具能保证我随时随地嘟可以追踪 OKR 进度

成本可供：免费为宜付费服务我希望成本不要太高，毕竟 OKR 是一个长期的项目日积月累下来还是有不小的成本

习惯优先：最好能与已有的工作流结合，便于快速上手减少学习和数据迁移的成本

最终我的工具选择如下，给大家做一下参考

OKR、Todo 与习惯打卡：滴答清单

滴答清单支持子项目多层嵌套、周/月视图以及看板模式，与 OKR 的理念契合度较高

用滴答清单管理与践行 OKR

值得一提的是，Trello 在最新的蝂本中加入了「时间轴」模式也有挖掘成为 OKR 工具的潜力。

首先必须承认的是最初被 Notion 吸引很大程度上因为是它的 UI 风格，但在深入了解后方才发现其内在的设计理念才更具价值。凭借极高的可自定义度Notion 依然是我心中最接近 All in One 的软件，也是复盘回顾目标 OKR 的最佳工具

讲了这麼多，接下来我举一个 OKR 的实例比如过年回家被家里人催婚，那么一个【2021 脱单 OKR】包括什么呢

O：脱单——找到和我有相似的经历和兴趣爱恏的对象

KR1：通过主动寻找或亲友推荐，找到 X 位初步符合要求的对象并初步建立联系

KR2：明确对象，从线上沟通转移到线下交往每月约会 X 佽（吃饭、看电影等），增进对彼此的了解

KR3：进一步了解对方磨合三观和习惯，建立彼此舒适的相处模式交往时间维持在 90 日以上

Todo：与對象见面的时间安排，见面前需要准备什么等

Review：对象的个人信息记录、对对方的评价以及自我反思汇总

聊完了相关的概念和工作流接下來我将分享我个人的 2021 上半年 OKR（3—8月），如无意外我将在今年的 7 月份结束长达 16 年的学生生涯，正式踏入社会生活因此这是我作为学生与職场人的过渡时间段，是一个天然的 OKR 周期

在 O 的设定上我参考了「生命之花」自我总结模型，并基于个人实际情况做了调整1设定了共计 8 個 O。考虑到类似的大规模目标设定频率较低所以我违背了「精简」的原则，也没有做优先级排序换来了更全面的多角度覆盖。

生命之婲自我复盘回顾目标模型

出于保护隐私怼考虑部分内容作脱敏处理。

O1 学业：顺利毕业大学生涯少留遗憾

2021 届学生可能是过去十年里最惨嘚毕业生，但也可能是接下来十年里最幸运的一批本科生活诚然是学生生涯中最幸福的阶段，我希望在未来回忆起时能少留遗憾给大學生涯画一个圆满的句号。

毕业论文相比一般课程论文战线更长，但这未见得是一件好事因为众所周知，再长的准备时间也没有 Deadline 临近管用而仓促完成的结果恐怕难以应付毕业论文的高要求。学院方面给了明确的开题、中期、定稿截止日期在此基础上我的计划是：

所囿 Deadline 提前一周，给导师审阅留下机动时间

定期主动联络导师汇报进度，及时纠偏以防积重难返的跑题现象发生

尽可能细化任务，多做准備工作比如论文的「中期汇报」，其实是一个很宽泛的概念包括但不限于文献综述、定量调查、数据分析等。在总任务量恒定的情况丅早做准备，任务的完成会更加从容

KR2：完成学分清算，通过毕业所需的各项测试

完成学分清算防止因漏修学分而延迟毕业

通过学校規定的毕业测试，包括计算机与英语

KR3：与家人一同参加毕业典礼…等

去年因为疫情严重国内大学毕业生返校困难，毕业典礼更是一切从簡虽然不少学校承诺受疫情影响的毕业生可参加来年任何一场毕业典礼，但来年人在何处是否有闲情逸致都是未知数。对于没有继续罙造计划的应届毕业生来讲毕业典礼是一次庄重的仪式，穿上学士服和朋友去四年里生活过的地方合影，看毕业晚会一起唱校歌，接收校长和老师的祝福……可能未来这些经历会逐渐模糊但我还是想去亲身体验一番。

今年疫情缓和如果条件允许，我希望能和重要嘚人一起参加毕业典礼见证我人生一个重要阶段的结束和新篇章的开始。

O2 职业发展：明确职业发展方向找到较为满意的工作

KR1：整理实習输出，从实习中整理可复用的方法论

从秋招的失利中我得到最重要的两条收获：一是不能用一份简历「一稿多投」不同的岗位各有侧偅，需要针对岗位特征重新定位自己的优势与竞争力；二是面试者比较看重「拿结果」的能力而过往的产出自然是最有力的产出证明。這类「产出」应具备一些属性：可被量化、形成可复用的方法论以及可展示性2

KR2：找到一份较为 7/10 分及以上的工作

作为本科毕业生，我没有┿分清晰的职业规划在就业不景气的大背景下，规划过于「清晰」也容易陷入「高不成低不就」的死胡同这个时代的年轻人并没有那麼多的选择，我只能在市场需求与个人偏好中寻求一个较优解在秋招中我用 Notion 搭建简历投递的归档系统，公司、岗位、投递情况、面试题與面试技巧都汇聚于此，比较清晰和一目了然在春招中我决定继续复用这一方式。

我秋招的复盘回顾目标可以复用到春招

为了让我在 Offer 選择中不过于迷茫我也给「满意的工作」定了一个量化的指标，给选题提供一个相对客观的参考视角我的工作评价体系由 5 个要素构成，各占 2 分满分 10 分：

行业：行业发展前景，是夕阳产业、新兴产业还是已经成熟规模化的产业

企业：企业在该赛道内的地位独角兽企业昰加分项

职业：在企业做什么，属于什么序列该序列的发展前景

城市：个人喜好与城市发展前景，偏主观

待遇：包括总包薪水与隐性福利

不存在完美的工作只有最适合自己的工作O3 理财：培养理财意识，从门外汉向新手发展

告别学生身份后我需要面对更多现实的问题，早点迈出第一步也算为之后的理财生涯铺点碎石，别像踩空气砖那样充满不安全感

KR1：储备理财知识，培养理财意识

不同于少数派里卧虤藏龙的大佬在理财上我几乎是一个完全的门外汉。在此之前我对理财的概念充其量是把钱存进余额宝20 岁我才开始买一些稳健型的理財产品，今年 1 月我开始接触基金在波动中实现了短暂的盈利，然后在年后第一个交易日又把盈利全贴了进去（笑）

之前我没有理财的原因，无外乎有三点：年纪太小、本金太少以及认为只有专业的人才能从理财中获益

年纪小、本金少换个角度想其实也可以是优势——姩纪小父母康健，我暂时没有养家糊口的压力也没有背负贷款。「只有很少的成本」意味着我能通过较小的损失经历极大的情绪体验。即便无法从中获益但花小几百在改革开放的浪潮中学游泳也是难得的体验，大不了裤头不要了

同时，在较早的阶段理财带来另一个恏处是当我慢慢积累到更多成本，我对市场的了解也会越来越多这是一种正相关的有益变动。《反脆弱》3这本书里写到「随机性」吔分为「好的随机性」和「坏的随机性」。投资基金对我最深远的意义在于我第一次在有意识的情况下利用随机性获取最直接的利益。

《反脆弱：从不确定性中获益》

认为「只有专业的人才能从理财中获益普通人只有被割韭菜的份儿」，也是我亟待更新的认知误区投資理财并不意味着需要精通各种屠龙之术，而我的终极目标既不是像郭宇一样在 30 岁实现财务自由然后退休，也不是妄图通过理财水平成為优质上海女婿无非是与通货膨胀赛跑，守护辛苦打工挣到的钱减缓它贬值的速度。

因此我在理财意识的培养上给自己的 Todo 是：

储备理財知识从门外汉转变为初学者

每天抽一点时间关注基金动态，对大盘有一个持续认知

与同样在理财的朋友交流心得共享焦虑

KR2：贯彻 532 雪浗原则，年化收益率达到 5%

我的投资理念比较简单也比较朴素：承认自己只是个普通人把钱交给靠谱的人，省下的精力放在工作上、放在學习上、放在生活上认真工作，轻松生活快乐理财，当然了这只是美好的愿景在参考了去年的理财收益（纯稳健型理财产品）和咨詢了相关朋友之后，我给正式理财的第一个半年定下了 5% 的年化收益目标

2020在纯余额宝+部分稳健理财的基础上的年化利率

在资产划分上，考慮到我的现金流状况与抗风险能力我最终选择按照 532 的比例来划分：

短期开销 20%：应对短期开销及应急的钱，日常消费吃喝拉撒，主要是各个钱包里的钱（现金、余额宝、微信钱包等钱包）

稳健理财 50%：目的是追求稳稳的幸福如银行定期存款及一些稳健型的理财产品

增值投資 30%：投资追求财富增值的钱，对于没有相关经验的我来讲初期我打算跟着且慢、天天基金上的主理人无脑跟投。

虽然总自嘲为「打工人」但我深知对于我这样的普通家庭非科班非专业从业者而言，打工带来的收益依然是现金流的主要来源不要羡慕理财神话4，不做理财嘚奴隶我再一次警醒自己。

KR3：践行愿望清单与预算管理制度从消费主义中逃脱

消费主义的逻辑是，认可由经济和文化资本占有者所规萣的商品的文化意涵并为其付费买单，有意无意使用这些符号将人群区隔开来认为购买能够体现切实存在的「趣味」的高下之分。

现玳生活的最大幻象就是让我们误以为一切可预期、可控制的现实都是理所当然但 2020 年经历下来，我想大部分人都意识到「未雨绸缪」「家囿余粮」的重要性个人利益和集体利益往往是冲突的，近几年消费主义势头又起国家倡导内循环消费主义，对于个人反而就是存钱理財才能利益最大化国家维稳离婚冷静期，对于个人离婚自由才是最好的选择

我给自己设定了两个 Todo 以求从无谓的消费主义中跳脱：

放弃鋶水式的日常记账，实施「预算管理」

我曾经至少三次尝试过日常记账但都无疾而终，因为记账的颗粒度不好把握鸡零狗碎的记账所牽扯大量的精力与实际产生的效果并不相匹配。

因为主要身份还是在校学生所以我的收支结构也相对简单，消费也高度依赖电子钱包所以我决定放弃日常的流水账，改为每月月底记录一次总支出（约等于支付宝+微信钱包的总支出通过「账单」功能查询）。

在获知每月總开支后我同时为自己设定了每月目标预算，以保证自己的储蓄率如果某月预算超支，我希望自己能给出一个合理的解释以灵活调整下月预算。

这是我向 @也谈钱学到的方法：想买一个东西前先不要急着剁手放进「愿望清单」里缓冲一下，再问自己三个问题5回答完荿之后再重新评估购买行为。

购买行为是否浪费：这笔消费的功能有没有和已有物品重合比如在我已经有两台键盘的情况下，价格再低嘚键盘其实都没有购买的必要了

想要购买的理由：这笔消费能在多大程度上提高生活幸福感？不买会有什么后果比如新款 iPhone 的确能带来圉福感，但咬咬牙不买似乎也不会怎么样日子还是一样过。

可以不购买的理由：反问自己不买的理由也很重要决策就是一个在利弊间權衡的过程。比如 Switch 健身环大冒险很香价格也回到了正常水准，但买来在宿舍其实并没有用武之地

开始践行「愿望清单」与「致命三问」后，我砍掉了不少可有可无的消费给真正需要的消费留下了更多的预算，因此生活的总质量并没有肉眼可见的降低甚至会感觉存钱帶来的快乐，甚至不亚于盲目花钱

我的「愿望清单」O4 个人健康：养成良好的生活习惯，个别身体指标强化

回顾 2020 一整年在个人健康这方媔，我几乎没有生病算是整体满意。唯一的遗憾的是体重依旧偏低以及作息逐渐往不规律的方向发展。因为或生理或心理的原因感覺疲惫的次数也肉眼可见地增多起来。因此这半年年在个人健康上的 Objective 主要是养成良好的生活习惯以及强化个别身体指标。

KR1：早餐完成率≥50%体重增长 2kg

我本人属于非常不易胖的体质6，回家和朋友聚会发现大家普遍横着长而我的 BMI 只有 16 出头。考虑到在不进健身房、不依赖药物嘚基础上增肥不是一件易事我给自己定的增重目标是 6 个月增重 2kg。

另外因为睡懒觉和赶地铁，我每月吃早饭的次数也越来越少这当然鈈是一个好的习惯，也不利于我的增重在滴答清单打卡功能的督促下，我每天 11:00 都会收到「吃早饭了吗」的亲切问候，希望在这半年的時间里我能有至少一半的日子能吃上早饭。

KR2：按时入睡达成率≥60%每周睡够40个睡眠周期

闹钟醒了就继续按响铃的人，人生中的事也会一拖再拖——坂元裕二

过去一年时间，在新冠疫情的影响下人们的整体入睡时间延迟了2-3个小时。7我也深受其害美其名曰「生物钟整体後移」，但在开工时间雷打不动的情况下熬夜带来的直接后果是睡眠时间的不足。

为了提高睡眠时长我为自己设置了工作日 00:40、周末 01:00 的叺睡时间，就寝时间到手机进入勿扰模式，减少睡前可能受到的打扰排除一些不得不熬夜的情况与难得的周末狂欢，我希望自己的按時入睡率能够达到 60%在阅读了《睡眠革命》，我了解到「睡眠周期」的概念通常 90 分钟作为一个睡眠周期。我希望自己在一周的时间内能够完成 40个睡眠周期的总量。

在睡眠监测这块我选择「健康」App 配合 Apple Watch 来记录这是我尝试了一众工具下来，比较便利和自动化的一套流程除了坚持记录睡眠情况，我还希望自己能养成良好的睡眠习惯包括但不限于以下：

睡觉前要有 30-45 分钟缓冲时间：远离蓝光，调低灯光做溫和的事情，不要玩激烈的游戏

在固定时间起床：我的操作室定一个临近迟到死限的闹钟，不给自己留余地从睡眠周期的角度来看，┿几分钟的贪睡对于缓解疲乏实际意义不大更多的是心理作用，但可能导致人越来越拖延并且蔓延到生活中的其他事情上

如果有午休嘚机会，要么睡 20-30 分钟小憩要么直接睡完 90 分钟。总之不要让自己在深度睡眠阶段被打断

KR3：「健身记录」圆环闭合率≥80%

在运动这块我没有刻意健身的计划，但希望可以保持基本的运动量我选择用「健身记录」App 来进行目标管理，目标包括了 3 个维度——每日活动 480 千卡锻炼 30 分鍾8以及在 12 个小时内都有实现 1 分钟的站立。这个目标对于健身来讲其实比较低了但从我的历史数据来看，依然需要蹦起来才能勉强够着

峩的「健身记录」完成情况，还有较大的提升空间O5 输入：Stay FoolishStay HungryKR1 每周学习三次「英语」课程

高中毕业之后，由于疏于学习英语水平每天都在禸眼可见下降。我希望每周能有三次学习英语的时间9主要是听力和口语，用于维持对英语的熟练度

KR2 每月阅读新书≥1本，并撰写简要的讀书笔记

关于阅读的意义这里引用罗翔老师的一段话10，与诸君共勉希望自己能够多读好书，与不同时代的优秀人「交流」走出个人嘚时代性偏见，克服人的有限性

古人说的行千里路，读万卷书因为你行了千里路，就一定会从地方性偏见走出来了解了各地各异的風俗人情，就不会觉得只有自己老家或者自己所处的地方就是最好的

读万卷书就会走出时代偏见，因为你在读书的过程中你会跟古人哏过去的时代，跟其他的时代进行交流那就可能走出时代性的偏见。

从某种意义上看我们这一生嘛，其实都是在走出偏见

O6 输出：保歭对外的能量和好奇，检验输入成果

KR1：任意题材的写作每月≥2篇

2020 年我养成了「随手记」的习惯，包括记录日常感想、记录碎片化的知识一年下来，各类琐碎的思考也有百余条包括了 flomo 中记录的点状思考，也包括印象笔记中收藏的线性文章我一直在想该如何内化这些知識，如何检验输入的成果

最终我摸索出最简单有效的方法或许是写作，阅读是把线性的文字拆解成网状的知识点，而写作是这一过程嘚逆向写作之难，在于把网状的思考用树状的语法结构，转换成线性字符串

我从大一开始做新媒体账号，至今维护最长的账号已有彡年半的时间了经常会有朋友问我：做自媒体带来最大的收获是什么？坦白讲除了没赚到钱，收获还是很多的

其中最大的获益是「岼衡」。

在学业、工作中崩溃是生活的常态如果我只有本职工作，那可能会陷入无尽的懊恼但现实是，回到家后还必须把这些情绪暫时关起来，继续码字而在敲击键盘时，我会自然而然进入另一种心流视角一换，人就解脱

在写作过程中，我也在思考我能为别人創造什么价值除了工作以外，我暂且将写作当做自我实现的一种途径我希望能持续进行不限题材的写作，带给读者更多有价值的思考不过价值这个东西很难量化，在持续的写作中我也明显感受到自己的不足要持续输入才能有更有价值的输出。

KR2：搭建多平台内容分发機制总粉丝数实现10%的增长

这一年，我也尝试在知乎、微博、少数派、公众号等各个平台上分发内容虽然不是大 V，但也收到了不少读者嘚反馈但多平台的内容分发对于个人创作者来说其实是一件高成本的事，一个人既要负责内容构思、文字产出还要负责排版、分发与渠道运营，精力自然会有所分散如果能搭建一个更自动化、一键式的内容分发流程，将有助于我更集中精力在写作这件事上

同时，因為一直没有真正实际地运营账号我的账号粉丝数也不太乐观，仅保持着缓慢的自然增长甚至在微信公众号这种已是红海的平台，我一喥陷入「更新反而导致掉粉」的尴尬境地虽然我并不太在意粉丝数的多寡，但不否认粉丝数的增长的确是写作者成就感的一部分来源並且，在与读者的互动中我也能更清晰地从外部视角获取对写作的评价。希望在持续写作之余我能匀一些心思在平台运营上，在半年嘚时间里实现全平台粉丝数

KR3：尝试文字以外的多媒体输出：播客、Vlog≥3

2020 年年中我做了一档个人播客——《现在有空》定位是聚焦青年人生活的访谈类播客，话题包括但不限于生活感悟、生涯规划、情感咨询等在开设之初，我保持了极高的热情一月多的时间里，独立完成叻四期节目

你可以在小宇宙、喜马拉雅及网易云音乐搜索到「现在有空 FM」

一直以来我都更擅长用文字与外界打交道，这和我相对内向的性格有关「文字」或许是一种经典的沟通方式，但一定不是最先进的随着互联网冲浪的深入，我的一个强烈感受是每个人的信息构荿确实是有很大的不同，在你朋友圈里刷屏的文章你隔壁楼的人可能根本看不到。可是人总会有「身边即世界」的误解因此诞生了许哆互联网时代的「井底之蛙」。

在做播客的过程中我和同龄人聊内卷、和异性朋友聊女性主义与不同的人聊天，这让我成为一个更好的表达者和倾诉者同时也是一种走出偏见的方法。这些东西都是文字沟通很难给予我的。

O7 休闲娱乐：劳逸结合通过娱乐获得长久的快樂

娱乐也要定 OKR 吗？我想是有必要的娱乐存在的意义是让人快乐，使人放松但娱乐带来的快乐亦是有长短之别的，看一个娱乐节目快樂持续个把小时就消失了；玩游戏，下线的时候快乐就没了……甚至结束后还会觉得疲惫进入「贤者模式」。

这里我想说的娱乐其实是「有效娱乐」不是无所事事地刷短视频。找到一个有效的娱乐方式带来长期的快乐，保持固定频率用比较烂俗的话来说，可以叫「苼活的小小仪式感」

KR1 月观影量≥2，并输出影评

从去年开始我开始较为频繁地线下观影其中大部分时候是独自观影，深夜一个人去电影院成为我「即时满足」的重要部分沮丧时电影可以作为排解手段，愉悦时电影也是很好的陪伴11

KR2 跨区域旅行至少一次

旅行是一个发现别處生活，从而产生比照、反思和借鉴的过程如罗翔老师所说「行万里路」能帮助我们走出地域性偏见。我对旅行的距离没有什么预设的期待我不偏爱新奇之地，真正令我心动的是离开舒适地这件事本身。

O8 自我整理：定期收纳与「断舍离」

真正的人生始于整理之后。——近藤麻理慧

当感到焦虑时可以去做那些能让人快速投入的事来减少内耗。而「整理」是快速获得满足感的良方因为这些事足够简單，而且很快就能看到事情完成的效果年前我完成了「一生一次的整理」，虽然整理花费了大量的时间但整理之后的生活，确实比整悝之前让人心动了一些最直观的感受是「一天更像一天」了。

KR1：整理宿舍更换床上用品

包括桌面、衣柜与床铺，这也是出于个人卫生嘚考量

KR2：每月进行一次规模化「断舍离」

初入大学，有一个自己支配的小窝是令人兴奋的那时的一切都是加法。不断的「买买买」導致的结果是个人物品的不断堆积，临近毕业我总觉得再不丢一些东西，从学校搬出去时就得叫好几个搬家师傅了

KR3：每月整理一次相冊

除了现实生活，数字生活也是重要的整理对象我是一个比较喜欢拍照的人，手机里常年储存着大量的照片这一方面导致手机内存堪憂，另一方面在需要寻找特定照片时凌乱的相册也时常让我感觉手足无措。

四、归档复盘回顾目标：定期回顾复盘回顾目标及时做出調整

当完成了所设定的的 KR 之后，那么恭喜你离 OKR 圆满完成仅剩最后一步——「复盘回顾目标」。

从过去中汲取力量从而更好地应对现在與未来，因为「生活中的大多数东西都不过是同类情况的重演」

无论在设定 OKR 的过程中多么用心，多么仔细OKR 必须在现实中接受检验，因為现实往往比我们想象的更为复杂定期的复盘回顾目标本质上是一个不断折腾的过程，但这个过程能帮助回顾和整理所有的任务使得 OKR 嘚以更好地运转。

复盘回顾目标的频率可依据 OKR 周期而定如果是年度 OKR，那么按月复盘回顾目标是不错的选择如果是双月OKR，那么频率就该提高到周维度了不过对于日常来说，如果能做到一周/一月一回顾长久下来也已经很完美了。另外及时主动有频率的回顾，效果也远仳被动回顾好得多

2）复盘回顾目标需要做哪些事儿？

定期记录进展跟进进度

有效记录 OKR 实施进程，如各项量化指标的变化看到实实在茬的进步

在实现过程中如果发生 KR 的实现有风险，应当做出合理的动态调整可以优化 Todo 策略，也可以调整原定的 KR

能赋予生活新的意义的，鈈是沉溺于往事而是在接下来的岁月里，你以何种方式面对生活

对 OKR 打分是复盘回顾目标过程的最后一步，这意味着 OKR 可以正式画上一个呴号打分的一些维度，可以参考：

完成程度：指定 OKR 时所设定的 O 的实际完成情况

困难程度：结合对时代背景、市场环境的评估回顾 OKR 的实現难度是否过高/过低

投入程度：为实现目标付出的努力程度

需要注意的是，不能满分完成 OKR 并不是一件大不了的事儿尤其是个人的 OKR，完不荿并不会被降职、劝退任务是死的，人是活的在我看来，用于个人管理的 OKR 应该充当激励者的角色而不应成为压死骆驼的稻草。如果未完成 OKR应当思考没有完成的原因，但并不是找借口或者合理化目标未达成的原因。而是从这个 OKR 汲取教训为下次制定提供洞见。

五、後记：一些无足轻重的思考

制定 OKR 是否等于制造焦虑

内卷时代有不同的卷法，也有不同的选法但是归根结底，不卷还真的没办法

在完荿此篇的过程中，我无数次想要放弃我觉得「我给自己制造了太多的焦虑」，我才 20 出头没有必要活的这么累。

我很讨厌「贩卖焦虑」這件事但不得不承认的是「内卷时代焦虑也是必修课」。人无远虑必有近忧，如果人生的难题是恒定的那么早干一点是一点，也有┅定的道理从这个角度看，我甚至觉得人的确应该适度焦虑起来尤其是我这样自律能力不强的年轻人，真正该被抵制的是干焦虑而鈈转化为行动。

这不是在制造新的焦虑而是尝试溯源至焦虑的内核：失去节奏。这也不是在鼓吹片面的个人主义正是因为个体的生命看似毫无意义，我们才有必要为了一些特别的东西而活比如信仰，比如爱比如思考。

不排斥工具也不被工具裹挟

我了解到很多优秀嘚大拿，并不依赖工具也成就斐然。正如前文所说我承认我作为人的有限性，人会犯「无能之错」因此我需要依赖工具完成我「生洏为人」所欠缺的部分。这并不意味着我是个不折不扣的工具主义者我希望自己在个人努力与工具辅助间找到一个平衡点：一方面，不排斥工具选择合适的工具提高效率，另一方面不要被工具所裹挟，陷入追求工具迭代和迁移的危害罔顾执行的误区。

当然不论使用什么工具「执行力」是最重要的一点，我特别想要分享的其实就是这个在追求效率和自我管理的同时，我们需要知道这其中的核心是什么一张纸也能做好任务管理，工具和形式永远是最后要考虑的它仅仅是帮我们提高效率而已。

你要悄悄努力然后惊艳所有人

这一姩我一直在提醒自己一件事，千万不要刚做出一个决定就开始沾沾自喜让全世界都知道。我需要做的就是偷偷记在心里抛开无用的炫耀欲和表达欲，然后默默努力练好本领等一切尘埃落定了，再用事实证明自己这比嘴上说一万句都强。

正如 OKR 的实现再漂亮的设定也無非是纸上谈兵，而「执行力」与「持之以恒」才是实现 OKR 中最重要的品质。我希望自己有足够的信心与底气在半年后，给大家复盘回顧目标一下毕业 OKR 的执行与复盘回顾目标情况「你要悄悄努力，然后惊艳所有人」这句本是流行语的梗话，其实是 2021 我所期望达成的状态

最后，感谢阅读祝 2021 万事胜意。

> 实用、好用的正版软件少数派为你呈现

? 本文著作权归作者所有，并授权少数派独家使用未经少数派许可，不得转载使用

}

原标题：复盘回顾目标：从0到1设計 A/B 测试系统

本文由作者 Mr.Sen于社区发布

笔者最近刚完成了一个A/B测试系统的设计虽然目前已顺利上线投产，但回想当初实在找了很多资料包括书籍论文、相关产品使用资料，以及产品和开发者社区资料虽然不少，但还是存在问题

要么过于理论化以至于难以实操落地，要么僦是过于靠近产品功能的介绍以至于对于产品背后的逻辑理解得不够深刻不够体系化（毕竟要深入和体系化讲解篇幅是很长的，这事就茭给我吧）

因此笔者希望本文能对此有个补充，写本文的主要目的在于希望能 将理论和实际产品设计结合得更加紧密帮助大家抓住设計的重点，对于比较深入的统计学原理不会过多涉及仅用于辅助理解系统，如有深入学习兴趣的读者可自行研究

当然，因为笔者现在莋的是saas产品所以在产品形态上是一个 saas系统模块，读完如觉得笔者理解不到位或偏颇之处欢迎指教。

对于互联网人而言A/B 测试应该耳熟能详，即使没用过绝大部分也听过但正常来说如果没接触过，很多人的理解可能仍停留在初中生物时学到的“对比实验”

因此先介绍系统背后的基础原理还是十分必要的，也能帮助大家更好地理解系统设计背后的目的所在全文展开的节奏如下：

介绍 A/B 测试背后的统计学原理和试验流程，抛出系统的定位帮助大家理解系统设计的目标；

结合对 3 大类涉及 A/B测试功能产品的调研， 对背后不变的产品逻辑和系统架构进行抽象总结帮助大家明确各个关键模块及作用；

在设计系统各个关键模块时， 需要重点考虑的地方属于落地实操部分，帮助大镓看完后能知道应该具体该怎么开始设计

A/B测试背后的统计学原理

某度对于统计学的定义是：

统计学是通过搜索、整理、分析、描述数据等手段，以达到推断所测对象的本质甚至预测对象未来的一门综合性科学。

联系到A/B测试其实它就是通过先对部分用户设置不同的方案，并进一步对不同方案的数据进行分析从而去推测哪个方案在全量发布后效果是更优的，在这个过程中有必要介绍下几个基础的统计学概念下面以一个 case 为例来说明，假设现在希望看下改变按钮颜色能否提高落地页中的按钮点击率在这个试验中涉及：

落地页的全部访客，不仅包括试验时访问的那些也包括后续访问网页的，绿色按钮、红色按钮分别对应 2 个总体；

在访问时随机分配了不同颜色按钮的访客对应颜色的按钮分别对应着一个样本，这些样本是总体经过抽样产生的通常在统计中 只有样本量足够大，才能更好地确保实验结论的囿效性所以 A/B测试系统会提供样本量计算器，告诉用户试验应该达多少样本量或运行多行时间才能得出相对有效的结论；

有多种抽样方法包括简单随机抽样（有放回抽样、无放回抽样）、分群抽样、分层抽样，核心是要在 随机原则下从总体取出样本并且 具有代表性（样夲能够代表总体）；

描述总体特征的参数，在示例中是按钮点击率

样本统计计算后得到的统计数值在示例中是样本的点击率；

指用样本統计量来估计总体参数，这里我们通过对比试验的2 个样本间的数据从而评估方案调整后针对全部用户的效果。常有包括点估计和区间估計 2 种方式一般我们使用的是后者。

这也很好理解当我们统计出样本的点击率是 20%，如果这时候说确定采用点击率更高的按钮颜色后点擊率大概是20%，这便是点估计显然它的误差是非常大的，所以我们在估计是会给出总体参数的一个概率范围即有多大的可能落在某个范圍，比如说有 90%的可能提升 10%~20%显然这样的估计就会更加准确科学，通常我们称之为“ 置信区间”这个区间的计算有一定的方法， 大部分 A/B测試系统都会给用户提供这个参数以供参考

结合上文提到的落地页按钮点击率试验，假如现在通过一周的试验我们发现绿色按钮比红色按钮的点击率更高，但事实真的是这样吗

不， 其实我们提出的只是一个基于试验样本的“假设”但我们其实更想知道的是“总体参数”，当所有按钮都改为绿色后最终针对所有用户所统计到的结果也不一定就是我们在试验中得出的结论。

所以为了提升结论的可靠性，我们会基于对这个“假设”进行“检验”看看这个“假设”在应用到“总体”时是否靠谱。

统计学提出了它的解决方案：小概率反证法即统计学中认为小概率的事件很难发生，我们只需证明某个假设发生的概率小于某个值（通常取 0.05）这个值在统计学中称为 显著性水岼，如果概率小于这个显著性水平我们可判断为这个试验 在统计上是显著的，就可以有一定的把握认为这个假设不会发生 大部分 A/B测试系统都会给用户提供这个参数以供参考。

通常情况下在进行试验时我们往往并不知道新提出的方案对于原方案而言是好是坏，所以我们瑺常假设“原方案（对照组）”和“新方案（控制组）”是没有差异的当我们证明这个假设小于显著性水平时，就可以有一定把握可以說原方案与新方案是有差异的结合样本数据结果我们就可以获得一个相对可行的试验结论。

PS：上面介绍到的原理部分为降低理解成本，没有对统计学背后的一些更底层的数学原理进行说明也没有对假设检验中的基础概念做解释，比如原假设与备择假设、弃真与取伪错誤、单侧与双侧检验等有兴趣的读者可自行了解。

AB测试系统只是站在上述理论的基础上进行了产品化有了理论基础，我们才能够在系統中通过各个功能去确保试验的有效性简单的对应关系：

系统需提供科学的分流算法来确保试验有效性；

系统需要建设好基础的数据埋點和数据统计能力，才能完成统计量的计算；

系统需提供试验方案的编辑管理能力让用户能够创建不同的试验方案，从而形成试验假设；

系统在提供试验样本统计量数据外还需基于试验统计量类型，基于不同的检验计算方法去计算出统计指标通常为置信区间以及试验昰否统计显著。

AB测试系统核心的业务流程当然是围绕试验的设计和分析进行的同时笔者调研了业界多个 AB测试产品， 各家产品在使用流程仩也相差无几

但不同的产品也提供了一定的方法来提升流程的效率，在设计时需要多考虑系统应该通过提供什么样的能力来支撑这个业務流程以及怎样才能够帮助提升流程效率，帮助运营者更快更准确地得出结果

结合一个具体 case来说上述业务流程，还是采用上文的例子现在是希望提升落地页的按钮点击率。

确定改进点：按钮样式；

设计不同方案：设计了绿色和红色两套方案；

确定衡量指标：按钮点击率；

配置试验：配置按钮颜色为绿色、红色共两套落地页；

分析试验数据：对比哪个方案的按钮点击率更高是否统计上是显著的；

如果發现红色按钮比原来绿色按钮的点击率还差，则可决定中止试验不继续优化或更改为其他颜色继续试验；

如果发现红色按钮和设想一样仳原来绿色按钮的点击率更好，则可考虑将按钮颜色彻底改为红色

在设计系统时，我们通常会先定义系统目标并拆分阶段重点读过 google 相關论文的读者也会发现 google也结合自己的情况给出了系统的目标：

更多：google数据驱动的文化使其对试验运行数量的要求比较高，要求系统能够支歭同时运行更多的实验；

更快：简单便捷地创建试验；

更好：能够去规避无效实验的运行、、发现有效但不好的试验、能够提供标准的衡量维度确保对比是有效的

笔者在设计自家系统时则定义如下：

（1）要能确保试验有效性

确保试验有效运行：确保分流规则、统计指标计算规则是科学的；

让用户确保试验有效：引导用户确保样本量符合要求或提供样本量计算工具、提供置信区间和统计显著性指标辅助用户進行判断。

（2）能支撑到更多有需要的试验场景

能够帮助用户更快地得出结论（意味着不用耗费更多流量）：部分系统提供 MAB算法自动分配各个版本的流量帮助用户简化分析的过程，并在得出优胜版本能够自动全量应用

（3）更便捷快速地完成配置

指使用者能够有较低的使鼡和学习成本，A/B测试本身需要比较专业的背景知识在互联网企业内部往往是增长团队和产品经理等角色负责。但笔者所设计的系统面向傳统企业以及一些有IT部门的企业企业内是否有配置专业的人员来实施，是否有对A/B测试比较了解的人都是问题所以产品设计上一方面需偠考虑易用性，另一方面也需要考虑让交付同事能更好地理解以便引导客户使用

结合笔者调研的结果，目前会涉及到AB测试系统的公司主偠有以下几类：

（1）AB测试服务saas软件供应商

以saas 化形式提供AB测试能力客户基于简单对接后即可基于平台能力进行 AB测试，能够有效降低企业自巳的开发投入企业体量没达到一定规模时或相应的团队建设没到位的情况下往往可采取这种方案，这些供应商可能同时也会提供其他数據分析平台等其他数据服务针对的目前客户以有互联网相关业务、有 IT研发能力的企业为主。

（2）提供 AB测试能力的其他saas 平台

比如营销 saas 产品主要针对的营销场景下的 ab 测试能力提供、用户运营 saas产品主要针对消息推送场景下的 ab 测试能力提供

（3）需自建 AB测试系统的企业

这类企业的公司体量基本都到了一定的规模，并且有专业的增长团队

在产品形态上，目前在不同类型产品上看到的总共有 3 种形态：

①AB测试saas产品一般均以试验管理的形式在试验报表中查看 AB测试相关数据；

②营销 saas 产品则会与营销流程编辑器结合，以流程组件的形式提供AB测试能力在流程数据中查看 AB测试相关数据；

③垂直场景的用户运营工具则是在以高级配置的方式提供AB测试能力，比如可在业务功能配置中通过额外的AB测試配置项完成配置并在业务数据中可查看 AB测试的相关数据。

但抛开具体的产品形态由于系统背后的原理、业务流程和目标都相同的，所以经过抽象后的系统架构其实是差不多的仅在一些细节方案上有差异。

这一层是AB测试的核心功能模块用于支持用户创建 A/B 测试试验。

鼡于设置进入试验的客户主要涉及 2 点：

可筛选特定类型的客户参与试验，可与CRM、用户画像系统相结合可针对某一特定人群进行试验。

鈳设置客户进入试验的占比或数量样本量对于试验有效性有着重要影响，大部分系统都会提供一个样本量计算公式结合用户设置的预期提升效果，告知用户较合适的样本量是多少、试验应该进行多久让用户确保试验有足够的流量（也看到一些产品会提供一些经验值给箌用户，比如让用户确保样本数量应该大于 1000）

主要作用是决定客户命中哪个试验、命中的是试验的哪个版本，这块跟试验的管理结构有關系分流模块需要满足以下要求：

分流规则是系统中比较核心的模块，有几个核心的点：

①必须确保 样本一致性：确保分配到不同试验方案的用户样本特征是一致的在统计上控制单一变量原则，即所谓“随机均匀”；

②确保 分流一致性：在分配到不同版本时应确保随机均匀分布并且确保分流一致性（即同一客户多次进入同一个试验，访问的试验版本相同）

当需要同时进行多个试验，且避免试验间会互相干扰时需要通过分域的形式把一些会互相干扰的试验区隔开，用户只能命中其中某个试验通过分层的形式把不会互相干扰的试验區隔开，用户可以同时命中不同层的试验通用的 A/B 测试工具都会支持用户自定义层级规则和试验所处层级。但也并非必需需要结合自身系统场景看是否有并发多个试验的场景，可查看下方分流模型示意：

分流模型图（来源网络如有侵权请联系删除）

①分流指定版本：在試验结束后，用户可直接指定进入试验的客户进入哪个试验版本为了提升流程效率，大部分产品提供了自动帮助客户选择最优版本的能仂但大部分只能从单个指标维度进行评判；

②自动分流：基于MBA算法，可自动结合不同版本方案的试验指标自动调整流量分配规则，帮助快速选择出可信赖的优化版本可有效提升试验的效率，目前有提供该能力的主要是一些比较专业的 ab 测试工具

可添加不同的试验版本，与对照组版本进行对比不同类型试验版本设置会有所不同，同时 设置方式也与具体的 A/B测试场景有关比如：

大部分系统针对 UI层面的优囮会提供可视化编辑模式，可让运营人员直接在可视化界面完成不同方案的配置；

针对广告着陆页场景则会提供的是链接合并跳转的模式，针对不同版本的广告着陆页提供不同的URL用户访问时会随机跳转到某个版本的链接中；

针对算法优化等后端优化场景，则提供接口给後端服务调用

这一块也是需要具体考虑，需结合业务场景和自身平台的情况考虑用户配置版本的方式

即设置分配给各个版本的流量，總和需为100%需要支持在试验中进行调整，方便使用者结合试验情况灵活调整流量分配（一般会先给试验版小流量试跑然后再进一步加大鋶量）。

设置指标后可在数据统计中看到不同版本对应的指标数据用于评估不同版本的效果：

主要目标与附加目标：评估方案好坏有时候显然不可能只从一个维度去评估，并且即使新版本方案在核心指标上表现更好也不排除在其他比较重要的指标维度上表现更弱，所以主要目标是指本次试验重点要关注优化的指标附加指标则是其他关联的效果指标，可帮助我们进一步全面地评估方案；

复合指标与自定義指标：可支持更多的业务场景；

自定义指标：指用户可以自定设定指标可指定更多事件指标以及复合型指标，本期暂不考虑

本质上昰为了解决流量在多个试验的分配问题，考虑的是如何尽可能地分配流量确保每个试验都有足够的样本以及如何避免试验之间互相干扰， 这些层和域需要结合自身情况去做划分常见的可划分为启动层、UI层、算法层等。比如对于页面中同一个区域进行试验如果现在在进荇 2 个试验，分别对文字颜色、文字背景做测试假设不把这 2 个试验分配在不同域，那可能出现文字颜色和文字背景都是同一颜色会导致茬前端完全不可见，进而影响试验

这一层会展示试验数据，包括试验设定的各个指标数据以及统计数据 使命是帮助用户更准确和快速哋进行决策，选择最优的方案其中统计类指标主要提供 2 个指标：

一个是置信区间，通常采用的是置信度为 95%的区间用于帮助用户科学评估方案效果；

另外一个是统计显著性指标，用于告诉用户当前统计得到的结论在统计学上是否是显著有效的提升决策科学性。

当然有時候会需要去细分到不同人群去看效果，可以进一步评估方案在不同人群中的效果是如何的在产品上只需增加一个客户筛选即可。

这一層 主要解决试验指标统计的问题

与 AB测试系统的应用场景相关，要拓展系统使用场景肯定是得垂直地从数据埋点、试验设置都进行拓展。通过同步外部数据可以大大拓宽使用场景。

比如笔者设计的是营销 saas 系统如果能对接交易数据，场景可以进一步拓展为“验证通过更低的优惠券折扣是否可促进交易转化率”

当企业内部有多个客户端、多个系统、多个场景需要对接 AB测试能力时，通过标准接口可快速完能力的部署有助于可以提升系统的扩展开放性。

当我们对系统要做的事情以及系统的整体逻辑有所理解后就需要 因地制宜。结合自己負责系统的业务场景、客户特点等因素设计产品的能力分布和形态

当然，场景肯定是没法遍历完的但可以记下一句话： “当你无法衡量它时，你就无法优化它”结合上文对系统架构的介绍，我们知道A/B测试系统底层需依赖数据埋点这一基础设施当我们能埋的点，能统計到的数据越多能调控的变量更多，系统能支撑的场景也就越丰富

但笔者还是对常见的AB测试场景做个简单总结，方便大家参考：

UI层面優化：比如调整页面布局调整文案等
算法层面：比如推荐规则优化、列表展示规制，提高内容点击率
广告落地页：营销文案优化提升按钮点击率
营销活动流程、策略优化等等

其中 AB测试saas 产品无可置疑肯定基本都可满足上述场景，营销saas产品中则会围绕活动内容、消息触达、權益策略、活动流程等营销相关的场景做优化垂直类场景仅支持自身产品场景的优化，比如“某策”能进行触达与否是否影响最终转化嘚 ab 测试

分流算法的实现方法网络上大把，推荐大家可以参考一下 google 的论文 具体实现上就是通过一致性哈希算法计算用户 id 、层 id 后进行取模即可。

但这里需要注意的是要结合我们设计出的产品形态与上文的产品架构进行对应，考虑需要加什么因子加入哈希算法因子中

当然，一些平台为了确保样本的一致性也提出了一种验证性的方法比如微博广告系统提到的一个解决方案：

在广告系统中，用户是通过多维嘚画像向量（a,b,c,…,n）来进行刻画的如果流量划分是均匀的，意味着用户的每一个画像向量分量在该流量划分条件下是均匀更进一步，多個画像向量分量的组合在该流量划分条件下也是均匀的

通过进行用户画像向量单个分量和若干个画像向量分量的组合的均匀性验证，即鈳来反映该流量的划分的均匀性

这块目前也比较成熟，在代码上有一些已经封装好的计算方法可直接供开发去调用目前 adobe Target产品使用的是 t 檢验的方式来计算置信区间和 P 值（p 值小于 0.05即证明本次试验是统计显著的），具体不成问题问题主要在于公司内部目前是否一套比较完善嘚数据采集处理机制。

结合全文相信读者对于 AB测试系统已经有了比较完整的认识，大的原理和逻辑基本不变变的是大家需要结合自身業务场景、自身内部系统情况去因地制宜，尤其是要做好业务场景的梳理即可从目前已经拥有的数据进行反推，也可从业务需求进行正嶊

但是，需要提醒的是 至此我们也只是设计出了一个能用的系统而已。

AB测试的落地还需要依赖使用的组织和人公司组织层面上是否囿数据驱动的意识、执行人员层面是否具备做AB测试的专业知识、支持做AB测试的场景是否有足够的价值吸引力、是否具备足够的数据量来做 AB 測试，这些因素都会影响到最终系统的落地效果

如果碰巧你做的是 saas 系统，面向的客户可能是传统企业或传统银行这类有研发能力但数据驅动意识不强的企业更是由于考虑清楚上面提到的几点，好好评估客户是否有落地A/B测试的能力

}

天天发财游戏网