每日能赚50的方法（分享领5元or分享送5元）

巡山小妖精 2023-02-07 05:42:41

背景介绍：咖哥数据科学讲习所，是为各类企业提供数据服务的机构，其核心宗旨是在普及数据科学知识的同时，帮助企业从数据中发现肉眼无法察觉的秘密，形成商业洞见。咖哥，是咖哥数据科学讲习所的所长，数据分析和商业智能专家，数据演绎法这一概念的提出者。

两个方案：“利己”还是“利他”

这天清晨，数据科学讲习所刚刚开业，咖哥就接到了一个老客户的电话。来电话的是沪东商城的运营主管，马总。

“咖哥啊，我们最近有一款新品要上市啦。我们想让用户推荐这款咖啡壶给朋友，如果朋友下单成功，该用户获得 5 元优惠券。你说好不好？”

没等咖哥回答，马总接着说：“但是，问题来了，有一个运营同学建议不要写‘分享领 5 元’，可以将它改成‘送朋友 5 元’。这才显得推荐的人大方！”

每日能赚50的方法（分享领5元or分享送5元）(1)

咖哥听了马总的难题，觉得很有意思，乍一想当然是自己拿钱才会转发，不然不是白忙活一场；不过，“送朋友 5 元”这个法子也的确很不错。

那么，这两个方案，哪个更好呢？

咖哥虽然不知道哪个方案更合适，但他建议马总两个方案都尝试一下。

“两个都用？”马总问，“那可不成，优惠得太多我可就赔本了。”

“我的意思是把产品促销页做成两个版本，同时将它们随机引流到相同数量的用户群体。监控两周后，把数据拿来让我们分析一下。”

这就是通过对照实验的方法比较二者的效果。

A/B测试，治好选择困难症

马总给我们带来的这个案例是一个典型的 A/B 测试案例。A/B 测试也可以叫作 A/B 实验，在数据分析和运营领域可谓是大名鼎鼎。

什么是 A/B 测试？举个例子，同样都是引导用户购买的按钮，上面的文字就可以有所不同。

每日能赚50的方法（分享领5元or分享送5元）(2)

按钮文字中细微的不同之处很可能会大大影响流量。因受众不同，结果也会不同。年轻人喜欢新鲜的东西，但若是针对中老年用户，“戳此入手”这 4 个字不一定是好方案。

A/B 测试就是评估一种变体（称为实验）是否比当前状况（称为对照）好的科学方法。对于产品、运营人员来说，A/B 测试从构建假设开始，假设的来源可以是主观判断、用户反馈或团队讨论结果。其目的在于通过科学的实验设计、控制样本的代表性，以流量分割与小流量测试等方式获得具有代表性的结论，并将结论应用到全部流量。

A/B 测试可以应用在产品交互设计、产品功能迭代、推荐算法、广告投放和商品运营等诸多领域，它可以简单有效地评估两种方案之间的 ROI 差异。

每日能赚50的方法（分享领5元or分享送5元）(3)

▲ 图源：范叶亮

A/B 测试的具体步骤主要就4步。

（1）确认实验目标——以这个促销为例，目标就是找出“自己得优惠5元”和“送朋友优惠券5元”哪个转化率更高；

（2）设计实验方案——这里的实验方案是在未来的两周之内，随机把两种类型的促销引流到可能购买产品的人群；

（3）上线实验与过程监控——上线时，需要保证引流的比例是1∶1，而且时间、区域、群体、位置都要按照这个比例平均分配，这样可以保证实验组和对照组的相似性；

（4）结果复盘——拿到两种促销的转化率之后，需要根据统计学原理来分析、确定实验结果，得出结论。

拿到数据就够了？

不，你还需要一些统计学知识

A/B测试方案实施后，两个方案被同时投放了两个礼拜。时间很快就过去了，马总已经采集到了两种咖啡壶促销随机分流之后的两组数据。现在可以根据马总获取的数据分析A/B测试结果了。

在开始数据分析之前，最好还是了解一些相关的统计知识。

对照实验

概念：对照实验是现代科学的基础工具之一。在对照实验中，实验者会将实验组和对照组放在同一个环境下进行试验，也就是除了要验证的新方法，其他的影响因素尽量相同。

在本案例中：如果测试 A 和 B 两个页面，我们会同时激活两个站点并随机将用户定向到一个站点，这样，就控制了除了促销手段之外的其他所有变量，比如用户的组成，季节对促销的影响等。

假设检验

概念：假设检验（hypothesis testing）是推论统计中用于检验假设的一种方法。它先对总体参数提出一个假设，然后用样本数据判断这一假设是否成立。在假设检验中，原假设（H0）就是实验中想反对的假设，备择假设（H1）就是实验中想支持的假设。

在本案例中：马总认为“送朋友 5 元”这个新推广方案能提高点击率，那么这就是备择假设 H1。而原假设 H0 则认为相较于原来的推广方案，“送朋友 5 元”这个新推广方案并不能提高点击率。

P值

概念：假设检验中的重要指标是P 值。P 值是个概率，它是在原假设为真的条件下，样本数据拒绝原假设这个事件发生的概率。—— 原假设为真，数据却把这个假设拒绝了，这显然不是我们想要的。

在本案例中：从统计学的角度来说，要求 A/B 测试的结果有显著性差异，如果 P 值太高，我们就认为实验结果的差异显著性不够，因此我们希望P值越低越好。

那么，P值多低才算低呢？要回答这个问题，我们再来了解一下另外两个统计学概念——置信区间和显著性水平。

置信区间

概念：置信区间是一个范围，如一批学生的考试成绩是 0 到 100 分，如果我们给出一个分数区间 [55 分 -95 分 ]，然后说“该区间的置信水平为 95%”，这就代表学生们的考试成绩落在这个范围内的概率是 95%。也就是说，在所有学生中有 95% 的人分数都在这个区间内。

在本案例中：我们使用 95% 的置信水平进行这一次A/B测试的置信区间的估计，代表着95% 的人的都处于这个测试区间。

每日能赚50的方法（分享领5元or分享送5元）(4)

显著性水平α

概念：上面这个图中的α是显著性水平，它是估计总体参数落在某一区间内可能犯错误的概率。通常 α取值0.05 或 0.01。

对于 A/B 测试来说，这表明当根据实验结果作出拒绝原假设的决定时，其正确的可能性（概率）为 95% 或 99% ；这个决定出错的概率则为 5% 或 1%，可以看作是小概率事件了。

在本案例中：我们将显著性水平 α 设定为 0.05，那么在 P 值等于 0.04 的情况下，我们接受备择假设，也就是接受了B方案！

说了这么多，如果你没有统计学的基础，一定会觉得有点绕。简而言之，记住，我们就是要用统计学工具求出AB测试的P值，然后以0.05作为显著性水平的阈值，我们希望P值越低，实验结果就越可信。否则，P值太大，超过了我们可以接受的阈值，出错的概率也就越高。

当然了，上面对A/B测试背后的统计学知识进行了极度地简化，如果大家有兴趣，可以参考统计学书籍或者《数据分析咖哥十话》的第9话。

案例实战

下面，咱们就跟着咖哥开始这次的咖啡壶A、B赠券方案的A/B测试实战。

这个实验是随机选择 1500 个用户并将他们导流到 A 页面，再选择 1500 个用户并将他们导流到 B 页面，然后比较两者的转化率。

具体实战步骤如下：

（1）数据的导入与数据可视化；

（2）比较 A、B 两个版本带来的转化率增量；

（3）用 Scipy 的 stats 模块（统计学工具）中的 ttest_ind() 方法，也就是 t 检验方法求出 P 值，看实验结果是否可信。

第一步，数据导入

每日能赚50的方法（分享领5元or分享送5元）(5)

该数据集中共有 3000 个用户的记录，输出结果中显示了用户访问的是旧页面（自己领 5 元）还是新页面（送朋友 5 元），以及收到推荐链接的新用户最终是否购买了该咖啡壶。

第二步数据可视化

如果我们用饼图展示用户导流至旧页面（A）和新页面（B）的比例，会发现二者各占 50%。这符合 A/B 测试的设计原则。

每日能赚50的方法（分享领5元or分享送5元）(6)

下面我们分析一下当促销页面变化后，最终的转化率有何改变。

每日能赚50的方法（分享领5元or分享送5元）(7)

上图中可以看出，新页面的转化数量与旧页面相比有一定的增加。

第三步计算转化率

计算一下新、旧页面的转化率。

每日能赚50的方法（分享领5元or分享送5元）(8)

新页面的转化率约为 0.435，它比旧页面的 0.418 略高。

第四步检验测试结果的统计学意义

用户访问新页面的实验组相对于用户访问旧页面的对照组来说，转化率有所提高。不过，是否能由此就确定该实验是成功的，从而选择新的促销推广方案？是否还有其他影响这一差异的因素呢？要回答这些问题，我们需要检查实验组中的上升趋势是否具有统计学意义。

利用 Scipy 的 stats 模块（统计学工具）中的 ttest_ind() 方法可以轻松算出需要的 P 值，用来检验实验结果的有效性。

每日能赚50的方法（分享领5元or分享送5元）(9)

每日能赚50的方法（分享领5元or分享送5元）(10)

输出结果中显示，P 值在阈值0.05之下，因此可以认为测试结果有效。

总结复盘

A/B 测试的应用范围非常广，可以在产品设计、市场营销等环节中发挥作用，常用于验证与用户体验相关的改动。

在本A/B测试实战中，马总原以为多数用户还是会选择把新品的5元优惠券留给自己用；可测试结果却表明，如果选择把这5元优惠券赠送给朋友的方案，转化率会更高。这是不是说明了，在网络时代，相较于自己获得优惠，大家更乐于慷慨地将优惠赠与他人呢？

咖哥认为，在应用 A/B 测试时，还有下面几点需要注意：

（1）样本的数量要足够多。

（2）样本需要随机分配，保证两个组类似。

（3）消除其他变量的影响，例如两个组不能一个先测试，另一个后测试。

（4）即使 B方案的转化率比 A方案略高，但是如果 B方案会对其他运营环节造成不利影响，那也不一定要选择 B 方案。

（5）要保证结果具有统计学上的显著性差异。

（6）从多个角度对结果进行解释，找出 B 方案优于 A 方案的根本原因。

咖哥通过A/B测试帮马总找到了更合适的营销推广方案，这就是数据分析的魅力。

想了解更多有趣又有料的数据分析助理运营增长的案例，让数据思维为自己所用，从而实现业绩增长，突破职业瓶颈，请了解一下这本《数据分析咖哥十话》~

本文节选自《数据分析咖哥十话》一书第9章《君向潇湘我向秦：用 A/B 测试助力促销》，详细内容参见《数据分析咖哥十话》一书。

每日能赚50的方法（分享领5元or分享送5元）(11)

作者：黄佳新加坡科技研究局Al资深研究员，前埃森哲新加坡公司资深顾问，二十年IT行业从业经验。机器学习、云计算、SAP专家，曾出版《数据分析咖哥十话》《零基础学机器学习》《SAP程序设计》等多部受读者好评的IT书籍。

黄佳深耕数据科学领域多年，参与过政府部门、银行、电商、能源等多领域大型项目，积累了极为丰富的人工智能和大数据项目实战经验，对数字智能化项目如何落地有深刻的思考和丰富的经验。

本文审校：栾传龙王旭丹

参考资料：

1.数据分析咖哥十话，人民邮电出版社 2022

2.你所应该知道的 A/B 测试 (A/B Test You Should Know) 范叶亮

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

每日能赚50的方法（分享领5元or分享送5元）

猜您喜欢

芝加哥为什么枪击很多（美国芝加哥经历）

腾讯开心鼠英语怎样注册（兑换礼品竟然收到空包裹）

二次元新手注意事项（二次元必学の入门词汇）

豌豆必须要焯水吗（青豌豆想长时间储存）

使徒行者中的欢喜哥是谁（这才是使徒行者）

商鞅变法是在什么背景下产生的（商鞅变法到底发生了什么）

商鞅变法的七点内容（五分钟带你认识）

热门推荐

排行榜