合成控制法的原理和扩展实现
1. 案例场景
假设你是肯德基的门店运营负责人,某天,你们决定在某家分店(称为 A 店)推出买一送一的促销活动。你想评估这项促销活动的效果,看看它是否提高了这家分店的销售额。
这个评价问题在于,你只有一家分店进行了促销活动,其他的分店都没有进行相同的促销。你无法直接比较 A 店的销售额和没有进行促销的分店的销售额,因为这些分店可能本身就存在很多差异,比如地理位置、人流量等因素。
但通过使用其他分店(控制组)的数据来构建一个“虚拟”的对照组,这个虚拟的对照组在没有促销的情况下表现得和 A 店相似。通过比较促销之后实际的 A 店和这个虚拟对照组的业绩,就可以评估促销活动的效果。
- 收集 A 店在促销活动前后的一段时间内的销售数据。
- 收集其他分店在同一时间段内的销售数据。
- 选择一些影响销售额的关键特征,比如每天的顾客数量、人均消费额等。
通过对其他分店的特征进行加权平均,构建一个“合成”分店,使其在促销活动开始之前的特征与 A 店尽可能相似。例如,假设你选择了三家分店 B、C 和 D,它们在促销开始前的特征分别是:
- B 店:顾客数量 100 人,人均消费额 20 元;
- C 店:顾客数量 150 人,人均消费额 25 元;
- D 店:顾客数量 200 人,人均消费额 30 元。
如果你发现 A 店在促销开始前的特征是顾客数量 150 人,人均消费额 25 元,那么你可以给 B、C、D 店分配权重,使得加权平均后的特征与 A 店相近。比如,权重可能是 B 店 20%,C 店 60%,D 店 20%。
实际和合成控制组有这样的比较效果:
- 促销活动前 A 店销售额序列和合成组(由其他分店加权平均得到)销售额序列基本一致。
- 活动后,比较 A 店的实际销售额与合成控制组的预测销售额。
- 如果 A 店的实际销售额显著高于合成控制组的预测销售额,那么可以认为促销活动是有效的。
以上是一个简单的原理说明,下面从详细的数学理论做完整推导和扩展。