你好!我是 Vanya Mochilin,在 Lenta 在线部门的产品分析团队工作。在本文中,我将向您介绍我们为业务规划和订单预测开发的框架。它有助于了解为了实现财务目标需要吸引多少新客户来提供该服务。
业务问题
每年,企业都会面临如何实现目标价值的问题,例如了解投资营销的可行性。以前,我们没有一个方便的工具可以进行灵活的计算,以考虑到策略、季节性和外部因素的变化。在 2023 年底,我们创建了一个增长模型——一种预测工具,可以帮助企业了解营销需要吸引多少新客户才能实现计划年度的收入和订单目标。
框架可以做什么
- 使用简单的 ML 算法预测订单;
- 分析场景:例如,如果我们减少营销投资并且没有获得目标数量的新客户,会发生什么?
- 优化您的预算:您可以按月分配客户获取;
- 进行压力测试来评估某些月份新客户数量的下降将如何影响收入短缺。
此外,如果我们想证明我们的产品投资的有效性,重要的是要了解客户保留率的哪怕是小幅提升(例如新客户群增加 1%)也会对同比收入产生怎样的影响。
工作原理
简单来说,我们的框架就是一个根据客户行为预测订单数量的“计算器”。输入数据包括:
- 订单历史和客户退货;
- 营销投资的限制;
- 外部因素(例如新的交付条件)。
我们分析旧群组(不同时间到达的用户群体)并对新群组进行预测。例如,如果已知三个月后仍保留 20% 的客户,则在预测新用户时会考虑到这一点。
一个具体的例子
假设您需要了解如果在营销上投资 _N_ 百万 土耳其电报数据 卢布,一年内您将获得多少订单。
- 该框架分析老客户的数据:他们在第一次下单后如何回访,下了多少次重复订单;
- 然后预测需要获得多少新客户才能达到指定的 KPI;
- 结果,企业得到了具体的数字:例如,为了实现收入 X,它需要每月吸引 Y 个新客户;
- 在此之后,营销团队决定使用什么工具来实现这一目标:广告、博客、绩效营销或其他渠道。
与群组合作
用户在服务中的行为取决于与产品交互的时长。新老客户对变化的反应不同,例如新功能的推出或营销机制的影响,因此他们的回报(保留)可能会有很大差异。
为了准确预测订单,最好按群组分析数据。群组是指根据某些特征(例如,根据首次购买日期)联合起来的用户群体。
首先,我们按群组检查客户,并查看以下部分:
- 首次购买的月份;
- 平台(iOS、Android、Web);
- 获取渠道(有机渠道、付费渠道等)。
针对每一个订单,建立单独给定时期的订单预测,然后合并数据以获得订单总量。
订单预测
我们区分了 3 组群体:
- 旧的(超过 8 个月的观察结果) ——根据累积数据进行预测;
- 相对较新(少于 8 个月,但不少于 3 个月) ——我们根据曲线的第一部分建立预测,并用来自类似旧队列的中值进行补充;
- 新(少于 2 个月) ——我们使用过去类似群体的平均指标。
由于用于训练模型的数据量不同,因此每个群组的预测也使用其自己的逻辑进行计算。
在进行预测时,重要的是要考虑以下特点:如下图所示,在前三个月,四月份用户的订单数量急剧下降。然后,下降趋势就不再那么明显了。季节性也很明显:12 月份订单量的增加与交货旺季有关,而 6 月份订单量的下降则与淡季有关。
为了在预测阶段考虑留存曲线的复合形式,我们使用组合模型:
- 前3个月呈双曲线趋势,这段时间内订单“下降”得最快;
- 接下来使用指数衰减,显示客户如何继续进行购买。
指数的幂由线性模型预测,该模型考虑通过虚拟变 如何提升电话沟通技巧 量影响用户行为的商业和宏观经济事件。现在我们确定了三个这样的事件,因此我们的模型中的虚拟变量有三个系数。
预测的基本步骤:
- 我们将队列分为以下几组:“旧”(超过 8 个月)、“相对较新”(预测期开始前 8 个月)和“新”(无数据);
- 让我们从指标本身转到系数:系数 = 订单数/群组规模。这对于将所有预测统一到同一规模是必要的;
- 我们对系数进行去季节化处理。也就是说,我们消除季节性波动以获得更准确的预测;
- 对于每个群体,我们根据上面描述的模型构建一个基本预测;
- 我们恢复季节性并返回到原始指标。
优化客户获取
现在到了最有趣的部分。了解不同客户群体的行为,我们可以计算出每个月需要吸引多少新用户。为此,我们可以使用常见的非线性优化问题的解决方案。
对于“新”群组,您需要设置其大小,即图表上的第 安圭拉讯息 一个点。我们向模型提供每个渠道每个月预计的新客户数量数据。我们与营销同事一起大致了解跨渠道分布将如何变化,并关注不同月份新客户总数的上限。
我们将按照以下步骤进行:
- 我们设定每年所需的订单数量,考虑重要的商业事件和宏观经济因素,以便设置预测期虚拟变量的值,以及每个月新客户的上限;
- 我们输入每个月新客户的数据;
- 根据这些数据,系统对全年的订单总数做出预测;
- 我们重复步骤 2 和 3,直到找到最优解决方案,其中预测值和所需订单数量之间的差异最小。