如何看待双十一销售额完美分布在三次回归曲线上且拟合高达 99.94%？是巧合还是造假？-520吉他网

当前位置：首页 > 头条 > 如何看待双十一销售额完美分布在三次回归曲线上且拟合高达 99.94%？是巧合还是造假？

时间：2019-12-05 来源：网络资源标签：双十一

不少人提到很多其他时间序列拟合出来的也很高，这里先不纠结部分答主忽略了这些所谓的“也很高”的其实比天猫的低至少一个数量级的事实。

我们先详细检验下这种三次方回归的预测效果。

这里我们做一个滚动预测，即从2013年起，我们每年开始用三次方回归预测接下来未来的所有数据。

之所以选2013年是因为2013年开始起有了5个数据点，达到了做三次方拟合的最低要求（4个数据点的话拟合度就是100%了，大概率过拟合）。

结果如下：统计下相对误差，得到下图：比较让人震惊的是，用2013年的数据来预测2019年，误差也有只有-3.6%。

用2017年的数据预测今年的，甚至比用2018年的更精准。

作为比较，我们对前面有答主提到的美国黑色星期五的数据做同样预测（2009-2018数据，同样用3次方模型），则得到的误差如下：绿色的右下角看上去十分合理：预测的周期越远，误差越大。

再看下实际预测值，在长周期看来根本没就没什么预测能力：我们换个角度看下预测n年后的数据和误差之间的关系：明显看出，黑色星期五数据，预测的越远误差越大，天猫的。

。

真牛逼。

也许是因为黑五的数据由多个商家组成，不太好规划吧。

结论：1、3次方在天猫上拟合的不是一般的好，好的远超过其他时间序列。

这个好不是由体现的，而是由上述样本外检验（交叉验证）决定的。

观点：1、不管怎么样，原博主真心牛逼，提前以千分之二的精度预测了今年双11的数据。

这个牛逼主要体现在两个层面，一是提前性。

提前7个月作出预测可比那些马后炮的拟合难度要高多了。

二是精度真高。

那些自称用多项式对其他时间序列做了预测的答主，你们自己看看你们的误差，好意思跟人家比吗？2、我非常期待天猫明年的数字。

3301亿这个预测值现在已经传的全网到处都是了。

明年天猫到底是跟还是不跟呢？跟吧，会被调侃半天，而且时候的震撼效果肯定会差很多。

刻意和预测值拉大差距吧，其实也会在拟合曲线上显示为异常值，毕竟公关负责人已经出来说了，增速稳定才是正常现象。

瞎猜：1、KPI压力导致为了完成计划不计手段？天猫执行力牛逼？3、双11的销售计划划尼玛难道2013年就做好了?？最后补充一些学术讨论：有答主提到，美国黑色星期五的数据，如果用线性模型做预测，误差也不大。

但线性能预测是不值得一提的，它仅代表了增速稳定而已，属于常见现象。

而三次方在样本外长期表现好是一个奇葩现象，一是因为它很难像线性或者指数一样被解释为某些自然规律，二是是三次方由于参数多，容易被过拟合，导致样本外结果惨不忍睹，比如在黑五上。

而天猫正的三次方却没有过拟合，这才是它真正异常的地方。

后续我会系统的搜集一批2009-2019期间的宏观数据，并系统的扫描各类模型的样本外表现，真正有意义的统计一下天猫数据是否属于小概率事件。

也欢迎大家推荐数据源。

报歉!评论已关闭。