不少人提到很多其他时间序列拟合出来的 也很高,这里先不纠结部分答主忽略了这些所谓的“也很高”的其实比天猫的低至少一个数量级的事实。
我们先详细检验下这种三次方回归的预测效果。
这里我们做一个滚动预测,即从2013年起,我们每年开始用三次方回归预测接下来未来的所有数据。
之所以选2013年是因为2013年开始起有了5个数据点,达到了做三次方拟合的最低要求(4个数据点的话拟合度就是100%了,大概率过拟合)。
结果如下:统计下相对误差,得到下图:比较让人震惊的是,用2013年的数据来预测2019年,误差也有只有-3.6%。
用2017年的数据预测今年的,甚至比用2018年的更精准。
作为比较,我们对前面有答主提到的美国黑色星期五的数据做同样预测(2009-2018数据,同样用3次方模型),则得到的误差如下:绿色的右下角看上去十分合理:预测的周期越远,误差越大。
再看下实际预测值,在长周期看来根本没就没什么预测能力:我们换个角度看下预测n年后的数据和误差之间的关系:明显看出,黑色星期五数据,预测的越远误差越大,天猫的。
。
。
真牛逼。
也许是因为黑五的数据由多个商家组成,不太好规划吧。
结论:1、3次方在天猫上拟合的不是一般的好,好的远超过其他时间序列。
这个好不是由 体现的,而是由上述样本外检验(交叉验证)决定的。
观点:1、不管怎么样,原博主真心牛逼,提前以千分之二的精度预测了今年双11的数据。
这个牛逼主要体现在两个层面,一是提前性。
提前7个月作出预测可比那些马后炮的拟合难度要高多了。
二是精度真高。
那些自称用多项式对其他时间序列做了预测的答主,你们自己看看你们的误差,好意思跟人家比吗?2、我非常期待天猫明年的数字。
3301亿这个预测值现在已经传的全网到处都是了。
明年天猫到底是跟还是不跟呢? 跟吧,会被调侃半天,而且时候的震撼效果肯定会差很多。
刻意和预测值拉大差距吧,其实也会在拟合曲线上显示为异常值,毕竟公关负责人已经出来说了,增速稳定才是正常现象。
瞎猜:1、KPI压力导致为了完成计划不计手段?天猫执行力牛逼?3、双11的销售计划划尼玛难道2013年就做好了??最后补充一些学术讨论:有答主提到,美国黑色星期五的数据,如果用线性模型做预测,误差也不大。
但线性能预测是不值得一提的,它仅代表了增速稳定而已,属于常见现象。
而三次方在样本外长期表现好是一个奇葩现象,一是因为它很难像线性或者指数一样被解释为某些自然规律,二是是三次方由于参数多,容易被过拟合,导致样本外结果惨不忍睹,比如在黑五上。
而天猫正的三次方却没有过拟合,这才是它真正异常的地方。
后续我会系统的搜集一批2009-2019期间的宏观数据,并系统的扫描各类模型的样本外表现,真正有意义的统计一下天猫数据是否属于小概率事件。
也欢迎大家推荐数据源。
- 夏天的风 姑娘 老男孩 理想三旬 月半小夜曲 生日快乐 其实 那些年 光阴的故事 少年 后来遇见他 那女孩对我说 世界这么大还是遇见你 火红的萨日朗 想见你想见你想见你 冬眠 关键词 芒种 往后余生 关山酒 年轮说 小镇姑娘 烟雨行舟 记念 你笑起来真好看 来自天堂的魔鬼 学猫叫 你的酒馆对我打了烊 不仅仅是喜欢 浪人琵琶 卡路里 带你去旅行 红昭愿 纸短情长 最美的期待 体面 小跳蛙 悬溺 侧脸 山楂树之恋 我的名字 失眠飞行 有可能的夜晚 追光者 请先说你好 流浪 东西 星球坠落 我的将军啊 烟火里的尘埃 答案 心如止水 我们不一样 嘴巴嘟嘟 晴天 成都 告白气球 南山南 女儿情 天空之城
报歉!评论已关闭。