无论是买数字彩票还是足球彩票的朋友,一直都在做一件事情,那就是总结过去的规律,并希望通过自己研究出的规律在未来赚钱。然而,你会不断地发现,一旦你找到了规律之后,哪怕是过去100次都严格遵循的规律,等你指望它帮你盈利的时候,这东西突然失效了!

你买彩票中过奖吗?

在解答这个让人困惑的问题之前,我们先来看看台湾大学林轩田老师在《机器学习——基石》的课程里给我们讲解过一个例子:

你买彩票中过奖吗?

如上图,有一个大玻璃缸,里面有橘色和绿色两种颜色的弹珠,现在我想知道橘色弹珠的比例u。由于玻璃缸里的弹珠数量特别大,我不太可能统计所有颜色的弹珠。一般人都会想到有个简单的办法就是随机抽一把抓得到N个弹珠,然后统计下这N个弹珠里橘色弹珠比例v。概率论的数学家告诉我们,u和v相差为ε的概率为:

你买彩票中过奖吗?

简单点来说,就是你抓的N越大,那么误差就很可能越小。这个道理告诉我们,对于一次抽样的某个统计规律,在很大概率上与总体的规律一致。

回顾上面提到的100次的过去事件,通过各种“规律”的挑选,你很可能找到一个足够好的“规律”,使得这你能解释过去所有的100次事件。但是这个规律是极度筛选的结果,而对于这100次事件以外,错误率可能会高的吓人。

为什么抓弹珠的理论在这里会彻底失效而不支持实际的结果呢?是N不够大吗?有一定的关系,但这不是最主要的问题。

来看看下一个例子:假设一个教室里有100个学生,每个学生都从自己的口袋里掏出硬币抛5次。你会发现,很可能(这个概率超过95%)会有人连续5次都是正面。那么我们是否就能说,这个人所抛的硬币出正面的概率远高于背面概率呢?显然不是,之所以表现的幸运,那是因为我们从100个硬币中进行有目的筛选的结果。这种筛选,表面上找到了规律,事实上却破坏了“随机抽一把”的前提。

你买彩票中过奖吗?

但是弹珠实验没有筛选,随机抽一把,这一把橘色比例与罐子里的比例相当。你不能抓100次,其中有一次全是橘色,就认定罐子里全是橘色吧。

回到100次历史事件的预测中来,通过各种“规律”的挑选,你很可能找到一个足够好的“规律”,这个规律在过去100次事件中都符合,即你能给出一个看似足够好的预测。但是这个规律可能就是各种规律筛选的结果,因为在这100个事件以外,错误率可能会高的吓人。

你买彩票中过奖吗?

说到这里,对于研究彩票规律的你来说可能很失望。不要担心,虽然我们办法来解决规律有效性的问题:

1. 增大观察范围:你可以将100次事件增加到1000次事件,见识过的实例越多,见多识广,你所总结的规律当然也就越可靠。

2. 简化规律假设:总结的规律越复杂,越可能是过度挑选的结果,其在现实中却可能什么都不是。因此,你需要尽可能简单的假设,来提升同样观察范围内规律的可靠性。

3. 添加规律验证:你还有第三种方法来解决这个过度假设的规律。你需要的是在这100次事件(A组事件)以外,随意再挑选若干次事件(B组事件)进行验证,如果这个规律依然和预想一致,那么你很可能就真的可以赢钱了。这里要特别注意,你通过A组事件总结,B组事件绝对不能偷看。这就好比学生准备考试,显然不能事先偷看老师的试卷是一个道理。

这样,这个规律并没有作弊或者说过度挑选,当它依然可以发挥想象的效果时,那么它将真正可以称之为规律。

发表回复

您的电子邮箱地址不会被公开。