让人困惑的小学数学题--Simpon悖论
小晨老湿为了庆祝盛大游戏上市,给大家出了一道题:
一群同学玩盛大的休闲游戏泡泡堂和大型网游永恒之塔。
男生玩泡泡堂的有10人,其中8人顺利升级;玩永恒之塔的有90人,其中36人顺利升级;
女生玩泡泡堂的有100人,有72人顺利升级;玩永恒之塔的有50人,只有5人能顺利升级。
接下来要问的是,到底是男生玩游戏比较强呢?还是女生玩游戏比较强?
好,我们来解答这个简单的题目。
玩泡泡堂的时候,男生升级率80%(8/10 ),女生升级率72%(72/100),男生略强一些;
而玩永恒之塔呢,男生升级率40%(36/90),女生升级率10%(5/50 ),男生同样更强。
通过这样的计算,得到了男生玩游戏比较强的结论。且慢,小晨老湿要给出另外一个解答过程哦:
男生玩游戏,升级率是(8+36)/(10+90)= 40%;
女生玩游戏,升级率是(72+5)/(100+50)=51%;
所以看起来女生玩游戏更强一些哦。
什么?男生在两项游戏中均强过女生,但是总体看起来却比不过女生?不用怀疑,这里面没有统计欺诈、没有计算错误、没有变戏法,这可是实实在在、简简单单的加减乘除运算啊。
这就是美国统计学家E.H.Simpson在1951年发现的Simpson悖论。为什么会发生这个情况呢?注意到小晨老湿在第二次计算的时候,忽略掉泡泡堂和永恒之塔这个属性。泡泡堂是休闲游戏、难度较低,所以升级率比较高,而永恒之塔相对难的多。同时我们看到,男生大多选择难度高的永恒之塔,所以把男生总体升级率拉低了;而女生选择难度较低的泡泡堂,把女生总体升级率拉高了。于是就产生了分开算男生强、汇总算女生厉害的怪现象。
在这个例子中,游戏的难度是一个confounding变量,中文翻译我不太了解,英文解释是:In statistics, a confounding variable (also confounding factor, lurking variable, a confound, or confounder) is an extraneous variable in a statistical model that correlates (positively or negatively) with both the dependent variable and the independent variable.
那么如何避免Simpson悖论呢?当你看到问题简化得有点过头的时候,就要小心结论的可信度了。现在,你可以随意举出这样的题目来为难自己的数学老师咯。
一群同学玩盛大的休闲游戏泡泡堂和大型网游永恒之塔。
男生玩泡泡堂的有10人,其中8人顺利升级;玩永恒之塔的有90人,其中36人顺利升级;
女生玩泡泡堂的有100人,有72人顺利升级;玩永恒之塔的有50人,只有5人能顺利升级。
接下来要问的是,到底是男生玩游戏比较强呢?还是女生玩游戏比较强?
好,我们来解答这个简单的题目。
玩泡泡堂的时候,男生升级率80%(8/10 ),女生升级率72%(72/100),男生略强一些;
而玩永恒之塔呢,男生升级率40%(36/90),女生升级率10%(5/50 ),男生同样更强。
通过这样的计算,得到了男生玩游戏比较强的结论。且慢,小晨老湿要给出另外一个解答过程哦:
男生玩游戏,升级率是(8+36)/(10+90)= 40%;
女生玩游戏,升级率是(72+5)/(100+50)=51%;
所以看起来女生玩游戏更强一些哦。
什么?男生在两项游戏中均强过女生,但是总体看起来却比不过女生?不用怀疑,这里面没有统计欺诈、没有计算错误、没有变戏法,这可是实实在在、简简单单的加减乘除运算啊。
这就是美国统计学家E.H.Simpson在1951年发现的Simpson悖论。为什么会发生这个情况呢?注意到小晨老湿在第二次计算的时候,忽略掉泡泡堂和永恒之塔这个属性。泡泡堂是休闲游戏、难度较低,所以升级率比较高,而永恒之塔相对难的多。同时我们看到,男生大多选择难度高的永恒之塔,所以把男生总体升级率拉低了;而女生选择难度较低的泡泡堂,把女生总体升级率拉高了。于是就产生了分开算男生强、汇总算女生厉害的怪现象。
在这个例子中,游戏的难度是一个confounding变量,中文翻译我不太了解,英文解释是:In statistics, a confounding variable (also confounding factor, lurking variable, a confound, or confounder) is an extraneous variable in a statistical model that correlates (positively or negatively) with both the dependent variable and the independent variable.
那么如何避免Simpson悖论呢?当你看到问题简化得有点过头的时候,就要小心结论的可信度了。现在,你可以随意举出这样的题目来为难自己的数学老师咯。