您的位置 首页 产业

刘嘉《统计学20讲》关公战秦琼,怎么比高下?

我们说,在统计学中,只要找到可比性,理论上就没有不能比的。这就意味着,哪怕是两个不同的、看上去没有关联的东西,也能做比较。

日常生活中,比较两个不一样的东西还挺常见的。比如这几个场景:

第一个:老耿和他表哥一起参加高考,一个在河南省,考全国卷I,一个在黑龙江省,考全国卷II(*参考往年高考试卷规则)。老耿考了650分,表哥考了630分。两个人要比一比,谁考得更好?老耿说,我分数高;表哥说,我们省试卷难。这该怎么比?

第二个:篮球队老虎队和小龙队都打了半个赛季的比赛。老虎队10胜5负,净胜分60分,小龙队9胜6负,净胜分30分。问这半个赛季,哪支球队表现更好?老虎队说,我的胜场数更多,净胜分也更多;但小龙队表示,我前半个赛季赛程艰苦,多次遇到强队,而你们老虎队净遇到弱队了。这又该怎么比?

第三个:小明刚出生的时候,父母年收入1万元。18年后,小明上大学,父母年收入10万元,家庭年收入是18年前的10倍。可是妈妈却说,收入涨得快,但猪肉涨得更快,现在生活水平还不如18年前。小明妈妈这么比,准确不准确?

这三个例子,看出来共同点了吗?其实,这些比较都是我们平时说的“关公战秦琼”的问题。两个不一样的东西,怎么比呢?

其实,如果用统计学的视角分析,“关公战秦琼”的问题就是把不同条件下的对象放在一起比较。想要完成这样的比较,除了选择合适的比较维度之外,还要确定合适的基准。只有在一个合适的基准下,比较的结果才有意义。

前面的内容里,我们已经说了如何选择比较维度,这一讲,我们说说怎么选择比较基准。

问题不同,基准不同

说到选择基准,我们首先得明确一点,就是,问题不同,基准也不同。

如果问题是“谁的语文试卷分数更高”,那考试分数就是这个问题的比较基准。反过来,分数这个比较基准,只能回答“得分高低”的问题,而不能回答“谁考得更好”这个问题。

同样地,如果问题是谁在联赛上的积分更高,那比赛胜负数就是这个问题的基准。但胜负数这个基准,并不能回答“开赛以来哪只球队表现更好”这个问题。

再就是,如果问题是18年后,小明父母的收入提高了多少,那基准可以是收入的绝对数量。但这个基准,并不能回答小明家的生活水平有没有变得更好这个问题。

换句话说,问题不同,基准也不同。如果要解决谁考得更好,哪支球队表现更好,生活水准有没有变好这些问题,我们就需要重新选择比较的基准。

选择基准要科学

问题简单的时候,基准似乎很容易确定,比如“关公战秦琼”。如果问题是两人谁的活动范围更大,那就很简单,直接去算两人的活动面积、或者统计两人各自去过的地方就好了。

但是,大部分“关公战秦琼”的问题,都是很复杂的。这时候,基准的确定就成了一个问题。简单来说,选择基准有三个不同的方法:第一,相对位置;第二,标准他者;第三,综合指标。咱们一个一个说。

首先是“相对位置”,就是将个体在总体中的相对位置,作为比较的基准。

比如,我们想比较关公和秦琼的战斗力,那就可以看看他们在各自朝代的相对位置。如果关公的战斗力在汉代排名前5,而秦琼在隋唐排名前13,那么就是关公更厉害。

其它问题,也是一样。老耿和表哥高考的目标是相同的,都是为了进大学,而进大学其实看的不是绝对分数,而是相对排名。那我们可以比较老耿和表哥在各自省里的排名,谁的排名高,谁就考得更好。

顺着这个思路,我们还可以把两人的绝对分数折算成标准分,用标准分来体现各自的排名。

标准分,也是标准的统计工具。有了标准分,就有了比较的基准。其实,生活中也有很多类似的标准分。比如判断两个单位里的人,谁职务更高?就常常说,谁是正处级,谁是副处级。科级、处级、厅级,这也是一种标准分。

说完了“相对位置”,我们再来看确定基准的第二个方法——标准他者,也就是寻找一个共同的参照物,作为比较的基准。

比如,关公要和秦琼比身高,那我们就可以找一个双方都能用上的参照物。比方说,关公进庙门的时候低了一下头,而秦琼没有。我们已知汉代的庙门高度和隋唐的庙门高度一样,那就说明关公比秦琼高。当然,这个例子不是真实的,没有史料支持,我这里是想说,选择一个标准他者,是获得基准的思路。

要说现实的案例,那也不少。

比如谷歌的PageRank算法,可以比较两个网页谁更有影响力。它是怎么比较的呢?简单地说,谷歌不是看哪个网页被引用了更多次,而是会考虑引用者的排名情况。谁被更有影响力的网站引用,谁就更有影响力。生活中,这种比较思路也经常被我们不自觉地使用。

两个人谁更有影响力,两本书哪一本可能更好?我们往往直观的偏向于,通过谁的朋友更有影响力、哪本书被专家推荐更多来判断。这都是选择他者来比较。

当然,在统计学中,这种思想的应用其实是需要定量化的,一般都需要运用复杂的算法去评估他者的价值,而不能是我们日常的、定性的感受。

最后一种确定基准的方法,就是看综合指标。

比如,关公、秦琼谁厉害?这种问题就不能只看武力,而是要比较各个方面的不同指标。我们可以设计一个战局,分别比较个人武力、胜仗次数,以及历史影响力,三场擂台,谁胜得多谁就更厉害。比如,个人武力上,关公排前五,秦琼排前十三,第一局关公胜。数胜仗次数,秦琼一生打了两百余阵,胜仗很多,而关公呢?虽然水淹七军威震华夏,但最终还是败走麦城,这一局秦琼胜。历史影响力呢?关公是武圣,又是财神,到今天还被供着,而秦琼,虽然是门神,但早就不贴门上了,第三局关公胜。连在一起看,关公三局两胜,关公赢了。

再比如,比较2021年奔驰和特斯拉谁更厉害,这可能就要比股价、比销量、比利润、比客户满意度。类似的还有大学排行榜、城市投资潜力、城市宜居程度等。所有这些比较,都不是单一指标,而是要设计一系列指标,然后合成一个综合指标,来做最终的判断。在很多领域,这个综合指标通常被称为“指数”。

相对位置、标准他者、综合指标,就是寻找基准的三个方向。总之,确定基准的核心是获得可比性。而到底用什么基准实现可比性,则需要领域知识、想法创意以及统计技能相结合。

就基准达成共识

现在我们确定了比较基准,是不是就万事大吉了呢?并不是。我们还要就基准达成共识。换句话说,看看选择的基准让不让人满意。

还是关公战秦琼。刚才,关公三局两胜赢了秦琼。可这时候,秦琼的粉丝不同意了,说明明打胜仗才最重要,历史影响力这件事,秦琼没有办法努力啊。所以现在的指标不行,应该给各个指标加权。比如,个人武力指标占30%,胜仗比例占70%,历史影响力最好是0。这样一算,秦琼胜出。而还有另一个人认为,武将厉不厉害这件事,既不能看武力值,也不看胜仗数,而是要看战略能力,看指挥能力,还要看与首长的关系。这样一来,刚才的综合指标就全废了。

这里的问题是什么?就是对选择的基准缺少共识,觉得现在的基准没法达成比较任务。

现实生活中,物价比较的基准最常见的是CPI。CPI常常被叫作“一篮子价格”,也就是将基础生活用品的价格,按照权重进行均衡的一种基准指数。这是政府的一种共识。但这种共识是不断调整的。根据生活的变化,不断调整CPI中包含的生活用品、不同生活用品的权重,以及各自的价格,以适应市场的变化。比如,过去听音乐,我们买黑胶唱片,后来买录音带或者CD机,现在可能购买的是音乐服务。这些是不断变化的。CPI要充分反映这样的变化,不断地更新基准,以符合当下的状况。其实,也就是符合更多数人的共识。

再比如,上证指数其实也是一种基准,可以用来反应股市的波动变化。这是股市监管者和股民的共识。而组成指数的权重股是一直不断变化的,权重本身也是不断变化的。换句话说,共识也是不断调整的。

所以,如果没有形成共识,就没法选择完美的基准。而即便过去有了共识、有了基准,现在也未必适用,共识和基准都是不断迭代和变化的。

小结

总结一下这一讲:

第一,对于关公战秦琼这样的问题,除了选择合适的比较维度之外,还要确定合适的基准。只有在一个合适的基准下,比较的结果才有意义。

第二,选择基准时,有三个不同的方法:相对位置、标准他者和综合指标。

第三,没有形成共识,就没法选择完美的基准。而且,共识和基准是不断迭代和变化的,过去的基准和共识,现在未必适用。

 

内容听完了,我是罗胖。

你看,我们用直觉很难决策的问题,统计学早就有解决方案。你只要掌握了科学的统计工具、统计方法,就能比别人更好地研判形势,做出决策。

刚好这周刘嘉老师的《统计学20讲》课程完整更新。里面除了20讲的音频课程,还附赠了15讲的视频课程。音频课为你讲解每一种统计工具,以及它能解决哪一类问题。视频课通过具体的案例,带着你学会使用这些工具。

热门文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注