保险里面的统计学,是它将风险管理带入实践
很多伟大的发现都是在数十年、甚至数百年之后才被认可。真理也需要时间才能被认可,更何况你我?
——坤鹏论保
统计学对大家显然不会很陌生,我们生活中经常接触。
从大的应用上看:
几年一次的人口普查;
国家统计局每年公布公布的GDP。
这些都是统计学范畴的事情。
从小的应用上看,我们工作中经常需要汇总数据进行分析。
也都离不开统计学。
但可能很多人没有注意到,统计学对保险行业发展同样起到了至关重要的作用。
统计学是保险精算的基础。
是不是很意外?
今天我们就来聊聊统计学,以及统计学如何将风险管理带入实践应用。
本文重点内容:
抽样统计主导统计学
统计学应用于实践
寿命表成为保险精算基础
一、抽样统计主导统计学
提起统计学,就不得不提抽样统计。
实际上,绝大多数统计都是抽样统计。
而基于统计结果做出的决策,也都是基于抽样统计结果而已。
相比而言,抽样统计更具有实践价值。
就像我们不需要把一整瓶酒都喝完,再下结论说它其实不好喝。
医生也不需要将病人的血都抽干,再决定开什么药。
总统也不会每个月都对100%的选民进行调查,来判断他的支持率。
我们更没必要把所有羊肉都吃完,才知道自己其实并不喜欢吃羊肉。
抽样统计的历史很长。
很早的时候,英国国王就懂得通过抽样统计的方式检测硬币质量。
而硬币质量检测的目的是,为了确定皇家铸币厂铸造出来的硬币,是否符合铸币厂规定的标准。
这些被随机抽样出来的硬币被装在一个盒子里,检测中,它们将与一盘国王提供的金子(作为标准值)做比较。
检测结果允许硬币与标准值有一定偏离,但是,偏离不能太大。
这里的偏离,也就是我们现在所认识到的“误差”,误差不是错误。
二、统计学应用于实践
1279年,当英国国王爱德华一世宣布统计抽样需遵循的程序时,抽样统计就已经建立起来了。
就在法国著名数学家帕斯卡和费马合作8年之后,1662年,英国约克大学的统计专家约翰·格朗特在伦敦出版了一本更有影响力的书——《关于死亡定律的自然和政治观察》。
这本书中包含了伦敦1604年到1661年所有出生率和死亡率的统计数字。
死亡率清单不仅包含死亡人数,还同时列出了死亡原因。
例如,在1632年,他列出了将近60种不同的死亡原因,其中628人属于“年老者”,7人死于谋杀,15人死于自杀。
其他死亡原因还有诸如:惊吓、被疯狗咬,到寄生虫病、扁桃体周脓肿、在护理中被饿死等。
正是格朗特的统计数据,才让人们发现,很多时候的实际数据和自己的直觉并不一样。
比如,在他的统计数据中,只有很少数人死于谋杀,可是,在人们的意识里,当时的伦敦没有几个夜晚是不发生这种罪行的。
格朗特将其归功于伦敦市政府和警察工作得力。
从1604年到1624年,他统计出229,250人死于各种疾病以及意外事故,其中大约有1/3死于儿童疾病,以及其他疾病死亡人数中有一半是儿童。
于是,他得出结论:大约每百例受孕太早的婴儿中,有36例在6岁之前死亡,也就是36%。
格朗特的著作中首次用死亡人数来推测居住人口数量:
伦敦平均每年死亡人数大约为13000人,由于通常出生人口比死亡人口少,所以他推测每年出生人口为12000人。
育龄女性在2年之内很少生育超过1个孩子,因此他推测育龄女性数量是出生人口的2倍,也就是有24000个生育期女性。
然后他再推测,每个家庭成员,包括仆人、房客在内共计约8个。
格朗特还推测出,家庭总数大概为含有一个生育期女性家庭数目的2倍,也就是由48000个家庭。
也就是说,伦敦是由48000个家庭、每个家庭有8个人组成。
最后他得出结论,伦敦人口总数为384,000人。
这与当时人们估计的伦敦人口数量有200万相比,确实少了很多,但这种方式推测出来的数量显然更接近实际情况。
利用他每百例受孕太早的婴儿中有36例在6岁前死亡的假设,以及预计大部分人在75岁以前死亡,格朗特画出了一份每100人中从6岁到76岁的存活者数量。
格朗特收集的数据改变了人们对他们所居住城市的认识。
他开创性的工作指出了在不确定性情况下作出决策所需的关键理论概念。
抽样、平均值以及对什么是正常状况的概念,构成了统计分析科学的构架,使得信息服务于决策,并影响了我们对未来事件发生概率信仰的程度。
值得一提的是,格朗特在出版《关于死亡定律的自然和政治观察》前,既不是统计学家,也不是数学家,而是一位成功的商人。
这本书吸引了英国以及英国以外很多国家的读者,而格朗特也因此成为公众人物,查理二世邀请他加入皇家科学院。
至于为什么要做这件事情,格朗特曾说过:“在从这些不遵循地位定律的情况中归纳出如此多深奥且未曾预料到的东西时,我找到了许多乐趣。在从事前人未曾做过、尽管是如此微不足道的事情时,有着许多乐趣。”
相比来说,这本书对政府的意义更大,可以使政府的决策摆脱主观臆断,更加客观、准确。
虽然格朗特研究的是所有死亡率记录,而不是一个样本,但是,他将粗略数据用一种前人未尝试过的方式系统地进行分析。
他分析这些数据的方式奠定了统计科学的基础,格朗特也被认为是抽样理论的创始人。
“统计学”这个词出自于对国家数量性事实的分析。
格朗特和英国的威廉·配第被认为是这个领域的共同奠基人。
后者的代表著名是《政治算术》,马克思评价他为“政治经济学之父”。
三、寿命表成为保险精算基础
另一个通过统计学将风险管理推上新高度的人是英国人埃德蒙·哈雷。
他是一位极负盛名的科学家、天文学家。
哈雷还是个孩子的时候,就是一位众人皆知的天文学奇才。
他在还没有拿到本科学位时就离开了牛津皇家学院,并开始研究南半球的天体。
这项研究成果让他在不到20岁时就奠定了在天文学的声誉。
22岁时,他就已经是皇家科学院的成员了。
1721年,哈雷成为了格林威治天文台的皇室天文学家,并由国王颁布命令,获得了牛津皇家学院的本科学位。
1705年,他在对慧星轨道进行突破性研究时发现,在1337年~1698年之间共有24颗彗星出现,其中三个非常相似。
哈雷认为,这三个其实是同一颗彗星,分别出现于1531年、1607年和1682年出现过。
于是,哈雷推测,这颗彗星将于1758年重新出现。
当这颗彗星如期而至的时候,世界为之震惊,这颗彗星被命名为哈雷彗星。
哈雷彗星是人类首颗有记录的周期彗星,每76.1年环绕太阳一周。
原本研究死亡周期表并不是哈雷的工作,但他当时答应为皇家科学院新开办的学术期刊《交易》提供一系列论文,所以经常查阅资料来写一些不一样的东西。
正好他意识到格朗特工作中的一些缺陷(其实这些缺陷格朗特自己也清楚)。
于是,哈雷决定利用给《交易》写论文的机会,研究一下社会问题。
当时有一个名叫布雷斯劳的城市,坐落于德国最东部。
第二次世界大战以后,该城市成为波兰的一部分,而现在称为弗罗茨瓦夫。
这座城市的牧师有相当长一段时间关于出生率和死亡率的详细记录。
1690年,当地一位名叫卡斯帕·诺曼的科学家、牧师为了“证实当前一些关于月亮圆缺周期以及所谓的‘危机’年对健康影响的荒谬性”,查阅了这些记录,并将其中一部分内容呈给了莱布尼兹。
莱布尼兹又将这些资料送到了伦敦皇家科学院。
这些资料中包括该城市从1687年到1691年每个月出生人口和死亡人口的年龄、性别。
恰巧这个时候哈雷在到处寻找论文内容,他很快注意到这些数据。
这些数据显示,5年时间内,平均每年出生人口为1238人,死亡人口为1174人。
通过对死亡人口的分析,哈雷发现,只有692人出生后存活到6年以后,有12人死于81岁到100岁之间,并推算出该城市总人口数量大约为34000人。
根据这些数据分析,哈雷希望编制一张“从出生到老龄”的表。
他认为,这张表“比我知道的任何尚存的东西都能对国家和人口状况提供一个更加准确的概念。”
比如,这个表可以明确显示出在该城市有9000个男人处于适合服兵役的年龄,占城市总人口的9/34。
并且哈雷还认为,这个比例可以作为其他地方的一条普遍规律。
哈雷对这些数据的分析包含很多概率的概念。
比如,在数据中显示,25岁年龄段共有567人,而26岁年龄段有560人,两个年龄段之间有7人的差异。
这表明,一个25岁的人在一年内死亡的概率为7/567。
或者说,一个25岁的人活到26岁的概率为80:1。
同理,将一给定年龄与其后年龄相减,以这个给定年龄为基础,这张表同样可以计算出,一个40岁的人活到47岁的概率为5.5:1。
进一步计算,这个表还可以给出特定年龄人口平均死亡年龄。
例如,30岁人口有531人,这个数的一半为265人,在表中查找为265人的年龄是在57岁到58岁之间。
因此可以得出结论,预计一个30岁的人还可以活27到28年。
除了政府以外,谁对这种人口预期寿命最关心?
显然是保险行业。
这张表可以用于给不同年龄段人口计算保费。
例如,一个20岁的人不在一年内死亡的概率为100:1;
一个50岁的人不在一年内死亡的概率为38:1。
以每年死亡概率为基础,这张表提供了计算年金价值所需的信息。
哈雷还进行了对年金价值的细致的数学分析,同时还提供一张对数表,以减少大量必要、但基础的计算。
1693年,哈雷将他的寿命表在《交易》上发表,不过他的研究并没有马上引起英国的注意。
直到一个世纪以后,政府和保险公司才考虑以概率为基础的寿命预期。
不过,哈雷的寿命表有一个很致命的问题:样本数不够。
样本数不够,每一个微小的变化都会对概率产生很大影响。
我们不能因为25岁年龄段共有567人,26岁年龄段有560人,就认为一个25岁的人在一年内死亡的概率为7/567。
大数定律在这方面的作用就开始显现了。
不过哈雷寿命表的计算方式是没有问题的,他为整个保险行业风险管理、精算提供了非常完善的理论基础。
正是有了哈雷的寿命表,保费计算才从早期的赌运气演变成现在的精算。
保险业现在使用的寿命表、重大疾病经验发生率表等统计数据,样本数更多、统计更详尽。
它们的基础,都源自统计学和概率论。
而思路呢,则源自哈雷的寿命表。