漁舟舟

注册日期:2008-08-27
访问总量:2455723次

menu网络日志正文menu

万维网讲数学,是不是跑错了衙门?


发表时间:+-

数学学习(25/30

前面谈到少培养书呆子多造就一些接地气,解人性,大道至简见微知著的人才,可考虑将导向微积分的初等数学教育适当调整,增加统计学的启蒙教育。统计学是什么?又是如何诞生的呢?这一节就讲这一向题。

许多学科的诞生,往往是很多人甚至几代人的共同努力,很难归功于一个人。统计学例外,它起源于一位英国哲学家兼商人格朗特(John Graunt,1620-1674年)。大概是经商的原因,格朗特对信息有着敏锐的嗅觉。 他一生收集了229250人的死亡记录,列出了死亡的详细原因,有鼠疫,天花,狂犬病,麻疹,谋杀,死刑,饿死街头,自杀,死产,溺水,烧伤及大量的其他原因。

大量的数据与信息,揭示了许多亊实,也更正了许多传统的观点。比如,人们认为瘟疫流行是一个朝代变更的前奏,事实上这是一种谬论。人们普遍认为生男孩与生女有相等的概率,数据证明生男孩的概率更大。当时的人们认为谋杀是死亡的重要原因,事实上谋杀只是一种令人恐慌的社会现象,而不是死亡的重要原因。

除了大数据之外,统计学的另一个重要方面是数据的准确性。法国数学家勒让徳(Le Gendre, 1752-1833)第一个解决了从数据中得出正确结论的问题。如果只有一小组观测数据,就很难估计数据中呈现的误差。增加测试数据虽然能弥补数据少的不足,但无论数据多少也只是相对的不可能得到全部数据。勒让德发现了一种方法,就是有效地利用现有的全部测量结果,通过计算,在使数据组的偏差达到最小的意义下,得出一组理想数据。这组数虽然不是真正的测试值,却是最优的。这就是著名的最小二乘法。

有一个关 于最小二乘法的八卦。高斯在他的一篇关于天体运行的论文中应用了最小二乘法,并声称自己很早就首先发明了这一方法。这让勒让德十分气愤,却无能为力,由于高斯无可辩驳的名望与成就,不少史学家仍然将最小二乘法归功于高斯。

统计学的发展史上,必须介绍一下英国社会活动家与艺术家皮尔逊(Karl  Pearson,1857-1936年)皮尔逊当过几何学老师,可能是教授几何学的缘故,他对统计数据的几何表示以及曲线拟合有着独特的浓厚的兴趣。我们知道,两个量可表示为平面坐标系下的一个点,许多点可连成一条曲线。这些点的数据可能来自生活中不同的实际问题,而拟合曲线,理出两个变量之间的关糸,并不需要对问题本身有多么深刻的见解。皮尔逊对统计学的贡献就是找到了一种检验方法,可以测定某曲线是否是两个变量之间关系的合理表达。其中的数学思想是这样的:假定这条曲线是一个仔细定义的,大样本点集的完整表示,进而假定从这个较大的集合中,随机地抽取典型的样本,最后比较随机样本与曲线的符合程度,及实验测得的数据与曲线的符合程度,从而得到所计算的曲线拟合程度的概率测度。这就是所谓的卡方检验。该方法目前依然被广泛应用,以检验某种假设的合理性。

 
将统计学引入现代化管理,改变我们生活的当数休哈特(Walter Shewhart1891-1967)。休哈特是一位美国工程师,曾经在伊利诺伊州大学学习,后来在贝尔实验室工作过一段时间。关于质量控制,休哈特认为关键在于有一个稳定的生产过程,有两个方面的因素影响生产过程即随机的影响因素和非随机的影响因素。随机的因素是我们无法控制的如风雨雷电;非随机因素是可以控制的,如员工的技能态度原材料质量等。管理所要做的,就是消除非随机因素的影响,迴避或控制随机因素的影响。根据这一思路,他发明了著名的休哈特图表。简单一点说,该图表就是在平面坐标下,一条水平的直线,横坐标是时间,纵坐标是产量,水平线是日平均产量。记载每天的产量,根据偏离平均线的程度,便可直观地得到产品生产的情况,判断影响生产的诸多因素。

 
休哈特是一个很有争议的人物,有些人认为他的思想与图表十分简单,不值得一提;有些人则认为他是质量控制的鼻祖,将统计学与经济和工程结合起来,创立了"统计质量控制"新学科。

 
真正理解休哈特思想的,当数戴明(William Edward Deming,1900-1993 年)。戴明毕业于怀俄明州立大学,后来获耶鲁大学数学物理博士。在芝加哥一家公司暑期工作时,认识了休哈特,对休哈特推崇有加,并受到休哈特思想的深刻影响。戴明后来在美国农业部工作,有机会接触了大量的统计数据,于一九四O年出版了《部分抽样理论》。表面上看,讲的只是部分抽样,但他将如何迅速经济地获得样本这类问题与数学思想融为一体,其抽样理论极为全面而有实效。这体现在三个层面,即实施调查的可靠性;让调查方式以最小的成本并得到广泛认可的准确性;最终评价结果,指导实际。

  
我们也可以用一个更通俗的例子来理解他的抽样理论,比如人大代表。什么样的人能代表人民呢?这里首先要弄清人民算什么?人们的意愿是什么?人大代表是什么东西?这里的关键问题不是代表的荣誉性与光鲜性更不是代表门的临场发挥与表演性,而是抽取代表的程序的正义性和代表的真实性。

  
戴明的抽样理论发表后,虽然有一定学术声望,但在美国等西方国家,并没有受到真正的重视倒是受到了日本学朮界和实业界的高度推崇和热情追随。戴明应邀在日本作过许多演讲与指导。日本几乎各大行业,都遵循了戴明的质量控制和优化管理的思想。战争受到重创的日本在短短一代人的时间内,不少行业都超英超欧超美。日本的高速发展使欧美的产业界,认识到休哈特戴明理论改变世界改变生活的强大力量。而这时候的戴明已八十多岁,休哈特早已仙逝多年。

 小结一下。我们可以粗略地这样看:格朗特创立了统计学;勒让德解决了如何从大量的统计数据中得出准确结论;皮尔逊给出了分析图表数据所需的统计学原理;休哈特以一种直观的方式解决了质量控制问题;戴明则提供了如何得到有代表性样品的系统理论。从这里也不难看出,统计学不是一门单一的学科,与传统的数学不一样,它不是纯粹的演译科学而是一系列的思想和技术,既是艺术也是科学,既需要仔细的逻辑推导,又需要个人的判断决策。同时在信息高度发达的今天,我们身不由已地生活在统计学构成的社会环境里,从新闻报道天气预报股市风云体育新闻公共安全等等,统计学几乎左右了我们的生活。 科学的统计指导我们的思考统计的艺术打造我们的社会主义核心价值观。不容勿视的事实是,大数据大信息每天都在巨量生产新理论与新技术将应运而生,  从历史的角度看统计学的时代才刚刚起步(待续)。


浏览(1526)
thumb_up(4)
评论(1)
  • 当前共有1条评论
  • 木秀于林

    没跑错衙门。万维网学过数学者了了,懂数学者无几。

    数学头牌开讲数学,也算一股清流。

    屏蔽 举报回复