5-4 数学家小传–戈塞尔

By | 2018年7月12日

威廉·戈塞(William Sealy Gosset),全名威廉·希利·戈塞,英国化学家、数学家与统计学家,以笔名“Student”著名。英国现代统计方法发展的先驱,小样本理论研究的先驱,为研究样本分布理论奠定了重要基础,被统计学家誉为统计推断理论发展史上的里程碑。

戈塞(William Sealy Gosset)出生于英国肯特郡坎特伯雷市,求学于曼彻斯特学院和牛津大学,主要学习化学和数学。1899年,戈塞进入都柏林的A.吉尼斯父子酿酒厂,在那里可得到一大堆有关酿造方法、原料(大麦等)特性和成品质量之间的关系的统计数据。提高大麦质量的重要性最终促使他研究农田试验计划,并于1904年写成第一篇报告《误差法则应用》。

戈塞是英国现代统计方法发展的先驱,由他导出的统计学T检验广泛运用于小样本平均数之间的差别测试。他曾在伦敦大学K.皮尔逊生物统计学验室从事研究(1906-1907),对统计理论的最显著贡献是《平均数的机误》(1908)。这篇论文阐明,如果是小样本,那么平均数比例对其标准误差的分布不遵循正态曲线。由于吉尼斯酿酒厂的规定禁止戈塞发表关于酿酒过程变化性的研究成果,因此戈塞不得不于1908年以“学生”的笔名发表他的论文,导致该统计被称为“学生的T检验”。1907-1937年间,戈塞发表了22篇统计学论文,这些论文于1942年以《“学生”论文集》为书名重新发行。

戈塞是英国现代统计方法发展的先驱,由他导出的统计学T检验广泛运用于小样本平均数之间的差别测试。他曾在伦敦大学K.皮尔逊生物统计学验室从事研究(1906-1907),对统计理论的最显著贡献是《平均数的机误》(1908)。这篇论文阐明,如果是小样本,那么平均数比例对其标准误差的分布不遵循正态曲线。由于吉尼斯酿酒厂的规定禁止戈塞发表关于酿酒过程变化性的研究成果,因此戈塞不得不于1908年,Gosset首次以“学生” (Student)为笔名,在《生物计量学》杂志上发表了“平均数的概率误差”。Gosset在文章中使用Z统计量来检验常态分配母群的平均数。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。后来,哥塞特又连续发表了“相关系数的概率误差” (1909)、“非随机抽样的样本平均数分布”(1909)、“从无限总体随机抽样平均数的概率估算表”(1917),等等。

他在这些论文中,第一,比较了平均误差与标准误差的两种计算方法;第二,研究了泊松分布应用中的样本误差问题;第三,建立了相关系数的抽样分布;第四,导入了“学生”分布,即t分布。这些论文的完成,为“小样本理论”奠定了基础;同时,也为以后的样本资料的统计分析与解释开创了一条崭新的路子。由于哥塞特开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把哥塞特推崇为推断统计学的先驱者。

William Sealy Gosset20世纪前三十余年是统计界的活跃人物,他的成就不限于《均》文,同年他发表了在总体相关系数为0时,二元正态样本相关系数的精确分布,这是关于正态样本相关系数的第1个小样本结。

他对回归和试验设计方面也有相当的研究,在与费歇尔的通信中时常讨论到这些问题。费歇尔很尊重他的意见,常把自己工作的抽印本送给William Sealy Gosset请他指教,在当时,能受到费歇尔如此看待的学者为数不多。

William Sealy Gosset的一些思想,对他日后与奈曼合作建立其假设检验理论有着启发性的影响,他说(引自《耐曼:现代统计学家》):“我认为现在统计学界中有非常多的成就都应归功于William Sealy Gosset……。”