打开主菜单

求真百科

安德雷·马尔可夫

安德雷·安德耶维齐·马尔可夫(Андрей Андреевич Марков)(1856年6月14日-1922年7月20日),俄国数学家。出生于梁赞州,他的父亲是一位中级官员,后来举家迁往圣彼得堡。1874年马尔可夫入圣彼得堡大学,师从切比雪夫,毕业后留校任教,任圣彼得堡大学教授(1893-1905),研究数论和概论。后自愿承担罪名而被流放到扎拉斯克。1886年当选为圣彼得堡科学院院士。马尔可夫1922年逝世于圣彼得堡。

安德雷·马尔可夫
原文名 Андрей Андреевич Марков
国籍 俄国
职业 数学家

马尔可夫的主要研究领域在概率和统计方面,他因提出马尔可夫链的概念而享有盛名。马尔可夫链已经成功应用到物理、化学、语音识别、信息科学、金融等领域,谷歌所使用的网页排序算法就是由马尔可夫链定义的。[1]

目录

生平

1856年6月14日,梁赞省林业厅六等文官马尔科夫的妻子生下一个男孩,这就是19世纪末至20世纪初对俄国科学和民主进步事业都作出巨大贡献的数学家安德烈·安德列耶维奇·马尔科夫(1856-1922)。

梁赞与莫斯科毗邻,自古就是俄罗斯中部富饶的谷仓。苍绿的林海和金黄的麦田复盖着广袤的大地,蜿蜒的奥卡河静静地流过省会梁赞市,给这座城市带来繁荣与生机。但是老马尔科夫在生活上和官场中都不得意,他结过两次婚,共生育了五男四女,一大家子的衣食温饱,象座山似地压在他瘦弱的肩上。然而命运多蹇,老实人后来在官场遭人诬陷被迫辞职,一家人只好迁居彼得堡另谋生路,这一年马尔科夫刚满五岁。

中学时代开始了,马尔科夫被送到彼得堡第五中学。这是一所完全按照东正教的陈规陋俗来治理的学校。对于正在长身体和求知欲不断高涨的孩子们,学校的要求是连篇累犊地背诵希腊拉丁文,外加各种祈祷与忏悔仪式。马尔科夫厌恶这种令人窒息的环境,除了数学以外,他对学校里的其它课程都不感兴趣。马尔科夫有两个姐姐也在这所学校读书,她们的经典和操行总是得到老师的表扬,唯独桀骜不训的马尔科夫总是不能引起老师的好感。为此父亲常被校长招到学校,为他承受那令人难堪的嘲讽与训斥。

但是马尔科夫绝不是那种除了数学就什么都不懂的怪坯子,他对社会问题的关心以及对于人文科学的热爱贯穿其生命的始终。正是在第五中学时,他读了大量课外作品──那既不是教师推荐的罗马编年史,也不是廉价的法国爱情小说,而是一些高年级学生偷偷带到学校里来的进步读物。为此他与校方发生了严重的冲突。

马尔科夫的言行逐渐引起了学校当局的注意,父亲被传唤的次数越来越多了。就在临近毕业的那个学期,危机终于爆发出来。在一次例行的祈祷仪式临近结束时,心不在焉的马尔科夫把《圣经》匆匆地塞进口袋,只盼着赶快跑到庭院里去轻松一下,一直在监视他的学监突然出现在他面前,气势汹汹地指责他破坏了宗教仪式的肃穆气氛。学生中一片喧哗,仪式草草收场。马尔科夫则被带到校长室,被斥为无神论者和无政府主义分子,扬言要立即开除学籍。父亲闻讯赶来,再三地赔礼道歉才算平息了这场风波。

1874年,马尔科夫考入了神往已久的彼得堡大学数学系,从此脱离那个令人感到压抑的环境,开始在绚丽多姿的数学王国里自由地呼吸。1878年,马尔科夫以优异成绩毕业并留校任教,毕业论文《以连分数解微分方程》获得当年系里的金质奖。两年后他完成了《关于双正定二次型》的硕士论文,并正式给学生开课。又过了两年,他开始考虑博士论文,后以《关于连分数的某些应用》于1884年通过正式答辩。

十九世纪数学的一个特点就是学派的兴起。诞生在法兰西大革命风暴中的巴黎学派仍雄踞数坛,他们勇于开拓新的研究方向,富有创造激情,在函数论、数学物理、几何、拓扑与群论等领域总是走在别人的前面。长于哲学思辨的德国人则特别重视数学大厦的基础,“算术化”成了柏林学派的战斗旗帜;当然,柏林人不象巴黎人那样轻视“外省人”,在波恩莱比锡格廷根都出现了引入注意的数学家群体──特别是最后那座小城,不久就要取代巴黎成为数学的耶路撒冷。自负的英国人也开始从固步自封的旧梦中觉醒,在牛顿( I. Newton, 1642-1727)的母校冒出了一个“分析学会”,会中的年轻人竟敢顶着亵渎神圣的罪名去推广德国人莱布尼茨( G. W. Leibniz, 1646-1716 ) 的微积分符号,19世纪英国人在代数学领域的成就于此不无关系。在文艺复兴的故乡,一个以几何与拓扑为突破口的新意大利学派正在成长。

按照新意大利学派第二代领袖沃尔特拉(V. Volterra, 1860-1940)的说法,这一学派的诞生可以溯源于布廖斯奇 ( E. Brioschi, 1824-1897) 和贝蒂 ( E. Betti, 1823-1892) 1858年的德、法之行。但是在俄国历史上却很难找到一个足以标志彼得堡数学学派呱呱落地的事件。有人将俄国数学的进步追溯到1727年瑞士大数学家欧拉( L. Euler, 1707-1783) 前来彼得堡科学院供职,也有人将之归因于布尼亚科夫斯基、奥斯特洛格拉特斯基(1801-1862 ) 等人从法国留学回来从事数学教育,然而真正使彼得堡与数学结缘的却是切比雪夫和他的弟子们。

彼得堡所在的地方原先只是波罗的海芬兰湾东端的一个小渔村,为了显示其向西方学习的决心并打开通向波罗的海的通道,彼得大帝( Peter I The Great, 1672-1725) 于1703年在此建立了一个军事要塞,更于1712年将首都从莫斯科迁到这里。在彼得大帝宏伟的政治经济改革蓝图中,有一项仿效西方建立科学院的计划,但是由于种种原因,直到他去世的1725年,这个柏林科学院的翻版才正式问世。早期的院士中不乏知名的数学家,如贝努利家族的尼古拉第三(Nicolaus III Bernoulli)和丹尼尔(Daniel Bernoulli, 1700-1782)、哥德巴赫(C. Goldbach, 1690-1764) 以及欧拉( L. Euler,1707-1783) 等,但是他们都是外国人。当时俄罗斯数学的土壤是贫瘠的:没有土生土长的数学家,没有能够引起其他国家数学家注意的成果,没有一所大学,甚至连一本象样的初等数学教科书都没有。

彼得堡数学学派是伴随着切比雪夫几十年的舌耕笔耘成长壮大的。自1846年接受助教职位到1882年以终身荣誉教授的身份退休,切比雪夫在彼得堡大学执鞭达三十五年之久,即使退休之后他还继续从事研究并培养研究生。他的讲课深受学生们的欢迎,那绝不是经院式的说教,而是充满启发性评论的对基本原理和方法的叙述,正如他的高足李雅普诺夫 (1857-1918) 描述的那样,“他在课堂上即兴给出的一个评论,往往与听讲者冥冥求索的某个问题有关,因为他对弟子们的水平和思想活动了如指掌。因而他的讲课极具感染力,每堂课都使学生们获益良多。”教学之外,切比雪夫本人在数学的若干领域也作出了开拓性的贡献,特别是在数论、概率论和函数逼近论方面。他是彼得堡数学学派当之无愧的领袖。

1883年,马尔科夫与自幼相识的女友瓦里瓦契耶瓦娅结为伉俪,新娘的母亲就是他父亲当年的女雇主。大学时代的马尔科夫曾给读高中的瓦里瓦契耶瓦娅当过业余家庭教师,正是这种频繁的接触催开了这一对年轻人心中的爱情花朵。但是一开始,那位富孀是不赞成这门婚事的,因为她一想起当年那个在花园里拄着拐杖踽踽独行的可怜孩子和经常使他忠厚的管家心绪不宁的桀骜少年,心里总是有一种靠不住的感觉。然而事实最终战胜了偏见,面对这个事业上不断获得成功的英俊青年助教,她终于感到无可挑剔了。

从1880年马尔科夫就开始在彼得堡大学任教,先是担任助教和讲师,1886年成为副教授,1893年升为正教授,1905年退休并荣获终身荣誉教授的称号。二十五年来,他先后讲授过微积分、数论、函数论、矩论、计算方法、微分方程、概率论等课程,为祖国培养了许多出色的数学人才。

关于马尔科夫的讲课风格毁誉不一。他与切比雪夫和李雅普诺夫不同,讲课时既不在乎板书的工整也不注意表情的生动,而且经常有意略去教科书中的传统题材,因此一般的学生抱怨不好懂。但是优秀的学生发现他的课程从逻辑上来看具有无可指责的严密性,内容充实无华,其中往往还有些他本人最新的研究成果。

他从教授席位上退休以后,仍然以科学院院士的资格在彼得堡大学开设概率论课程,讲义用的就是倾注了他半生心血的《概率演算》。为了开好这门课,他反复地对这部书进行了修改,直到临终前还在进行第四版的校订工作。这一最后的修订本于他逝世两年以后出版。 十月革命前夕,彼得堡的局势动荡不定,科学院与大学已无正常的工作秩序。在这种情况下,马尔科夫请求科学院派他到外省去从事中学教育。1917年9月,年过花甲的马尔科夫来到梁赞省一个叫萨兰斯克的县城,无偿地担负了县中学的数学教学工作。他有个十四岁的儿子也一同来到这里,恰好就插班在他任课的年级。这个小马尔科夫(1903-1979)的名字及父名与父亲完全相同,后来也成了有名的数学家,先研究理论物理和天体力学,后转向动力体系理论、测度论、拓朴学、代数等,并于1953年当选为苏联科学院通讯院士。 1918年秋,马尔科夫因患青光眼回到彼得堡治疗,手术后他返回阔别已久的母校继续开设他的概率论讲座。这时候他的体力已远不如从前了,每次讲课都要儿子搀扶着进出教室。然而当他一站到讲台上,就感到有了精神。在几十年的教学生涯,他比其他任何人都更忠实地向学生们灌输彼得堡数学学派的信条和理想。他继承了切比雪夫对具体问题的兴趣,不断地追求数学方法的简单化和尽可能精确的结果,他善于向经典课题汲取养料,同时把自己的事业深深地札根在大学这块沃土之中。在彼得堡数学家团体中,没有人比他更“彼得堡化”了。有一次别人向他请教数学的定义,他不无骄傲地说:“数学,那就是高斯、切比雪夫、李雅普诺夫、斯捷克洛夫和我所研究的东西”。

1921年秋天,马尔科夫的病情开始严重起来,他只得离开心爱的大学。在生命的最后一年里,他还抓紧时间修订了《概率演算》。1922年7月20日,这位在众多数学分支里留下足迹和为科学与民主事业奋斗了一生的老人辞别了人世。马尔科夫的遗体被安葬在彼得堡的米特罗方耶夫斯基公墓,他的墓碑没有过多的修饰,就象他的文章和讲课一样朴素无华。然而他的思想、他的成就、他的品德就象一座巍峨的丰碑,永远矗立在真理求索者的心中。

成就荣誉

从数论到经典分析

马尔科夫入学不久就表现出其独特的数学天赋,因此当柯尔金和佐洛塔廖夫这两位教师组织代数与数论的讨论班时,他们毫不犹豫地把这个在中学时代就敢于向大权威谈论自己发现的学生吸收进来。马尔科夫不负众望,他的第一项重要的数学工作,就是沿着柯尔金和佐洛塔廖夫俩人所开辟的道路完成的。

二次型的理论是代数数论中的一个重要课题,欧拉、拉格朗日( J . L. Lagrange, 1736-1813)、高斯(C. F. Gauss, 1777-1855)这些大数学家都曾为它付出艰辛的劳动。二元二次型(亦称双二次型)是二次型中最简单的一种形式,在给定其判别式的条件下,寻找二次型的极值是一件十分有意义而又相当棘手的工作,若干年来虽然有一些进展,但是疑点仍然不少。柯尔金和佐洛塔廖夫给出了与判别式相关的两类双二次型的最小值的近似估计,这一结果得到当时法国著名数学家埃尔米特(C. Hermite, 1822-1901)的高度评价。

马尔科夫1880年的硕士论文就是对这一结果的彻底完善化。他证明了两位老师找到的数值不过是一个收敛于常数的正无穷递减数列中的前两项,而该数列通项的值则取决于一个三元二次不定方程在某些附加条件下的整数解。他还给出了由此类不定方程的解来计算通项的具体方法,从而建立了二次型表示论与著名的丢番图方程的联系。这样,马尔科夫就彻底地搞清了判别式大于零时不定双二次型最小值的分布情况,极大地推进了柯尔金和佐洛塔廖夫的结果。

在这项研究中,马尔科夫已表现出了切比雪夫等前辈学者对他的影响,那就是善于联系经典问题、充分利用初等工具、追求解的精确性、实用性以及不畏繁复计算等鲜明的彼得堡风格。论文附有一个包括前20个通项值计算程序和结果的大表,每一行数据都对应着一个复杂的丢番图方程。甚至早期彼得堡数学学派的一个缺点在这项研究中也有所反映,那就是马尔科夫完全排斥了几何背景,因为他同切比雪夫一样怀疑几何语言的严密性。其实,在型表示论中借用几何语言是最自然不过了,高斯关于三元二次型几何意义的说明被认为是闵可夫斯基(H. Minkowski, 1864-1909)关于数的几何理论的开端,早期彼得堡数学家在这一领域可谓失之交臂。

双二次型最小值的分布搞清楚以后,马尔科夫开始注意多个变元的二次型,只是由于教务倥偬,直到十一年后才发表了进一步的研究成果。1901年,他在《关于不定三元二次型》中给出了该类型的前四种极值形式(其中一种也为柯尔金所得到)。1909年,他汇集了自己关于三元二次型的成果,出版了包括所有判别式不大于50的三元二次型最新数据在内的专著。这些工作都是伴随着大量复杂的计算进行的,马尔科夫不仅通过计算提供了问题的解,而且对于发展计算方法也做出了贡献。以后他又研究了四元二次型,并得到其极值的前两种形式。

代数数论中的另一个重要课题是关于理想的理论。1843年,德国数学家库莫尔(E. E. Kummer, 1810-1893) 在企图证明费尔马大定理的壮举中被一道小河沟挡住了。看过他手稿的狄里克莱(P. L. Dirichlet, 1805-1859) 不客气地指出,代数域上的素因子分解唯一性定理对代数数不一定成立,而素因子唯一分解的假定对于他的证明又是绝对必要的。为了克服这一障碍,库莫尔开始在一系列论文中创立和发展一种叫做理想的理论,借助理想数来实现代数域上素因子的唯一分解,从此对理想的研究在一个时期内达到高潮。佐洛塔廖夫曾致力于三次方根域上理想素因子的分解,可惜这位英华早发的学者三十一岁就逝世了。在为纪念佐洛塔廖夫而出版的文集中,马尔科夫给出了三次方根域上理想素因子分解的当时最好结果。

马尔科夫等人在代数数论方面的工作与切比雪夫在解析数论方面的工作一起,确立了彼得堡数学学派在数论领域的领先地位。但他并不以此为满足,而是很快地把目标转向一系列更广的数学题材,特别是在经典分析领域做出了新的贡献。

1833年,法国一个不太出名的数学家比内梅(J. Bienayme, 1796-1878) 向巴黎科学院递交的一篇论文中,将力学中矩的概念作了推广,但文章直到三十四年后才在刘维尔 ( J. Liouville, 1809-1882)的《纯粹与应用数学杂志》上刊登出来。切比雪夫立即意识到矩的研究具有重要意义,并试图在对概率论极限定理的证明中应用这一工具。他在1874年写成的论文《关于积分的极限值》中,借助于矩给出了某类非负函数积分以连分数形式表达的极值不等式,但没有证明。1884年马尔科夫在《某些切比雪夫积分的证明》一文中,给出了这些不等式的严格证明,并在同年通过的博士论文的第三部分给出了切比雪夫问题的完整解答。

后来在概率论的研究中,马尔科夫一再回到矩的问题上来,并对切比雪夫的矩问题作了许多深入的拓广。他的这些工作,最初见于1876年发表的《连分数的一些新应用》,而后又在1897年的一系列论文中作了进一步的阐述,其中最为重要的一篇是《关于矩的一个L问题》

几乎在马尔科夫证明切比雪夫不等式的同时,荷兰数学家斯提吉斯(Th. J. Stieltjes, 1856-1894) 也开始了同样的研究,他在《关于所谓力学积分法的研究》一文中给出了与马尔科夫类似的结果。一开始俄国数学界宣称拥有优先权,斯提吉斯则声称自己没看到马尔科夫的论文,也不知道切比雪夫原先提出的问题。事实也的确是这样。问题搞清楚以后,马尔科夫与斯提吉斯成了很好的朋友,他们寄书鸿雁,频繁地交流各自在矩理论以及有关内插法、构造积分、余项估价和连分数等方面的新成果,这种关系一直持续到斯提吉斯逝世。就在去世前不外,斯提吉斯发表了带有综述性质的《关于连分数的研究》,其中解决了无穷区间上的矩问题,并且给出了所要寻找的函数的一切整数阶矩的连分数表达式。作为回答与对好友的纪念,马尔科夫于1895年发表了《关于某些连分数收敛性的两个证明》,在其中给出了斯提吉斯连分数收敛的充分条件。

十余年来,马尔科夫和斯提吉斯共同研究矩的理论。他们都是从经典分析中的问题出发,企图对积分的上、下界给出一个精确的估计,工作中又都大量运用了连分数这一工具,所以不谋而合与互相启发的现象常常出现在俩人之间。但是马尔科夫对精确的结果特别感兴趣,不惮于繁复的数字运算,并把对于积分的估值应用到概率论中,这是彼得堡数学学派风格之体现。而斯提吉斯更注意从一般的原则上去考察矩问题,他更关心的是积分形式的意义,而不是其估值的结果,从而导致了一类应用广泛的斯提吉斯积分的出现,为实变函数论的日后发展开辟了道路,这又很有些法兰西数学学派的味道。

如同他的导师切比雪夫一样,马尔科夫对实际问题具有浓厚的兴趣,他在函数逼近论方面的工作就是一例。出于化学理论上的需要,彼得堡大学的著名化学家、也就是元素周期律的发现者门捷列夫(1834-1907)曾提出过一个问题,从数学上说相当于找出定义在闭区间上的高次多项式的导数在某种条件下的最大值。1889年,马尔夫在题为《关于一个门捷列夫问题》的论文中,解决了由多项式的上界来求其导数多项式上界的问题;这个问题也可表示为偏离零点的多项式的最大偏差的估计,因此与切比雪夫所建立的一系列结果都有关系。1892年,马尔科夫的同父异母弟弟弗拉基米尔(1871-1897)曾把这一问题推广到求导数多项式的上确界的情况,可惜这位颇有数学才华的弟弟二十六岁便死于肺结核。马尔科夫还研究过许多其它的实际问题,其中包括将空间曲面部分最小变形地转换到平面,以及铁路弯道的曲率等问题。

马尔科夫对微分方程的贡献主要是关于拉梅(G. Lame., 1795-1870)方程和超几何方程的研究。他确定了一个超几何方程的两个解的乘积可作为整函数的条件,研究了这些函数与拉梅函数的零点分布,这些工作还导致了以初等函数表示积分,并涉及了大量的近似计算方法。

把概率论推进到现代化的门槛

把概率论从濒临衰亡的境地挽救出来,恢复其作为一门数学学科的地位,并把它推进到现代化的门槛,这是彼得堡数学学派为人类作出的伟大贡献。切比雪夫。马尔科夫和李雅普诺夫师生三人为此付出了艰辛的劳动,其中尤以马尔科夫的工作最多。据统计,他生平发表的概率论方面的文章或专著共有二十五篇(部)之多;切比雪夫和李雅普诺夫在概率论方面的论文各为四篇和二篇。

大约从1883年起,马尔科夫就开始考虑概率论中的基本问题了。十九世纪的八、九十年代,他主要是沿着切比雪夫开创的方向,致力于独立随机变量和古典极限理论的研究,从而改进和完善了大数定律和中心极限定理。进入二十世纪以后,他的兴趣转移到相依随机变量序列上来,并创立了使他名垂千古的那个概率模型。

概率论中的一个基本问题就是探索概率接近于1时的规律。特别是大量独立或弱相依因素累积结果所发生的规律,大数定律就是研究这种规律的命题之一。1845年,切比雪夫第一次严格地证明了贝努利形式的大数定律,次年他又把结果推广到泊松形式的大数定律。在概率论门户萧条的年代里,切比雪夫的工作无疑起到了振聋发聩的作用。但是由于处理手法还不够完善,所得结果还是比较粗糙的。马尔科夫不满意切比雪夫要求随机变量的方差值一致有界的条件,经过努力他找到了两种更合理的条件,极大地改进了切比雪夫的结果。

中心极限定理则是概率论中极限理论的又一重要内容,它讨论随机变数和依分布收敛到正态分布的条件,在众多的技术领域里具有重要意义。前文已经提到,切比雪夫首先尝试在概率论的背景中使用矩方法。1884年马尔科夫证明了切比雪夫提出的不等式后,加快了工作步伐,于1887年得到中心极限定理的初步证明。说它是初步的,是因为无论在定理的陈述还是在证明过程中都有某些缺陷。马尔科夫热爱自己的导师,但他更热爱真理,在给彼得堡数学学派的另一成员,喀山大学的瓦西里耶夫(1853-1929)的信中,他特别称老师的结果为“切比雪夫正在证明的定理”,这封信后来以《大数定律和最小二乘法》为题发表在1898年的《喀山大学数理学报》上。同年,马尔科夫又在《关于方程ex (d n e-x /dxn ) = 0的解》一文中,尽力精确地陈述并证明了切比雪夫提出的命题。改进后的方法被人称作切比雪夫-马尔科夫方法。马尔科夫进而把自己和老师的一系列结果,都写进1900年出版的《概率演算》一书之中。这部书是他在概率论方面的集大成的著作,以后每次再版他都增添一些新的内容。

至此矩方法获得了辉煌的胜利,但是出人意料的事情发生了。1902年春天,马尔科夫的低班校友、也是他最敬重的同事和最有力的竞争者李雅普诺夫,在哈尔科夫工作了十七年后回到彼得堡。在此前的一、二年中,李雅普诺夫从一个全新的角度去考察中心极限定理,引入了特征函数这一有力工具,从而不仅避免了矩方法要求高阶矩存在的苛刻条件,在相当宽的条件下证明了中心极限定理,而且通过特征函数实现了数学方法上的革命,为这一定理的进一步精确化准备了条件。

随机过程理论的开拓者

在当代科学与社会的广阔天地里,人们都可以看到一种叫作随机过程的数学模型:从银河亮度的起伏到星系空间的物质分布、从分子的布朗运动到原子的蜕变过程,从化学反应动力学到电话通讯理论、从谣言的传播到传染病的流行、从市场预测到密码破译,随机过程理论及其应用几乎无所不在。人类历史上第一个从理论上提出并加以研究的过程模型是马尔科夫链,它是马尔科夫对概率论乃至人类思想发展作出的又一伟大贡献。

出于扩大极限定理应用范围的目的,马尔科夫在本世纪初开始考虑相依随机变量序列的规律,并从中选出了最重要的一类加以研究。1906年他在《大数定律关于相依变量的扩展》一文中,第一次提到这种如同锁链般环环相扣的随机变量序列,其中某个变量各以多大的概率取什么值,完全由它前面的一个变量来决定,而与它更前面的那些变量无关。这就是被后人称作马尔科夫链的著名概率模型。也是在这篇论文里,马尔科夫建立了这种链的大数定律。

用一个通俗的比喻来形容,一只被切除了大脑的白鼠在若干个洞穴间的蹿动就构成一个马尔科夫链。因为这只白鼠已没有了记忆,瞬间而生的念头决定了它从一个洞穴蹿到另一个洞穴;当其所在位置确定时,它下一步蹿往何处与它以往经过的路径无关。这一模型的哲学意义是十分明显的,用前苏联数学家辛钦(1894-1959〕的话来说,就是承认客观世界中有这样一种现象,其未来由现在决定的程度,使得我们关于过去的知识丝毫不影响这种决定性。这种在已知“现在”的条件下,“未来”与“过去”彼此独立的特性就被称为马尔科夫性,具有这种性质的随机过程就叫做马尔科夫过程,其最原始的模型就是马尔科夫链。

这即是对荷兰数学家克里斯蒂安·惠更斯(Ch. Huygens, 1629-1659)提出的无后效原理的概率推广,也是对法国数学家拉普拉斯(P. S. Laplace, 1749-1827)机械决定论的否定。

这里应该指出,马尔科夫所建立的概率模型不但具有深刻的哲学意义,而且具有真实的物质背景,在他的工作之前或同时,一些马尔科夫链或更复杂的随机过程的例子已出现在某些人的研究中,只不过这些人没有自觉地认识到这类模型的普遍意义或用精确的数学语言表述出来罢了。例如苏格兰植物学家布朗 ( R. Brown, 1773-1858) 于1827年发现的悬浮微粒的无规则运动、英格兰遗传学家高尔顿(F.Galton, 1822-1911) 于1889年提出的家族遗传规律、荷兰物理学家保罗·埃伦费斯特 ( P. Ehrenfest, 1880-1933) 于1907年关于容器中分子扩散的实验,以及传染病感染的人数,谣言的传播,原子核中自由电子的跃迁,人口增长的过程等等,都可用马尔科夫链或过程来描述。也正是在统计物理、量子力学、遗传学以及社会科学的若干新课题、新事实面前,决定论的方法显得百孔千疮、踵决肘见。

有趣的是,马尔科夫本人没有提到他的概率模型在物理世界的应用,但是他利用了语言文学方面的材料来说明链的性质。在《概率演算》第四版中,他统计了长诗《叶甫盖尼·奥涅金》中元音字母和辅音字母交替变化的规律:这是长诗开头的两句,意为:“我不想取悦骄狂的人生,只希望博得朋友的欣赏。”诗人那火一般的诗篇在数学家那里变成了一条冷冰冰的锁链:在这条锁链上只有两种链环,C代表辅音、 代表元音(为了使问题简化起见,不仿把两个无音字母算作辅音)。马尔科夫分别统计了在C后面出现C和 的概率p和1-p,以及在 后出现C和 的概率q和1-q,把结果与按照俄语拼音规则计算出的结果进行比较,证实了语言文字中随机的(从概率的意义上讲)字母序列符合他所建立的概率模型。

完成了关于链的大数定律的证明之后,马尔科夫又开始在一系列论文中研究链的中心极限定理。1907年他在《一种不平常的相依试验》中证明了齐次马尔科夫链的渐近正态性;1908年在《一个链中变量和的概率计算的极限定理推广》中作了进一步的推广;1910年他发表了重要的论文《成连锁的试验》,在其中证明了两种情况的非齐次马尔科夫链的中心极限定理。与此同时他在一些假定的前提下证明了模型的各态历经性,成为在统计物理中具有重要作用的遍历理论中第一个被严格证明的结果。遍历理论亦称ergodic理论,是奥地利物理学家玻耳兹曼(L. Boltzmann, 1844-1906) 于1781年提出来的,其大意是:一个系统必将经过或已经经过其总能量与当时状态相同的另外的任何状态。

为科学与民主而斗争

1886年,经切比雪夫提名,马尔科夫成为彼得堡科学院候补成员,1890年当选为副院士,1896年成为正院士。对于这一俄国科学界的最高荣誉,他抱着一种十分淡泊的态度,而为了伸张真理与正义,他可以抛弃一切功名利禄。他不是一个把自己关在书斋里不问天下事的学者,他提倡科学,反对迷信,关心哲学和社会问题,憎恨教会与沙皇的专制统治。在十九世纪末二十世纪初俄国先进知识分子争取科学与民主运动的潮流中,他是一个勇敢无畏的斗士。

马尔科夫的代表作《概率演算》,不但是概率论学科中不朽的经典文献,而且可以看成是一篇唯物主义者的战斗檄文。这部巨著带有强烈的论战性质,而论战的主要对手竟是他恩师切比雪夫的老师,被认为是俄国数学元宿的布尼亚科夫斯基。

把概率论的方法应用到社会科学中,这本来是法国大革命时代一些数学家的大胆尝试,但是由于拉普拉斯机械决定论的影响,这些学者们往往把复杂的社会现象归结为服从牛顿力学的机械运动,因而这种应用反而损坏了概率论的声誉。布尼亚科夫斯基在自己的著作中以长达六十页的篇幅叙述“把概率分析应用到供词、传说、候选人与不同意见之间的各种选择和依多数表决的司法判决”。其中一个典型的例子是这样的:“由全部俄文字母中任取六个并按取出顺序排列起来,有两个证人说组成了МОСКВА(莫斯科)这个词,问‘证词是真的’这件事的概率是多少?”在假定六个俄文字母所组成的词共5万而证人说真话的倾向为9/10的条件下,布尼亚科夫斯基算得一个小于1/300的概率,这当然大大低于一般人按常识判断出的结果。如果法庭以此来判定证词的真伪,两个“基本上诚实”的证人岂不冤哉枉也?马尔科夫在《概率演算》中尖刻地嘲讽了这个概率论应于“伦理科学”的例子,他写道:“(这个例子)充分阐明在解类似我们所讨论的这种本质上很不确定的问题时,不可避免要引出许多任性的假设。如果容许证人能有错误并且取消其证词的独立性,则所考虑的问题还会有更不确定的性质。”这就一针见血地道破了这种应用的荒诞不经。

1896年,俄国末代沙皇尼古拉二世(1868-1918)粉墨登基。这是一个残酷暴虐的家伙,被人称作“血腥的尼古拉”。从青年时代就受到民主启蒙运动熏陶的马尔科夫,对沙皇的专制统治非常鄙夷,在接纳进步文学家高尔基(1868-1936)为科学院名誉院士的斗争中,马尔科夫与许多富有正义感的院士们一起,与尼古拉二世的粗暴干涉进行了勇敢的斗争。

1902年2月25日,科学院文学部联席会议通过了一项决议,接纳不久以前因为发表了《海燕之歌》而遭到宪兵搜捕和流放的高尔基为名誉院士。这一藐视沙皇专制统治的事件引起了尼古拉二世的极度恐慌,他公然给国民教育大臣发布了一道手谕:“委托你宣布,按照朕的命令,高尔基的当选无效。”受到压力的科学院院务委员会于3月12日发布了一个取消高尔基当选资格的文告。

对于沙皇的这一粗暴干涉,科学院中的进步人士表示了强烈的愤慨,柯罗连科(1853-1921)、契诃夫(1860-1904)等人以宣布退出科学院表示抗议。身在数理学部的马尔科夫于4月6日向院务委员会递交了如下声明:“我认为科学院关于取消高尔基当选资格的文告是无效的和被强加的;第一,文告盗用了科学院的名义,但事实上科学院并无意取消这一资格;第二,文告所借用的理由是毫无意义的。”虽然马尔科夫在院务委员会上要求宣读这一声明,但是遭到执行主席的拒绝。于是他又采取了进一步的行动,两天以后,他向沙皇的叔父、充任科学院院长之职的康斯坦丁大公递交了辞去院士称号的声明。这个根本不懂科学的院长一面劝告马尔科夫收回成命,一面竭力向报界隐瞒事件的真相,害怕更多的科学家效法马尔科夫采取对抗行动。只是由于当时马尔科夫在科学院里正担负着编辑切比雪夫文集的工作,他才没有采取更激烈的措施。但是直到1905年,他还不忘上书院委会,提请撤消其1902年的错误文告。

在这一事件中,马尔科夫对科学院上层集团屈服于沙皇的淫威深感失望。1903年初,他以院委会要从其成员所得科学奖金中抽税一事为借口递交了一份备忘录,上面写着,“我最诚恳地提请院委会注意,我决不申报任何奖励,也决不期望得到任何奖励。”马尔科夫的这一举动的真正目的不在于反对征税,而是以此显示自己绝不同听任沙皇摆布的院委会同流合污。

1905年的民主革命失败以后,俄国政治上开始了一个极端反动时期。1907年6月3日,沙皇的走卒彼得·阿尔卡季耶维奇·斯托雷平(1862-1911)悍然解散有社会民主党人参加的第二届国家杜马,随后组织代表地主和资产阶级利益的第三届杜马。为此,马尔科夫照会科学院理事会说:“第三届国家杜马的建立完全违背了宪法,因而它根本不是一个代表人民意愿的议会,而只是一个非法的团体,因此我最坚决地请求理事会不要将我的名字列入选民的名单之中。”

在斯托雷平反动时期,大学里的民主进步力量遭到了破坏。1908年国民教育部发表通告,重申取消大学自治、恢复学监制度、封闭一切社团。马尔科夫对此非常气愤。他立即给教育大臣写了一封信,信中声称:“我最坚决地拒绝在彼得堡大学充当沙皇政府走卒的角色,但我将保留开设概率论课程的权利。”

在与反动政权的一系列冲突之后,马尔科夫与沙皇专制的重要精神支柱东正教教会实行了决裂。东正教最高会议的头子是尼古拉二世的私人教师和谋臣,他们在奴役俄国各族人民、镇压日益高涨的民主运动等一系列问题上是沆瀣一气的。沙皇当局不便直接出面干的坏事,就由东正教会来干,1901年东正教最高裁判所就宣布大文豪托尔斯泰(1828-1910)为异教徒而开除了他的教籍。马尔科夫从青年时代就具有无神论的倾向,托尔斯泰的思想对他也有一定的影响。1912年2月12日,马尔科夫致信东正教最高会议,信中写道:“我最诚挚地请求革除我的教籍。我希望以下所摘引的本人所写的《概率演算》一书中的言论足以成为除籍的理由,因为这些言论已经充分表明我对成为犹太教和基督教义之基础的那些传说所持的反对态度。”

马尔科夫链

马尔科夫链是一个随机过程,同时马尔科夫链的记忆类似于“金鱼的记忆只有3秒”,非常的健忘。

1 - 2 - 3 - 4 - 5 - 6

比如说,你现在站在5对6进行预测,根据马尔科夫链的知识,6的状态只和5有关,而前面1到2, 2到3, 3到4,4到5的整个过程无关。

马尔科夫链认为过去所有的信息都被保存在了现在的状态下了

马尔科夫链被用的最多的例子就是天气预测了:


天气预测

比方说,今天下雨了(rainy),那么明天的天气会怎么样呢?

如上图:

今天下雨,明天继续下雨的可能性为0.8

今天下雨,明天下雪的可能性为0.02

今天下雨,明天晴天的可能性为0.18

也就是说,我只要知道今天是下雨,我就能知道明天天气的可能性,而不用去管前天是什么天气。

袋中取球问题

在学习概率论的时候,基本上会遇到“袋中取球”的问题。如上图,袋中有2个绿球,2个红球,3个蓝球,我下一次取球是绿色的概率是多少,取完的球不放回袋中?

假设之前的取球结果是:绿,红,蓝,蓝

那么,我下一次取球的时候,袋中只有绿色球1个,红色球1个,蓝色球1个,我下一次取球的是绿色球的概率是1/3。这不仅和我最后一次取得球是蓝色有关,也和我之前每一次取的球的颜色有关,所以这个过程不是一个马尔科夫链过程。

如果是“袋中取球”,每一次取完球都放回袋中,那么,你下一次取球是绿色的概率始终是2/7。这就建立了一个马尔科夫随机过程[2]

马尔科夫链也蕴含着哲学的思想:

现在的你是过去早就的,而未来的你与你的过去无关,只和你当下的努力和选择有关,放下过去,不管多么辉煌或者糟粕,背上行囊,什么时候出发都来得及!

參考资料