安德雷·馬爾可夫檢視原始碼討論檢視歷史
安德雷·馬爾可夫 | |
---|---|
原文名 | Андрей Андреевич Марков |
國籍 | 俄國 |
職業 | 數學家 |
安德雷·安德耶維齊·馬爾可夫(Андрей Андреевич Марков)(1856年6月14日-1922年7月20日),俄國數學家。出生於梁贊州,他的父親是一位中級官員,後來舉家遷往聖彼得堡。1874年馬爾可夫入聖彼得堡大學,師從切比雪夫,畢業後留校任教,任聖彼得堡大學教授(1893-1905),研究數論和概論。後自願承擔罪名而被流放到扎拉斯克。1886年當選為聖彼得堡科學院院士。馬爾可夫1922年逝世於聖彼得堡。
馬爾可夫的主要研究領域在概率和統計方面,他因提出馬爾可夫鏈的概念而享有盛名。馬爾可夫鏈已經成功應用到物理、化學、語音識別、信息科學、金融等領域,谷歌所使用的網頁排序算法就是由馬爾可夫鏈定義的。[1]
生平
1856年6月14日,梁贊省林業廳六等文官馬爾科夫的妻子生下一個男孩,這就是19世紀末至20世紀初對俄國科學和民主進步事業都作出巨大貢獻的數學家安德烈·安德列耶維奇·馬爾科夫(1856-1922)。
梁贊與莫斯科毗鄰,自古就是俄羅斯中部富饒的穀倉。蒼綠的林海和金黃的麥田復蓋着廣袤的大地,蜿蜒的奧卡河靜靜地流過省會梁贊市,給這座城市帶來繁榮與生機。但是老馬爾科夫在生活上和官場中都不得意,他結過兩次婚,共生育了五男四女,一大家子的衣食溫飽,象座山似地壓在他瘦弱的肩上。然而命運多蹇,老實人後來在官場遭人誣陷被迫辭職,一家人只好遷居彼得堡另謀生路,這一年馬爾科夫剛滿五歲。
中學時代開始了,馬爾科夫被送到彼得堡第五中學。這是一所完全按照東正教的陳規陋俗來治理的學校。對於正在長身體和求知慾不斷高漲的孩子們,學校的要求是連篇累犢地背誦希臘及拉丁文,外加各種祈禱與懺悔儀式。馬爾科夫厭惡這種令人窒息的環境,除了數學以外,他對學校里的其它課程都不感興趣。馬爾科夫有兩個姐姐也在這所學校讀書,她們的經典和操行總是得到老師的表揚,唯獨桀驁不訓的馬爾科夫總是不能引起老師的好感。為此父親常被校長招到學校,為他承受那令人難堪的嘲諷與訓斥。
但是馬爾科夫絕不是那種除了數學就什麼都不懂的怪坯子,他對社會問題的關心以及對於人文科學的熱愛貫穿其生命的始終。正是在第五中學時,他讀了大量課外作品──那既不是教師推薦的羅馬編年史,也不是廉價的法國愛情小說,而是一些高年級學生偷偷帶到學校里來的進步讀物。為此他與校方發生了嚴重的衝突。
馬爾科夫的言行逐漸引起了學校當局的注意,父親被傳喚的次數越來越多了。就在臨近畢業的那個學期,危機終於爆發出來。在一次例行的祈禱儀式臨近結束時,心不在焉的馬爾科夫把《聖經》匆匆地塞進口袋,只盼着趕快跑到庭院裡去輕鬆一下,一直在監視他的學監突然出現在他面前,氣勢洶洶地指責他破壞了宗教儀式的肅穆氣氛。學生中一片喧譁,儀式草草收場。馬爾科夫則被帶到校長室,被斥為無神論者和無政府主義分子,揚言要立即開除學籍。父親聞訊趕來,再三地賠禮道歉才算平息了這場風波。
1874年,馬爾科夫考入了神往已久的彼得堡大學數學系,從此脫離那個令人感到壓抑的環境,開始在絢麗多姿的數學王國里自由地呼吸。1878年,馬爾科夫以優異成績畢業並留校任教,畢業論文《以連分數解微分方程》獲得當年系裡的金質獎。兩年後他完成了《關於雙正定二次型》的碩士論文,並正式給學生開課。又過了兩年,他開始考慮博士論文,後以《關於連分數的某些應用》於1884年通過正式答辯。
十九世紀數學的一個特點就是學派的興起。誕生在法蘭西大革命風暴中的巴黎學派仍雄踞數壇,他們勇於開拓新的研究方向,富有創造激情,在函數論、數學物理、幾何、拓撲與群論等領域總是走在別人的前面。長於哲學思辨的德國人則特別重視數學大廈的基礎,「算術化」成了柏林學派的戰鬥旗幟;當然,柏林人不象巴黎人那樣輕視「外省人」,在波恩、萊比錫和格廷根都出現了引入注意的數學家群體──特別是最後那座小城,不久就要取代巴黎成為數學的耶路撒冷。自負的英國人也開始從固步自封的舊夢中覺醒,在牛頓( I. Newton, 1642-1727)的母校冒出了一個「分析學會」,會中的年輕人竟敢頂着褻瀆神聖的罪名去推廣德國人萊布尼茨( G. W. Leibniz, 1646-1716 ) 的微積分符號,19世紀英國人在代數學領域的成就於此不無關係。在文藝復興的故鄉,一個以幾何與拓撲為突破口的新意大利學派正在成長。
按照新意大利學派第二代領袖沃爾特拉(V. Volterra, 1860-1940)的說法,這一學派的誕生可以溯源於布廖斯奇 ( E. Brioschi, 1824-1897) 和貝蒂 ( E. Betti, 1823-1892) 1858年的德、法之行。但是在俄國歷史上卻很難找到一個足以標誌彼得堡數學學派呱呱落地的事件。有人將俄國數學的進步追溯到1727年瑞士大數學家歐拉( L. Euler, 1707-1783) 前來彼得堡科學院供職,也有人將之歸因於布尼亞科夫斯基、奧斯特洛格拉特斯基(1801-1862 ) 等人從法國留學回來從事數學教育,然而真正使彼得堡與數學結緣的卻是切比雪夫和他的弟子們。
彼得堡所在的地方原先只是波羅的海芬蘭灣東端的一個小漁村,為了顯示其向西方學習的決心並打開通向波羅的海的通道,彼得大帝( Peter I The Great, 1672-1725) 於1703年在此建立了一個軍事要塞,更於1712年將首都從莫斯科遷到這裡。在彼得大帝宏偉的政治經濟改革藍圖中,有一項仿效西方建立科學院的計劃,但是由於種種原因,直到他去世的1725年,這個柏林科學院的翻版才正式問世。早期的院士中不乏知名的數學家,如貝努利家族的尼古拉第三(Nicolaus III Bernoulli)和丹尼爾(Daniel Bernoulli, 1700-1782)、哥德巴赫(C. Goldbach, 1690-1764) 以及歐拉( L. Euler,1707-1783) 等,但是他們都是外國人。當時俄羅斯數學的土壤是貧瘠的:沒有土生土長的數學家,沒有能夠引起其他國家數學家注意的成果,沒有一所大學,甚至連一本象樣的初等數學教科書都沒有。
彼得堡數學學派是伴隨着切比雪夫幾十年的舌耕筆耘成長壯大的。自1846年接受助教職位到1882年以終身榮譽教授的身份退休,切比雪夫在彼得堡大學執鞭達三十五年之久,即使退休之後他還繼續從事研究並培養研究生。他的講課深受學生們的歡迎,那絕不是經院式的說教,而是充滿啟發性評論的對基本原理和方法的敘述,正如他的高足李雅普諾夫 (1857-1918) 描述的那樣,「他在課堂上即興給出的一個評論,往往與聽講者冥冥求索的某個問題有關,因為他對弟子們的水平和思想活動了如指掌。因而他的講課極具感染力,每堂課都使學生們獲益良多。」教學之外,切比雪夫本人在數學的若干領域也作出了開拓性的貢獻,特別是在數論、概率論和函數逼近論方面。他是彼得堡數學學派當之無愧的領袖。
1883年,馬爾科夫與自幼相識的女友瓦里瓦契耶瓦婭結為伉儷,新娘的母親就是他父親當年的女僱主。大學時代的馬爾科夫曾給讀高中的瓦里瓦契耶瓦婭當過業餘家庭教師,正是這種頻繁的接觸催開了這一對年輕人心中的愛情花朵。但是一開始,那位富孀是不贊成這門婚事的,因為她一想起當年那個在花園裡拄着拐杖踽踽獨行的可憐孩子和經常使他忠厚的管家心緒不寧的桀驁少年,心裡總是有一種靠不住的感覺。然而事實最終戰勝了偏見,面對這個事業上不斷獲得成功的英俊青年助教,她終於感到無可挑剔了。
從1880年馬爾科夫就開始在彼得堡大學任教,先是擔任助教和講師,1886年成為副教授,1893年升為正教授,1905年退休並榮獲終身榮譽教授的稱號。二十五年來,他先後講授過微積分、數論、函數論、矩論、計算方法、微分方程、概率論等課程,為祖國培養了許多出色的數學人才。
關於馬爾科夫的講課風格毀譽不一。他與切比雪夫和李雅普諾夫不同,講課時既不在乎板書的工整也不注意表情的生動,而且經常有意略去教科書中的傳統題材,因此一般的學生抱怨不好懂。但是優秀的學生髮現他的課程從邏輯上來看具有無可指責的嚴密性,內容充實無華,其中往往還有些他本人最新的研究成果。
他從教授席位上退休以後,仍然以科學院院士的資格在彼得堡大學開設概率論課程,講義用的就是傾注了他半生心血的《概率演算》。為了開好這門課,他反覆地對這部書進行了修改,直到臨終前還在進行第四版的校訂工作。這一最後的修訂本於他逝世兩年以後出版。 十月革命前夕,彼得堡的局勢動盪不定,科學院與大學已無正常的工作秩序。在這種情況下,馬爾科夫請求科學院派他到外省去從事中學教育。1917年9月,年過花甲的馬爾科夫來到梁贊省一個叫薩蘭斯克的縣城,無償地擔負了縣中學的數學教學工作。他有個十四歲的兒子也一同來到這裡,恰好就插班在他任課的年級。這個小馬爾科夫(1903-1979)的名字及父名與父親完全相同,後來也成了有名的數學家,先研究理論物理和天體力學,後轉向動力體系理論、測度論、拓樸學、代數等,並於1953年當選為蘇聯科學院通訊院士。 1918年秋,馬爾科夫因患青光眼回到彼得堡治療,手術後他返回闊別已久的母校繼續開設他的概率論講座。這時候他的體力已遠不如從前了,每次講課都要兒子攙扶着進出教室。然而當他一站到講台上,就感到有了精神。在幾十年的教學生涯,他比其他任何人都更忠實地向學生們灌輸彼得堡數學學派的信條和理想。他繼承了切比雪夫對具體問題的興趣,不斷地追求數學方法的簡單化和儘可能精確的結果,他善於向經典課題汲取養料,同時把自己的事業深深地札根在大學這塊沃土之中。在彼得堡數學家團體中,沒有人比他更「彼得堡化」了。有一次別人向他請教數學的定義,他不無驕傲地說:「數學,那就是高斯、切比雪夫、李雅普諾夫、斯捷克洛夫和我所研究的東西」。
1921年秋天,馬爾科夫的病情開始嚴重起來,他只得離開心愛的大學。在生命的最後一年裡,他還抓緊時間修訂了《概率演算》。1922年7月20日,這位在眾多數學分支里留下足跡和為科學與民主事業奮鬥了一生的老人辭別了人世。馬爾科夫的遺體被安葬在彼得堡的米特羅方耶夫斯基公墓,他的墓碑沒有過多的修飾,就象他的文章和講課一樣樸素無華。然而他的思想、他的成就、他的品德就象一座巍峨的豐碑,永遠矗立在真理求索者的心中。
成就榮譽
從數論到經典分析
馬爾科夫入學不久就表現出其獨特的數學天賦,因此當柯爾金和佐洛塔廖夫這兩位教師組織代數與數論的討論班時,他們毫不猶豫地把這個在中學時代就敢於向大權威談論自己發現的學生吸收進來。馬爾科夫不負眾望,他的第一項重要的數學工作,就是沿着柯爾金和佐洛塔廖夫倆人所開闢的道路完成的。
二次型的理論是代數數論中的一個重要課題,歐拉、拉格朗日( J . L. Lagrange, 1736-1813)、高斯(C. F. Gauss, 1777-1855)這些大數學家都曾為它付出艱辛的勞動。二元二次型(亦稱雙二次型)是二次型中最簡單的一種形式,在給定其判別式的條件下,尋找二次型的極值是一件十分有意義而又相當棘手的工作,若干年來雖然有一些進展,但是疑點仍然不少。柯爾金和佐洛塔廖夫給出了與判別式相關的兩類雙二次型的最小值的近似估計,這一結果得到當時法國著名數學家埃爾米特(C. Hermite, 1822-1901)的高度評價。
馬爾科夫1880年的碩士論文就是對這一結果的徹底完善化。他證明了兩位老師找到的數值不過是一個收斂於常數的正無窮遞減數列中的前兩項,而該數列通項的值則取決於一個三元二次不定方程在某些附加條件下的整數解。他還給出了由此類不定方程的解來計算通項的具體方法,從而建立了二次型表示論與著名的丟番圖方程的聯繫。這樣,馬爾科夫就徹底地搞清了判別式大於零時不定雙二次型最小值的分布情況,極大地推進了柯爾金和佐洛塔廖夫的結果。
在這項研究中,馬爾科夫已表現出了切比雪夫等前輩學者對他的影響,那就是善於聯繫經典問題、充分利用初等工具、追求解的精確性、實用性以及不畏繁複計算等鮮明的彼得堡風格。論文附有一個包括前20個通項值計算程序和結果的大表,每一行數據都對應着一個複雜的丟番圖方程。甚至早期彼得堡數學學派的一個缺點在這項研究中也有所反映,那就是馬爾科夫完全排斥了幾何背景,因為他同切比雪夫一樣懷疑幾何語言的嚴密性。其實,在型表示論中借用幾何語言是最自然不過了,高斯關於三元二次型幾何意義的說明被認為是閔可夫斯基(H. Minkowski, 1864-1909)關於數的幾何理論的開端,早期彼得堡數學家在這一領域可謂失之交臂。
雙二次型最小值的分布搞清楚以後,馬爾科夫開始注意多個變元的二次型,只是由於教務倥傯,直到十一年後才發表了進一步的研究成果。1901年,他在《關於不定三元二次型》中給出了該類型的前四種極值形式(其中一種也為柯爾金所得到)。1909年,他匯集了自己關於三元二次型的成果,出版了包括所有判別式不大於50的三元二次型最新數據在內的專著。這些工作都是伴隨着大量複雜的計算進行的,馬爾科夫不僅通過計算提供了問題的解,而且對於發展計算方法也做出了貢獻。以後他又研究了四元二次型,並得到其極值的前兩種形式。
代數數論中的另一個重要課題是關於理想的理論。1843年,德國數學家庫莫爾(E. E. Kummer, 1810-1893) 在企圖證明費爾馬大定理的壯舉中被一道小河溝擋住了。看過他手稿的狄里克萊(P. L. Dirichlet, 1805-1859) 不客氣地指出,代數域上的素因子分解唯一性定理對代數數不一定成立,而素因子唯一分解的假定對於他的證明又是絕對必要的。為了克服這一障礙,庫莫爾開始在一系列論文中創立和發展一種叫做理想的理論,藉助理想數來實現代數域上素因子的唯一分解,從此對理想的研究在一個時期內達到高潮。佐洛塔廖夫曾致力於三次方根域上理想素因子的分解,可惜這位英華早發的學者三十一歲就逝世了。在為紀念佐洛塔廖夫而出版的文集中,馬爾科夫給出了三次方根域上理想素因子分解的當時最好結果。
馬爾科夫等人在代數數論方面的工作與切比雪夫在解析數論方面的工作一起,確立了彼得堡數學學派在數論領域的領先地位。但他並不以此為滿足,而是很快地把目標轉向一系列更廣的數學題材,特別是在經典分析領域做出了新的貢獻。
1833年,法國一個不太出名的數學家比內梅(J. Bienayme, 1796-1878) 向巴黎科學院遞交的一篇論文中,將力學中矩的概念作了推廣,但文章直到三十四年後才在劉維爾 ( J. Liouville, 1809-1882)的《純粹與應用數學雜誌》上刊登出來。切比雪夫立即意識到矩的研究具有重要意義,並試圖在對概率論極限定理的證明中應用這一工具。他在1874年寫成的論文《關於積分的極限值》中,藉助於矩給出了某類非負函數積分以連分數形式表達的極值不等式,但沒有證明。1884年馬爾科夫在《某些切比雪夫積分的證明》一文中,給出了這些不等式的嚴格證明,並在同年通過的博士論文的第三部分給出了切比雪夫問題的完整解答。
後來在概率論的研究中,馬爾科夫一再回到矩的問題上來,並對切比雪夫的矩問題作了許多深入的拓廣。他的這些工作,最初見於1876年發表的《連分數的一些新應用》,而後又在1897年的一系列論文中作了進一步的闡述,其中最為重要的一篇是《關於矩的一個L問題》
幾乎在馬爾科夫證明切比雪夫不等式的同時,荷蘭數學家斯提吉斯(Th. J. Stieltjes, 1856-1894) 也開始了同樣的研究,他在《關於所謂力學積分法的研究》一文中給出了與馬爾科夫類似的結果。一開始俄國數學界宣稱擁有優先權,斯提吉斯則聲稱自己沒看到馬爾科夫的論文,也不知道切比雪夫原先提出的問題。事實也的確是這樣。問題搞清楚以後,馬爾科夫與斯提吉斯成了很好的朋友,他們寄書鴻雁,頻繁地交流各自在矩理論以及有關內插法、構造積分、餘項估價和連分數等方面的新成果,這種關係一直持續到斯提吉斯逝世。就在去世前不外,斯提吉斯發表了帶有綜述性質的《關於連分數的研究》,其中解決了無窮區間上的矩問題,並且給出了所要尋找的函數的一切整數階矩的連分數表達式。作為回答與對好友的紀念,馬爾科夫於1895年發表了《關於某些連分數收斂性的兩個證明》,在其中給出了斯提吉斯連分數收斂的充分條件。
十餘年來,馬爾科夫和斯提吉斯共同研究矩的理論。他們都是從經典分析中的問題出發,企圖對積分的上、下界給出一個精確的估計,工作中又都大量運用了連分數這一工具,所以不謀而合與互相啟發的現象常常出現在倆人之間。但是馬爾科夫對精確的結果特別感興趣,不憚於繁複的數字運算,並把對於積分的估值應用到概率論中,這是彼得堡數學學派風格之體現。而斯提吉斯更注意從一般的原則上去考察矩問題,他更關心的是積分形式的意義,而不是其估值的結果,從而導致了一類應用廣泛的斯提吉斯積分的出現,為實變函數論的日後發展開闢了道路,這又很有些法蘭西數學學派的味道。
如同他的導師切比雪夫一樣,馬爾科夫對實際問題具有濃厚的興趣,他在函數逼近論方面的工作就是一例。出於化學理論上的需要,彼得堡大學的著名化學家、也就是元素周期律的發現者門捷列夫(1834-1907)曾提出過一個問題,從數學上說相當於找出定義在閉區間上的高次多項式的導數在某種條件下的最大值。1889年,馬爾夫在題為《關於一個門捷列夫問題》的論文中,解決了由多項式的上界來求其導數多項式上界的問題;這個問題也可表示為偏離零點的多項式的最大偏差的估計,因此與切比雪夫所建立的一系列結果都有關係。1892年,馬爾科夫的同父異母弟弟弗拉基米爾(1871-1897)曾把這一問題推廣到求導數多項式的上確界的情況,可惜這位頗有數學才華的弟弟二十六歲便死於肺結核。馬爾科夫還研究過許多其它的實際問題,其中包括將空間曲面部分最小變形地轉換到平面,以及鐵路彎道的曲率等問題。
馬爾科夫對微分方程的貢獻主要是關於拉梅(G. Lame., 1795-1870)方程和超幾何方程的研究。他確定了一個超幾何方程的兩個解的乘積可作為整函數的條件,研究了這些函數與拉梅函數的零點分布,這些工作還導致了以初等函數表示積分,並涉及了大量的近似計算方法。
把概率論推進到現代化的門檻
把概率論從瀕臨衰亡的境地挽救出來,恢復其作為一門數學學科的地位,並把它推進到現代化的門檻,這是彼得堡數學學派為人類作出的偉大貢獻。切比雪夫。馬爾科夫和李雅普諾夫師生三人為此付出了艱辛的勞動,其中尤以馬爾科夫的工作最多。據統計,他生平發表的概率論方面的文章或專著共有二十五篇(部)之多;切比雪夫和李雅普諾夫在概率論方面的論文各為四篇和二篇。
大約從1883年起,馬爾科夫就開始考慮概率論中的基本問題了。十九世紀的八、九十年代,他主要是沿着切比雪夫開創的方向,致力於獨立隨機變量和古典極限理論的研究,從而改進和完善了大數定律和中心極限定理。進入二十世紀以後,他的興趣轉移到相依隨機變量序列上來,並創立了使他名垂千古的那個概率模型。
概率論中的一個基本問題就是探索概率接近於1時的規律。特別是大量獨立或弱相依因素累積結果所發生的規律,大數定律就是研究這種規律的命題之一。1845年,切比雪夫第一次嚴格地證明了貝努利形式的大數定律,次年他又把結果推廣到泊松形式的大數定律。在概率論門戶蕭條的年代裡,切比雪夫的工作無疑起到了振聾發聵的作用。但是由於處理手法還不夠完善,所得結果還是比較粗糙的。馬爾科夫不滿意切比雪夫要求隨機變量的方差值一致有界的條件,經過努力他找到了兩種更合理的條件,極大地改進了切比雪夫的結果。
中心極限定理則是概率論中極限理論的又一重要內容,它討論隨機變數和依分布收斂到正態分布的條件,在眾多的技術領域裡具有重要意義。前文已經提到,切比雪夫首先嘗試在概率論的背景中使用矩方法。1884年馬爾科夫證明了切比雪夫提出的不等式後,加快了工作步伐,於1887年得到中心極限定理的初步證明。說它是初步的,是因為無論在定理的陳述還是在證明過程中都有某些缺陷。馬爾科夫熱愛自己的導師,但他更熱愛真理,在給彼得堡數學學派的另一成員,喀山大學的瓦西里耶夫(1853-1929)的信中,他特別稱老師的結果為「切比雪夫正在證明的定理」,這封信後來以《大數定律和最小二乘法》為題發表在1898年的《喀山大學數理學報》上。同年,馬爾科夫又在《關於方程ex (d n e-x /dxn ) = 0的解》一文中,盡力精確地陳述並證明了切比雪夫提出的命題。改進後的方法被人稱作切比雪夫-馬爾科夫方法。馬爾科夫進而把自己和老師的一系列結果,都寫進1900年出版的《概率演算》一書之中。這部書是他在概率論方面的集大成的著作,以後每次再版他都增添一些新的內容。
至此矩方法獲得了輝煌的勝利,但是出人意料的事情發生了。1902年春天,馬爾科夫的低班校友、也是他最敬重的同事和最有力的競爭者李雅普諾夫,在哈爾科夫工作了十七年後回到彼得堡。在此前的一、二年中,李雅普諾夫從一個全新的角度去考察中心極限定理,引入了特徵函數這一有力工具,從而不僅避免了矩方法要求高階矩存在的苛刻條件,在相當寬的條件下證明了中心極限定理,而且通過特徵函數實現了數學方法上的革命,為這一定理的進一步精確化準備了條件。
隨機過程理論的開拓者
在當代科學與社會的廣闊天地里,人們都可以看到一種叫作隨機過程的數學模型:從銀河亮度的起伏到星系空間的物質分布、從分子的布朗運動到原子的蛻變過程,從化學反應動力學到電話通訊理論、從謠言的傳播到傳染病的流行、從市場預測到密碼破譯,隨機過程理論及其應用幾乎無所不在。人類歷史上第一個從理論上提出並加以研究的過程模型是馬爾科夫鏈,它是馬爾科夫對概率論乃至人類思想發展作出的又一偉大貢獻。
出於擴大極限定理應用範圍的目的,馬爾科夫在本世紀初開始考慮相依隨機變量序列的規律,並從中選出了最重要的一類加以研究。1906年他在《大數定律關於相依變量的擴展》一文中,第一次提到這種如同鎖鏈般環環相扣的隨機變量序列,其中某個變量各以多大的概率取什麼值,完全由它前面的一個變量來決定,而與它更前面的那些變量無關。這就是被後人稱作馬爾科夫鏈的著名概率模型。也是在這篇論文裡,馬爾科夫建立了這種鏈的大數定律。
用一個通俗的比喻來形容,一隻被切除了大腦的白鼠在若干個洞穴間的躥動就構成一個馬爾科夫鏈。因為這隻白鼠已沒有了記憶,瞬間而生的念頭決定了它從一個洞穴躥到另一個洞穴;當其所在位置確定時,它下一步躥往何處與它以往經過的路徑無關。這一模型的哲學意義是十分明顯的,用前蘇聯數學家辛欽(1894-1959〕的話來說,就是承認客觀世界中有這樣一種現象,其未來由現在決定的程度,使得我們關於過去的知識絲毫不影響這種決定性。這種在已知「現在」的條件下,「未來」與「過去」彼此獨立的特性就被稱為馬爾科夫性,具有這種性質的隨機過程就叫做馬爾科夫過程,其最原始的模型就是馬爾科夫鏈。
這即是對荷蘭數學家克里斯蒂安·惠更斯(Ch. Huygens, 1629-1659)提出的無後效原理的概率推廣,也是對法國數學家拉普拉斯(P. S. Laplace, 1749-1827)機械決定論的否定。
這裡應該指出,馬爾科夫所建立的概率模型不但具有深刻的哲學意義,而且具有真實的物質背景,在他的工作之前或同時,一些馬爾科夫鏈或更複雜的隨機過程的例子已出現在某些人的研究中,只不過這些人沒有自覺地認識到這類模型的普遍意義或用精確的數學語言表述出來罷了。例如蘇格蘭植物學家布朗 ( R. Brown, 1773-1858) 於1827年發現的懸浮微粒的無規則運動、英格蘭遺傳學家高爾頓(F.Galton, 1822-1911) 於1889年提出的家族遺傳規律、荷蘭物理學家保羅·埃倫費斯特 ( P. Ehrenfest, 1880-1933) 於1907年關於容器中分子擴散的實驗,以及傳染病感染的人數,謠言的傳播,原子核中自由電子的躍遷,人口增長的過程等等,都可用馬爾科夫鏈或過程來描述。也正是在統計物理、量子力學、遺傳學以及社會科學的若干新課題、新事實面前,決定論的方法顯得百孔千瘡、踵決肘見。
有趣的是,馬爾科夫本人沒有提到他的概率模型在物理世界的應用,但是他利用了語言文學方面的材料來說明鏈的性質。在《概率演算》第四版中,他統計了長詩《葉甫蓋尼·奧涅金》中元音字母和輔音字母交替變化的規律:這是長詩開頭的兩句,意為:「我不想取悅驕狂的人生,只希望博得朋友的欣賞。」詩人那火一般的詩篇在數學家那裡變成了一條冷冰冰的鎖鏈:在這條鎖鏈上只有兩種鏈環,C代表輔音、 代表元音(為了使問題簡化起見,不仿把兩個無音字母算作輔音)。馬爾科夫分別統計了在C後面出現C和 的概率p和1-p,以及在 後出現C和 的概率q和1-q,把結果與按照俄語拼音規則計算出的結果進行比較,證實了語言文字中隨機的(從概率的意義上講)字母序列符合他所建立的概率模型。
完成了關於鏈的大數定律的證明之後,馬爾科夫又開始在一系列論文中研究鏈的中心極限定理。1907年他在《一種不平常的相依試驗》中證明了齊次馬爾科夫鏈的漸近正態性;1908年在《一個鏈中變量和的概率計算的極限定理推廣》中作了進一步的推廣;1910年他發表了重要的論文《成連鎖的試驗》,在其中證明了兩種情況的非齊次馬爾科夫鏈的中心極限定理。與此同時他在一些假定的前提下證明了模型的各態歷經性,成為在統計物理中具有重要作用的遍歷理論中第一個被嚴格證明的結果。遍歷理論亦稱ergodic理論,是奧地利物理學家玻耳茲曼(L. Boltzmann, 1844-1906) 於1781年提出來的,其大意是:一個系統必將經過或已經經過其總能量與當時狀態相同的另外的任何狀態。
為科學與民主而鬥爭
1886年,經切比雪夫提名,馬爾科夫成為彼得堡科學院候補成員,1890年當選為副院士,1896年成為正院士。對於這一俄國科學界的最高榮譽,他抱着一種十分淡泊的態度,而為了伸張真理與正義,他可以拋棄一切功名利祿。他不是一個把自己關在書齋里不問天下事的學者,他提倡科學,反對迷信,關心哲學和社會問題,憎恨教會與沙皇的專制統治。在十九世紀末二十世紀初俄國先進知識分子爭取科學與民主運動的潮流中,他是一個勇敢無畏的鬥士。
馬爾科夫的代表作《概率演算》,不但是概率論學科中不朽的經典文獻,而且可以看成是一篇唯物主義者的戰鬥檄文。這部巨著帶有強烈的論戰性質,而論戰的主要對手竟是他恩師切比雪夫的老師,被認為是俄國數學元宿的布尼亞科夫斯基。
把概率論的方法應用到社會科學中,這本來是法國大革命時代一些數學家的大膽嘗試,但是由於拉普拉斯機械決定論的影響,這些學者們往往把複雜的社會現象歸結為服從牛頓力學的機械運動,因而這種應用反而損壞了概率論的聲譽。布尼亞科夫斯基在自己的著作中以長達六十頁的篇幅敘述「把概率分析應用到供詞、傳說、候選人與不同意見之間的各種選擇和依多數表決的司法判決」。其中一個典型的例子是這樣的:「由全部俄文字母中任取六個並按取出順序排列起來,有兩個證人說組成了МОСКВА(莫斯科)這個詞,問『證詞是真的』這件事的概率是多少?」在假定六個俄文字母所組成的詞共5萬而證人說真話的傾向為9/10的條件下,布尼亞科夫斯基算得一個小於1/300的概率,這當然大大低於一般人按常識判斷出的結果。如果法庭以此來判定證詞的真偽,兩個「基本上誠實」的證人豈不冤哉枉也?馬爾科夫在《概率演算》中尖刻地嘲諷了這個概率論應於「倫理科學」的例子,他寫道:「(這個例子)充分闡明在解類似我們所討論的這種本質上很不確定的問題時,不可避免要引出許多任性的假設。如果容許證人能有錯誤並且取消其證詞的獨立性,則所考慮的問題還會有更不確定的性質。」這就一針見血地道破了這種應用的荒誕不經。
1896年,俄國末代沙皇尼古拉二世(1868-1918)粉墨登基。這是一個殘酷暴虐的傢伙,被人稱作「血腥的尼古拉」。從青年時代就受到民主啟蒙運動薰陶的馬爾科夫,對沙皇的專制統治非常鄙夷,在接納進步文學家高爾基(1868-1936)為科學院名譽院士的鬥爭中,馬爾科夫與許多富有正義感的院士們一起,與尼古拉二世的粗暴干涉進行了勇敢的鬥爭。
1902年2月25日,科學院文學部聯席會議通過了一項決議,接納不久以前因為發表了《海燕之歌》而遭到憲兵搜捕和流放的高爾基為名譽院士。這一藐視沙皇專制統治的事件引起了尼古拉二世的極度恐慌,他公然給國民教育大臣發布了一道手諭:「委託你宣布,按照朕的命令,高爾基的當選無效。」受到壓力的科學院院務委員會於3月12日發布了一個取消高爾基當選資格的文告。
對於沙皇的這一粗暴干涉,科學院中的進步人士表示了強烈的憤慨,柯羅連科(1853-1921)、契訶夫(1860-1904)等人以宣布退出科學院表示抗議。身在數理學部的馬爾科夫於4月6日向院務委員會遞交了如下聲明:「我認為科學院關於取消高爾基當選資格的文告是無效的和被強加的;第一,文告盜用了科學院的名義,但事實上科學院並無意取消這一資格;第二,文告所借用的理由是毫無意義的。」雖然馬爾科夫在院務委員會上要求宣讀這一聲明,但是遭到執行主席的拒絕。於是他又採取了進一步的行動,兩天以後,他向沙皇的叔父、充任科學院院長之職的康斯坦丁大公遞交了辭去院士稱號的聲明。這個根本不懂科學的院長一面勸告馬爾科夫收回成命,一面竭力向報界隱瞞事件的真相,害怕更多的科學家效法馬爾科夫採取對抗行動。只是由於當時馬爾科夫在科學院裡正擔負着編輯切比雪夫文集的工作,他才沒有採取更激烈的措施。但是直到1905年,他還不忘上書院委會,提請撤消其1902年的錯誤文告。
在這一事件中,馬爾科夫對科學院上層集團屈服於沙皇的淫威深感失望。1903年初,他以院委會要從其成員所得科學獎金中抽稅一事為藉口遞交了一份備忘錄,上面寫着,「我最誠懇地提請院委會注意,我決不申報任何獎勵,也決不期望得到任何獎勵。」馬爾科夫的這一舉動的真正目的不在於反對徵稅,而是以此顯示自己絕不同聽任沙皇擺布的院委會同流合污。
1905年的民主革命失敗以後,俄國政治上開始了一個極端反動時期。1907年6月3日,沙皇的走卒彼得·阿爾卡季耶維奇·斯托雷平(1862-1911)悍然解散有社會民主黨人參加的第二屆國家杜馬,隨後組織代表地主和資產階級利益的第三屆杜馬。為此,馬爾科夫照會科學院理事會說:「第三屆國家杜馬的建立完全違背了憲法,因而它根本不是一個代表人民意願的議會,而只是一個非法的團體,因此我最堅決地請求理事會不要將我的名字列入選民的名單之中。」
在斯托雷平反動時期,大學裡的民主進步力量遭到了破壞。1908年國民教育部發表通告,重申取消大學自治、恢復學監製度、封閉一切社團。馬爾科夫對此非常氣憤。他立即給教育大臣寫了一封信,信中聲稱:「我最堅決地拒絕在彼得堡大學充當沙皇政府走卒的角色,但我將保留開設概率論課程的權利。」
在與反動政權的一系列衝突之後,馬爾科夫與沙皇專制的重要精神支柱東正教教會實行了決裂。東正教最高會議的頭子是尼古拉二世的私人教師和謀臣,他們在奴役俄國各族人民、鎮壓日益高漲的民主運動等一系列問題上是沆瀣一氣的。沙皇當局不便直接出面乾的壞事,就由東正教會來干,1901年東正教最高裁判所就宣布大文豪托爾斯泰(1828-1910)為異教徒而開除了他的教籍。馬爾科夫從青年時代就具有無神論的傾向,托爾斯泰的思想對他也有一定的影響。1912年2月12日,馬爾科夫致信東正教最高會議,信中寫道:「我最誠摯地請求革除我的教籍。我希望以下所摘引的本人所寫的《概率演算》一書中的言論足以成為除籍的理由,因為這些言論已經充分表明我對成為猶太教和基督教義之基礎的那些傳說所持的反對態度。」
馬爾科夫鏈
馬爾科夫鏈是一個隨機過程,同時馬爾科夫鏈的記憶類似於「金魚的記憶只有3秒」,非常的健忘。
1 - 2 - 3 - 4 - 5 - 6
比如說,你現在站在5對6進行預測,根據馬爾科夫鏈的知識,6的狀態只和5有關,而前面1到2, 2到3, 3到4,4到5的整個過程無關。
馬爾科夫鏈認為過去所有的信息都被保存在了現在的狀態下了。
馬爾科夫鏈被用的最多的例子就是天氣預測了:
天氣預測
比方說,今天下雨了(rainy),那麼明天的天氣會怎麼樣呢?
如上圖:
今天下雨,明天繼續下雨的可能性為0.8;
今天下雨,明天下雪的可能性為0.02;
今天下雨,明天晴天的可能性為0.18;
也就是說,我只要知道今天是下雨,我就能知道明天天氣的可能性,而不用去管前天是什麼天氣。
袋中取球問題
在學習概率論的時候,基本上會遇到「袋中取球」的問題。如上圖,袋中有2個綠球,2個紅球,3個藍球,我下一次取球是綠色的概率是多少,取完的球不放回袋中?
假設之前的取球結果是:綠,紅,藍,藍
那麼,我下一次取球的時候,袋中只有綠色球1個,紅色球1個,藍色球1個,我下一次取球的是綠色球的概率是1/3。這不僅和我最後一次取得球是藍色有關,也和我之前每一次取的球的顏色有關,所以這個過程不是一個馬爾科夫鏈過程。
如果是「袋中取球」,每一次取完球都放回袋中,那麼,你下一次取球是綠色的概率始終是2/7。這就建立了一個馬爾科夫隨機過程。[2]
馬爾科夫鏈也蘊含着哲學的思想:
現在的你是過去早就的,而未來的你與你的過去無關,只和你當下的努力和選擇有關,放下過去,不管多麼輝煌或者糟粕,背上行囊,什麼時候出發都來得及!
參考資料
- ↑ 簡談馬爾可夫模型在個性化推薦中的應用2018-06-27 來源:達觀數據網
- ↑ 馬爾科夫鏈(Markov Chain),機器學習和人工智能的基石2019-03-19 來源:專業開發者社區