隨機變數檢視原始碼討論檢視歷史
給定樣本空間(S , \mathbb{F}),如果其上的實值函數 X:S \to \mathbb{R}是\mathbb{F} (實值)可測函數[1] ,則稱X為(實值)隨機變量。初等概率論中通常不涉及到可測性的概念,而直接把任何X:S \to \mathbb{R}的函數稱為隨機變量。
如果X指定給概率空間S中每一個事件e有一個實數X(e),同時針對每一個實數r都有一個事件集合A_r與其相對應,其中A_r= { e : X(e) ≤ r},那麼X被稱作隨機變量。隨機變量一般用大寫拉丁字母或小寫希臘字母(比如X, Y, Z, \xi, \eta)來表示,從上面的定義注意到,隨機變量實質上是函數。稱其為變量是指可作為因變量。
例如,隨機擲兩個骰子,整個事件空間可以由36個元素組成:
- S = \lbrace ( i, j ) | i=1, \ldots, 6,; j=1, \ldots,6 \rbrace
這裡可以構成多個隨機變量,比如隨機變量X(獲得的兩個骰子的點數和)或者隨機變量Y(獲得的兩個骰子的點數差),隨機變量X可以有11個整數值,而隨機變量Y只有6個。
- X ( i, j ) := i+j , x=2,3,\ldots,12
- Y ( i, j ) := \mid i-j \mid , y=0,1,2,3,4,5.
又比如,在一次扔硬幣事件中,如果把獲得的背面的次數作為隨機變量X,則X可以取兩個值,分別是0和1。
如果隨機變量X的取值是有限的或者是可數無窮盡的值
- X = \lbrace x_1, x_2, x_3, \ldots, \rbrace,
則稱X為離散隨機變量。 如果X由全部實數或者由一部分區間組成,
- X = \lbrace x | a\le x \le b \rbrace, - \infty < a < b < \infty
則稱X為連續隨機變量。
特性
不確定性
隨機變量在不同的條件下由於偶然因素影響,其可能取各種隨機變量不同的值,具有不確定性和隨機性,但這些取值落在某個範圍的概率是一定的,此種變量稱為隨機變量。隨機變量可以是離散型的,也可以是連續型的。如分析測試中的測定值就是一個以概率取值的隨機變量,被測定量的取值可能在某一範圍內隨機變化,具體取什麼值在測定之前是無法確定的,但測定的結果是確定的,多次重複測定所得到的測定值具有統計規律性。隨機變量與模糊變量的不確定性的本質差別在於,後者的測定結果仍具有不確定性,即模糊性。
基本類型
簡單地說,隨機變量是指隨機事件的數量表現。某地若干名男性健康成人中,每人血紅蛋白量的測定值;等等。另有一些現象並不直接表現為數量,例如人口的男女性別、試驗結果的陽性或陰性等,但我們可以規定男性為1,女性為0,則非數量標誌也可以用數量來表示。這些例子中所提到的量,儘管它們的具體內容是各式各樣的,但從數學觀點來看,它們表現了同一種情況,這就是每個變量都可以隨機地取得不同的數值,而在進行試驗或測量之前,我們要預言這個變量將取得某個確定的數值是不可能的。 按照隨機變量可能取得的值,可以把它們分為兩種基本類型:
離散型隨機變量
即在一定區間內變量取值為有限個,或數值可以一一列舉出來。例如某地區某年人口的出生數、死亡數,某藥治療某病病人的有效數、無效數等
連續型隨機變量
即在一定區間內變量取值有無限個,或數值無法一一列舉出來。例如某地區男性健康成人的身長值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值等。
詳細分析
表示方法
隨機試驗結果的量的表示。例如擲一顆骰子出現的點數,電話交換台在一定時間內收到的呼叫次數,隨機抽查的一個人的身高,懸浮在液體中的微粒沿某一方向的位移,等等,都是隨機變量的實例。 一個隨機試驗的可能結果(稱為基本事件)的全體組成一個基本空間Ω(見概率)。隨機變量x是定義於Ω上的函數,即對每一基本事件ω∈Ω,有一數值x(ω)與之對應。以擲一顆骰子的隨機試驗為例,它的所有可能結果見,共6個,分別記作ω1,ω2,ω3,ω4,ω5,ω6,這時,Ω={ω1,ω2,ω3,ω4,ω5,ω6},而出現的點數這個隨機變量x,就是Ω上的函數x(ωk)=k,k=1,2,…,6。又如設Ω={ω1,ω2,…,ωn}是要進行抽查的n個人的全體,那麼隨意抽查其中一人的身高和體重,就構成兩個隨機變量x和Y,它們分別是Ω上的函數:x(ωk)=「ωk的身高」,Y(ωk)=「ωk的體重」,k=1,2,…,n。一般說來,一個隨機變量所取的值可以是離散的(如擲一顆骰子的點數隻取1到6的整數,電話台收到的呼叫次數隻取非負整數),也可以充滿一個數值區間,或整個實數軸(如液體中懸浮的微粒沿某一方向的位移)。
研究方法
在研究隨機變量的性質時,確定和計算它取某個數值或落入某個數值區間內的概率是特別重要的。因此,隨機變量取某個數值或落入某個數值區間這樣的基本事件的集合,應當屬於所考慮的事件域。根據這樣的直觀想法,利用概率論公理化的語言,取實數值的隨機變量的數學定義可確切地表述如下:概率空間(Ω,F,p)上的隨機變量x是定義於Ω上的實值可測函數,即對任意ω∈Ω,x(ω)為實數,且對任意實數x,使x(ω)≤x的一切ω組成的Ω的子集{ω:x(ω)≤x}是事件,也即是F中的元素。事件{ω:x(ω)≤x}常簡記作{x≤x},並稱函數F(x)=p(x≤x),-∞<x<∞ ,為x的分布函數。 設x,Y是概率空間(Ω,F,p)上的兩個隨機變量,如果除去一個零概率事件外,x(ω)與Y(ω)相同,則稱x=Y以概率1成立,也記作p(X=Y)=1或X=Y,α.s.(α.s.意即幾乎必然)。
有些隨機現象需要同時用多個隨機變量來描述。例如對地面目標射擊,彈着點的位置需要兩個坐標才能確定,因此研究它要同時考慮兩個隨機變量,一般稱同一概率空間(Ω,F,p)上的n個隨機變量構成的n維向量X=(x1,x2,…,xn)為n維隨機向量。隨機變量可以看作一維隨機向量。稱n元x1,x2,…,xn的函數為X的(聯合)分布函數。又如果(x1,x2)為二維隨機向量,則稱x1+ix2(i2=-1)為復隨機變量。 隨機變量的獨立性 獨立性是概率論所獨有的一個重要概念。設x1,x2,…,xn是n個隨機變量,如果對任何n個實數x1,x2,…,xn都有 即它們的聯合分布函數F(x1,x2,…,xn)等於它們各自的分布函數F1(x1),F2(x2),…,Fn(xn)的乘積。則稱x1,x2,…,xn是獨立的。這一定義可以直接推廣到每一xk(k=1,2,…,n)是隨機向量的情形。獨立性的直觀意義是:x1,x2,…,xn中的任何一個取值的概率規律,並不隨其中的其他隨機變量取什麼值而改變。在實際問題中通常用它來表徵多個獨立操作的隨機試驗結果或多種有獨立來源的隨機因素的概率特性,因此它對於概率統計的應用是十分重要的。
從隨機變量(或向量)x1,x2,…,xn的獨立性還可以推出:設Bk是xk取值的空間中的任意波萊爾集,k=1,2,…,n。設x1,x2,…,xn是獨立的,則它們中的任意個都是獨立的。但逆之即使其中任何n-1個是獨立的,也不保證x1,x2,…,xn是獨立的。又如果ƒj(x),i=1,2,…,n,是n個連續函數或初等函數(或更一般的波萊爾可測函數),則從x1,x2,…,xn的獨立性可推出ƒ1(x1),ƒ2(x2),…,ƒn(xn)也獨立。如果隨機變量(隨機向量)序列x1,x2,…,xn,…中任何有限個都獨立,則稱之為獨立隨機變量(隨機向量)序列。 關於隨機變量的矩、特徵函數、母函數及半不變量,分別見數學期望、方差、矩及概率分布。
隨機變量的函數
一個新的隨機變量能被博雷爾 (Borel) 可測函數定義 g\colon \mathbb{R} \rightarrow \mathbb{R} 來產生一個隨機變量X. Y的累積分布函數是:
- F_Y(y) = \operatorname{P}(g(X) \le y).
- F_Y(y) = \operatorname{P}(g(X) \le y) =
begin{cases} \operatorname{P}(X \le g^{-1}(y)) = F_X(g^{-1}(y)), & \text{if } g^{-1} \text{ increasing} ,\\ \\ \operatorname{P}(X \ge g^{-1}(y)) = 1 - F_X(g^{-1}(y)), & \text{if } g^{-1} \text{ decreasing} . \end{cases} 得到它的概率密度函數:
- f_Y(y) = f_X(g^{-1}(y)) \left| \frac{d g^{-1}(y)}{d y} \right|.
例子
定義X為實數,在連續性隨機變量里,讓 Y = X2
- F_Y(y) = operatorname{P}(X^2 \le y).
如果y < 0,那麼 P(X2 ≤ y) = 0
- F_Y(y) = 0\qquad\hbox{if}\quad y < 0.
如果y ≥ 0
- operatorname{P}(X^2 \le y) = \operatorname{P}(|X| \le \sqrt{y})
可以得到:
- F_Y(y) = F_X(\sqrt{y}) - F_X(-\sqrt{y})\qquad\hbox{if}\quad y \ge 0.