Convergència de variables aleatòries

En teoria de la probabilitat, l'estudi de la convergència de variables aleatòries és fonamental, tant per la seva riquesa matemàtica (lleis dels grans nombres, teorema del límit central, llei del logaritme iterat, etc.) com per les seves aplicacions a l'Estadística. En aquest article s'estudien les convergències més habituals: en distribució o llei, en probabilitat, quasi segura i en mitjana d'ordre p {\displaystyle p} . La referència general d'aquesta pàgina és Serfling[1] on es troben les demostracions o les referències corresponents, i nombrosos exemples i contraexemples.

Convergència en distribució o llei

Introducció

Des d'un punt de vista aplicat, la convergència en distribució és important perquè permet aproximar una probabilitat del tipus P ( Y B ) {\displaystyle P(Y\in B)} , relativa a una variable aleatòria Y {\displaystyle Y} , per P ( X B ) {\displaystyle P(X\in B)} , més senzilla de calcular, on X {\displaystyle X} és una altra variable aleatòria X {\displaystyle X} . El cas més important és el teorema central del límit, on les probabilitats relatives a una suma de variables aleatòries independents amb variància finita es poden calcular aproximadament mitjançant una variable normal. Veurem un exemple d'una altra aproximació clàssica, on la distribució de Poisson s'utilitza per aproximar una distribució binomial.

Exemple. Llencem dos daus 100 cops. Volem calcular la probabilitat d'obtenir 3 o menys vegades un doble 6 (si voleu, vegeu la pàgina variable aleatòria per la modelització i el càlcul de les probabilitats relacionades amb el llançament de dos daus). La probabilitat d'obtenir un doble 6 és 1/36 ≈0'028. Designem per Y {\displaystyle Y} la variable aleatòria que compta el nombre de vegades que obtenim un doble 6 en llançar 100 cops dos daus, que té una distribució binomial de paràmetres n = 100 {\displaystyle n=100} i p = 0 028 {\displaystyle p=0'028} : Y B ( 100 , 0 028 ) {\displaystyle Y\sim B(100,0'028)} . Volem calcular P ( Y 3 ) {\displaystyle P(Y\leq 3)}  :

P ( Y 3 ) = j = 0 3 ( 100 j ) 0 028 j 0 972 100 j 0 6926. ( ) {\displaystyle P(Y\leq 3)=\sum _{j=0}^{3}{\binom {100}{j}}0'028^{j}\,0'972^{100-j}\approx 0'6926.\quad (*)}
D'altra banda, després veurem que una distribució binomial B ( n , p ) {\displaystyle B(n,p)} amb n {\displaystyle n} gran, p {\displaystyle p} petita, i n p {\displaystyle np} petita respecte a n {\displaystyle n} , es pot aproximar raonablement bé per una distribució de Poisson de paràmetre λ = n p {\displaystyle \lambda =np}  ; en el nostre cas, tenim que λ = 100 0 028 = 2 8. {\displaystyle \lambda =100\cdot 0'028=2'8.} Sigui X {\displaystyle X} una variable de Poisson de paràmetre λ = 2 8 {\displaystyle \lambda =2'8} , és a dir, X P o i s s ( 2 8 ) {\displaystyle X\sim Poiss(2'8)} . Aleshores,
P ( Y 3 ) P ( X 3 ) = j = 0 3 e 2 8 2 8 j j ! = e 2 8 j = 0 2 2 8 j j ! = 0 6919. ( ) {\displaystyle P(Y\leq 3)\approx P(X\leq 3)=\sum _{j=0}^{3}e^{-2'8}\,{\frac {2'8^{j}}{j!}}=e^{-2'8}\,\sum _{j=0}^{2}{\frac {2'8^{j}}{j!}}=0'6919.\qquad (**)}
Com veiem, (*) i (**) són és molt semblants. Però l'expressió de (**) és molt més senzilla de calcular que la de (*).

Nota. La probabilitat (**) també pot calcular-se de manera molt ràpida utilitzant la relació entre la distribució de Poisson i la distribució χ 2 {\displaystyle \chi ^{2}}  :

P ( X 3 ) = P ( χ 2 ( 3 + 1 ) 2 > 2 2 8 ) = P ( χ 8 2 > 5 6 ) = 0 6919 , {\displaystyle P(X\leq 3)=P(\chi _{2(3+1)}^{2}>2\cdot 2'8)=P(\chi _{8}^{2}>5'6)=0'6919,}
on χ 8 2 {\displaystyle \chi _{8}^{2}} és una variable χ 2 {\displaystyle \chi ^{2}} amb 9 graus de llibertat.

Primera definició

Considerem una successió de variables aleatòries X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } i sigui X {\displaystyle X} una altra variable aleatòria, amb funcions de distribució F 1 , F 2 , {\displaystyle F_{1},F_{2},\dots } i F {\displaystyle F} respectivament. Es diu que la successió convergeix en distribució (o llei) a X {\displaystyle X} si

lim n F n ( t ) = F ( t ) , en tot punt   t   on   F   és contínua . ( 1 ) {\displaystyle \lim _{n\to \infty }F_{n}(t)=F(t),\quad {\text{en tot punt}}\ t\ {\text{on}}\ F\ {\text{és contínua}}.\qquad (1)}
S'escriu
lim n X n = X ,   en distribució (o en llei) . {\displaystyle \lim _{n\to \infty }X_{n}=X,\ {\text{en distribució (o en llei)}}.}
També s'utilitza la notació
X n n D X o X n D X ,   o expressions similars. {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{\mathcal {D}}} X\quad {\text{o}}\quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X,\ {\text{o expressions similars.}}}

Comentaris

1. Atès que la propietat (1) només depèn de les funcions de distribució, els espais de probabilitat on estan definides les variables no tenen cap paper; de fet, ni cal que les variables estiguin definides en el mateix espai de probabilitat. A vegades, si la distribució del límit és d'un tipus conegut, per exemple, si és una llei normal de mitjana μ {\displaystyle \mu } i variància σ 2 {\displaystyle \sigma ^{2}} s'escriu

X n D N ( μ , σ 2 ) . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\mathcal {N}}(\mu ,\sigma ^{2}).}
Això fa que algunes propietats de la convergència en llei semblin antiintuïtives; per exemple, com comentarem més endavant, el límit no és únic, només ho és la seva distribució.

Funció de distribució d'una variable aleatòria constant igual a 0. És una funció que val 0 quan x està entre menys infinit i 0, llavors té un salt en el 0 d'alçada 1, i llavors val sempre 1.r
Figura 1. Funció de distribució d'una variable aleatòria constant igual a 0
Figura 2. Funció de distribució d'una variable aleatòria constant igual a 1/n

2. Malgrat el comentari anterior, per simplificar l'exposició, suposarem que totes les variables estan definides al mateix espai ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} . La propietat (1) equival a que per tot punt t {\displaystyle t} on F {\displaystyle F} sigui contínua,

lim n P ( X n t ) = P ( X t ) , {\displaystyle \lim _{n\to \infty }P(X_{n}\leq t)=P(X\leq t),}
o, escrit d'una altra manera,
lim n P ( X n ( , t ] ) = P ( X ( , t ] ) . {\displaystyle \lim _{n\to \infty }P{\big (}X_{n}\in (-\infty ,t]{\big )}=P{\big (}X\in (-\infty ,t]{\big )}.}
L'objectiu de la convergència en llei és donar condicions per poder aproximar les probabilitats relatives a X n {\displaystyle X_{n}} , del tipus P ( X n B ) {\displaystyle P(X_{n}\in B)} , per probabilitats P ( X B ) {\displaystyle P(X\in B)} , les quals se suposa que són més fàcils de calcular. Però demanar que lim n P ( X n B ) = P ( X B ) {\displaystyle \lim _{n}P(X_{n}\in B)=P(X\in B)} per tot conjunt borelià B {\displaystyle B} és massa exigent, com es veu en el següent exemple. Sigui X n = 1 / n {\displaystyle X_{n}=1/n} (variable degenerada en 1/n) i X = 0 {\displaystyle X=0} (variable degenerada en 0) ; sembla molt clar que X n {\displaystyle X_{n}} hauria de convergir a X {\displaystyle X} , però si considerem el conjunt B = { 0 } {\displaystyle B=\{0\}} , tenim que
per tot   n 1 , P ( X n B ) = 0 ,   però   P ( X B ) = 1. {\displaystyle {\text{per tot}}\ n\geq 1,P(X_{n}\in B)=0,\ {\text{però}}\ P(X\in B)=1.}
En canvi, aquesta successió sí que compleix la propietat (1). En efecte, la funció de distribució de F {\displaystyle F} és
F ( t ) = { 0 , si   t < 0 , 1 , si   t 0. {\displaystyle F(t)={\begin{cases}0,&{\text{si}}\ t<0,\\1,&{\text{si}}\ t\geq 0.\end{cases}}}
i, per tant, F {\displaystyle F} no és contínua en t = 0 {\displaystyle t=0} Vegeu la Figura 1. D'altra banda,
F n ( t ) = { 0 , si   t < 1 n , 1 , si   t 1 n . {\displaystyle F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<{\frac {1}{n}},\\1,&{\text{si}}\ t\geq {\frac {1}{n}}.\end{cases}}}
Vegeu la Figura 2. Per t 0 {\displaystyle t\neq 0} tenim que lim n F n ( t ) = F ( t ) {\displaystyle \lim _{n}F_{n}(t)=F(t)} . Per tant, X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} .

Exemple

Funció de distribució d'una variable uniforme en el conjunt {1/5,2/5,3/5,4/5, 1}. Es tracta d'una funció esglaonada, amb salts d'alçada 0,2 en els punts 0'2,0'4,0,6,0'8,1,
Figura 3. Funció de distribució d'una variable uniforme en el conjunt {1/5,2/5,3/5,4/5, 1}

Sigui X n {\displaystyle X_{n}} una variable aleatòria uniforme discreta en el conjunt { 1 n , 2 n , , n 1 n , 1 } {\displaystyle \{{\tfrac {1}{n}},{\tfrac {2}{n}},\dots ,{\tfrac {n-1}{n}},1\}} i X {\displaystyle X} una variable aleatòria uniforme contínua a l'interval [0,1]. Aleshores X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} . En efecte, la funció de distribució de X n {\displaystyle X_{n}} és (vegeu la Figura 3):

F n ( t ) = { 0 , si   t < 1 n , 1 n , si   t [ 1 n , 2 n ) , 2 n , si   t [ 2 n , 3 n ) ,   n 1 n , si   t [ n 1 n , 1 ) , 1 , si   t 1. {\displaystyle F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<{\frac {1}{n}},\\[8pt]{\frac {1}{n}},&{\text{si}}\ t\in [{\frac {1}{n}},{\frac {2}{n}}),\\[8pt]{\frac {2}{n}},&{\text{si}}\ t\in [{\frac {2}{n}},{\frac {3}{n}}),\\[8pt]\ \vdots &\\{\frac {n-1}{n}},&{\text{si}}\ t\in [{\frac {n-1}{n}},1),\\[8pt]1,&{\text{si}}\ t\geq 1.\end{cases}}}
Equivalentment, aquesta funció es pot escriure com
F n ( t ) = { 0 , si   t < 0 , [ n t ] n , si   t [ 0 , 1 ] , 1 , si   t > 1 , {\displaystyle F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<0,\\[8pt]{\frac {[nt]}{n}},&{\text{si}}\ t\in [0,1],\\[8pt]1,&{\text{si}}\ t>1,\end{cases}}}
on [ a ] {\displaystyle [a]} és la part entera del nombre a {\displaystyle a} . D'altra banda, la funció de distribució de X n {\displaystyle X_{n}} és (vegeu la Figura 4):

Funció de distribució d'una variable uniforme en el conjunt [0,1]: es tracta d'una funció que val 0 quan la variable és menor que 0, el mateix valor que la variable entre 0 i 1, i constant igual a 1 quan la variable és més gran que 1.
Figura 4. Funció de distribució d'una variable uniforme en el conjunt [0,1]

F ( t ) = { 0 , si   t < 0 , t , si   t [ 0 , 1 ] , 1 , si   t > 1 , {\displaystyle F(t)={\begin{cases}0,&{\text{si}}\ t<0,\\[8pt]t,&{\text{si}}\ t\in [0,1],\\[8pt]1,&{\text{si}}\ t>1,\end{cases}}}
Atès que F {\displaystyle F} és contínua a tot arreu, hem de veure la convergència lim n F n ( t ) = F ( t ) {\displaystyle \lim _{n}F_{n}(t)=F(t)} per tot t R {\displaystyle t\in \mathbb {R} } , la qual cosa es dedueix del fet que lim n [ n t ] n = t {\displaystyle \lim _{n\to \infty }{\frac {[nt]}{n}}=t} .

Una definició alternativa

De la següent propietat s'obté una definició alternativa:

X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} si i només si per qualsevol funció f : R R {\displaystyle f:\mathbb {R} \longrightarrow \mathbb {R} } afitada i contínua

lim n E [ f ( X n ) ] = E [ f ( X ) ] . ( 2 ) {\displaystyle \lim _{n\to \infty }E[f(X_{n})]=E[f(X)].\qquad (2)}
Les convergències (1) i (2) semblen molt diferents. Per veure la seva relació, notem que
F n ( t ) = P ( X t ) = E [ 1 ( , t ] ( X n ) ] = E [ f ( X n ) ] , {\displaystyle F_{n}(t)=P(X\leq t)=E{\big [}{\boldsymbol {1}}_{(-\infty ,t]}(X_{n}){\big ]}=E[f(X_{n})],}
on f ( x ) = 1 ( , t ] ( x ) , {\displaystyle f(x)={\boldsymbol {1}}_{(-\infty ,t]}(x),} és la funció indicatriu del conjunt ( , t ] {\displaystyle (-\infty ,t]} ; recordem que per un conjunt qualsevol A {\displaystyle A} ,
1 A ( x ) = { 1 , si   x A , 0 , si   x A . {\displaystyle {\boldsymbol {1}}_{A}(x)={\begin{cases}1,&{\text{si}}\ x\in A,\\[5pt]0,&{\text{si}}\ x\not \in A.\end{cases}}}
Però el pas de (1) a (2) no és directe ja la funció f ( x ) = 1 ( , t ] ( x ) {\displaystyle f(x)={\boldsymbol {1}}_{(-\infty ,t]}(x)} no és contínua, i llavors cal fer una aproximació a f {\displaystyle f} per funcions contínues.

Alguns autors prefereixen utilitzar la condició (2) per definir la convergència en distribució perquè es pot estendre directament a variables aleatòries definides en espais més generals.

Aproximació de Riemann a la integral per n=5. El gràfic consisteix en una funció contínua, juntament amb els rectangles corresponents que aproximen l'àrea a sota de la corba.
Figura 5. Aproximació de Riemann a la integral (n=5).

Continuació de l'exemple de les variables uniformes. Sigui f : R R {\displaystyle f:\mathbb {R} \longrightarrow \mathbb {R} } contínua i afitada. Llavors

E [ f ( X n ) ] = i = 1 n 1 n f ( i n ) , {\displaystyle E[f(X_{n})]=\sum _{i=1}^{n}{\frac {1}{n}}f{\Big (}{\frac {i}{n}}{\Big )},}
que convergeix a 0 1 f ( x ) d x = E [ f ( X ) ] {\displaystyle \int _{0}^{1}f(x)\,dx=E[f(X)]} , ja que el sumatori anterior és una suma de Riemann que aproxima a la integral. Vegeu la Figura 5.

Propietats de la convergència en distribució

1. Unicitat del límit.

X n D X X n D Y } X i Y   tenen la mateixa distribució. {\displaystyle \left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\\\\X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} Y\\\end{array}}\right\}\Longrightarrow X\quad {\text{i}}\quad Y\ {\text{tenen la mateixa distribució.}}}
2. Convergència en distribució de variables que només prenen valors naturals. [2] Si les variables X n {\displaystyle X_{n}} i X {\displaystyle X} només prenen valors naturals, aleshores X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} si i només si
lim n P ( X n = k ) = P ( X = k ) , k N . {\displaystyle \lim _{n\to \infty }P(X_{n}=k)=P(X=k),\quad \forall k\in \mathbb {N} .}

3. La convergència de les funcions de densitat implica la convergència en distribució. Suposem que totes les variables involucrades tenen funció de densitat, i designem per f n {\displaystyle f_{n}} la densitat de X n {\displaystyle X_{n}} i per f {\displaystyle f} la densitat de X {\displaystyle X} . Si per a tot x R , {\displaystyle x\in \mathbb {R} ,} lim n f n ( x ) = f ( x ) , {\displaystyle \lim _{n}f_{n}(x)=f(x),} llavors X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} .

Aquest resultat és conseqüència de l'anomenat lema de Scheffé:[3] Siguin f n {\displaystyle f_{n}} i f {\displaystyle f} funcions de densitat. Si per a tot x R , {\displaystyle x\in \mathbb {R} ,} lim n f n ( x ) = f ( x ) , {\displaystyle \lim _{n}f_{n}(x)=f(x),} llavors

lim n | f n ( x ) f ( x ) | d x = 0. {\displaystyle \lim _{n\to \infty }\int _{-\infty }^{\infty }\vert f_{n}(x)-f(x)\vert \,dx=0.}


4. Composició amb una funció contínua.

X n D X g : R R contínua } g ( X n ) D g ( X ) . {\displaystyle \left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} g(X).}

5. Operacions amb successions convergents en distribució.

A. Si X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} , llavors:
(a) X n + a D X + a . {\displaystyle X_{n}+a\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X+a.}
(b) a X n D a X . {\displaystyle a\,X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} a\,X.}
B. Teorema de Slutsky. Si X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} i Y n D b {\displaystyle Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} b} , on b R {\displaystyle b\in \mathbb {R} } és una constant, aleshores,
(a) X n + Y n D X + b . {\displaystyle X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X+b.}
(b) X n Y n D b X . {\displaystyle X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} b\,X.}
(c) X n / Y n D X / b {\displaystyle X_{n}/Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X/b} , si b 0 {\displaystyle b\neq 0} .

6. Vegeu més avall, a l'apartat de la convergència q.s., el teorema de representació de Skorohod.

Convergència en distribució i funcions característiques

Les funcions característiques són una eina essencial per la convergència en llei. Els següents resultats són essencialment deguts al genial Paul Lévy.

Teorema. Designem per φ n {\displaystyle \varphi _{n}} i φ {\displaystyle \varphi } les funcions característiques de X n {\displaystyle X_{n}} i X {\displaystyle X} respectivament.

X n D X lim n φ ( t ) = φ ( t ) ,   per a tot   t R . ( 3 ) {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\quad \Longleftrightarrow \quad \lim _{n\to \infty }\varphi (t)=\varphi (t),\ {\text{per a tot}}\ t\in \mathbb {R} .\qquad (3)}
De fet, es té una propietat encara més forta:

Teorema.[4] Considerem una successió de variables aleatòries X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } Designem per φ n {\displaystyle \varphi _{n}} la funció característica de X n {\displaystyle X_{n}} . Suposem que

lim n φ ( t ) = γ ( t ) ,   per a tot   t R , {\displaystyle \lim _{n\to \infty }\varphi (t)=\gamma (t),\ {\text{per a tot}}\ t\in \mathbb {R} ,}
on γ {\displaystyle \gamma } és una funció contínua en el 0. Aleshores γ {\displaystyle \gamma } és una funció característica i existeix una variable aleatòria X {\displaystyle X} amb funció característica γ {\displaystyle \gamma } i X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} .

Aquest últim teorema és important perquè estableix que no necessitem conèixer per endavant el límit de la successió. D'altra banda, proporciona un mètode per construir funcions característiques o reconèixer que determinada funció és una funció característica, la qual cosa no sempre és fàcil.

Exemple. Aproximació de la distribució binomial per una distribució de Poisson. Sigui X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } una successió de variables aleatòries tals que X n {\displaystyle X_{n}} té una distribució binomial de paràmetre p n {\displaystyle p_{n}} ,

amb lim n n p n = λ > 0. {\displaystyle \lim _{n}n\,p_{n}=\lambda >0.} Aleshores X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} on X {\displaystyle X} té una distribució de Poisson de paràmetre λ {\displaystyle \lambda } .

La prova consisteix senzillament en utilitzar que la funció característica d'una binomial B ( n , p n ) {\displaystyle B(n,p_{n})} és

φ n ( t ) = ( p n e i t + 1 p n ) n = ( p n ( e i t 1 ) + 1 ) n , {\displaystyle \varphi _{n}(t)={\big (}p_{n}e^{it}+1-p_{n}{\big )}^{n}={\big (}p_{n}(e^{it}-1)+1{\big )}^{n},}
i calcular el límit tipus número e: és a dir, utilitzant que si z 1 , z 2 , {\displaystyle z_{1},z_{2},\dots } són nombres complexos tals que lim n z n = z 0 {\displaystyle \lim _{n}z_{n}=z\neq 0} , aleshores lim n ( 1 + z n / n ) n = e z {\displaystyle \lim _{n\to \infty }(1+z_{n}/n)^{n}=e^{z}} . Llavors tenim
lim n φ n ( t ) = lim n ( p n ( e i t 1 ) + 1 ) n = lim n ( n p n ( e i t 1 ) n + 1 ) n = e λ ( e i t 1 ) , {\displaystyle \lim _{n}\varphi _{n}(t)=\lim _{n}{\big (}p_{n}(e^{it}-1)+1)^{n}=\lim _{n}{\Big (}{\frac {np_{n}(e^{it}-1)}{n}}+1{\Big )}^{n}=e^{\lambda (e^{it}-1)},}
que és, precisament, la funció característica d'una distribució de Poisson de paràmetre λ {\displaystyle \lambda }


Molt sovint per construir l'aproximació es pren p n = λ / n {\displaystyle p_{n}=\lambda /n} , on λ > 0 {\displaystyle \lambda >0} . O, més general, es parteix d'una successió λ 1 , λ 2 {\displaystyle \lambda _{1},\lambda _{2}\dots } tal que 0 < λ n n {\displaystyle 0<\lambda _{n}\leq n} lim n λ n = λ {\displaystyle \lim _{n}\lambda _{n}=\lambda } i es pren p n = λ n / n {\displaystyle p_{n}=\lambda _{n}/n} .

Tal com hem comentat a l'exemple introductori, aquesta propietat també es formula dient una distribució binomial B ( n , p ) {\displaystyle B(n,p)} amb n {\displaystyle n} gran, p {\displaystyle p} petita, i n p {\displaystyle np} petita respecte a n {\displaystyle n} , es pot aproximar per una distribució de Poisson de paràmetre λ = n p {\displaystyle \lambda =np} .

Aquesta propietat és la formulació en termes de convergència en distribució de l'aproximació deguda a Poisson (1873).[5]

Cas multidimensional

La convergència en llei de vectors aleatoris de dimensió k {\displaystyle k} es formula exactament igual com el cas de les variables aleatòries, ja sigui amb la definició (1) utilitzant funcions de distribució multidimensionals, o amb la (2) amb funcions f : R k R {\displaystyle f:\mathbb {R} ^{k}\longrightarrow \mathbb {R} } afitades i contínues. L'equivalència amb la convergència de les corresponents funcions característiques també és certa. A la pràctica, però, el que més s'utilitza és el següent resultat degut a Cramer i Wold i que s'anomena <<Cramer-Wold device>>,[6] que permet reduir el cas multidimensional a l'unidimensional.

Teorema. Sigui X 1 , X 2 , {\displaystyle {\boldsymbol {X}}_{1},{\boldsymbol {X}}_{2},\dots } una successió de vectors aleatoris k {\displaystyle k} dimensionals i sigui X {\displaystyle {\boldsymbol {X}}} un altre vector aleatori de dimensió k {\displaystyle k} . Aleshores

X n D X {\displaystyle {\boldsymbol {X}}_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\boldsymbol {X}}}
si i només si tota combinació lineal de les components de X n {\displaystyle {\boldsymbol {X}}_{n}} convergeix en distribució a la mateixa combinació lineal de les components de X {\displaystyle {\boldsymbol {X}}} .

Convergència en probabilitat

Sigui X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } una successió de variables aleatòries i X {\displaystyle X} una altra variable aleatòria definides en un espai de probabilitat ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} . Es diu que la successió convergeix en probabilitat a X {\displaystyle X} si per qualsevol ε > 0 {\displaystyle \varepsilon >0} ,

lim n P ( | X n X | ε ) = 0. ( 4 ) {\displaystyle \lim _{n\to \infty }P(\vert X_{n}-X\vert \geq \varepsilon )=0.\qquad (4)}
En aquest cas, s'escriu,
lim n X n = X , en probabilitat , {\displaystyle \lim _{n\to \infty }X_{n}=X,\quad {\text{en probabilitat}},}
o
X n P X . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X.}
Observacions.

  1. La condició (4) és equivalent a lim n P ( | X n X | < ε ) = 1 {\displaystyle \lim _{n\to \infty }P(\vert X_{n}-X\vert <\varepsilon )=1} . Tant en aquesta condició com a (4) es poden canviar les desigualtats per desigualtats estrictes, ja que la condició ha de ser veritat per a qualsevol ε > 0 {\displaystyle \varepsilon >0} .
  2. En paraules, aquesta convergència diu que la probabilitat que les variables X n {\displaystyle X_{n}} i X {\displaystyle X} siguin gaire diferents (diferència més gran que ε {\displaystyle \varepsilon } ) es tant petita com es vulgui quan n {\displaystyle n\to \infty } .

Exemple. Suposem que les variables X n {\displaystyle X_{n}} venen donades per

X n = { 0 , amb probabilitat   1 1 n , n , amb probabilitat   1 n . {\displaystyle X_{n}={\begin{cases}0,&{\text{amb probabilitat}}\ 1-{\frac {1}{n}},\\n,&{\text{amb probabilitat}}\ {\frac {1}{n}}.\end{cases}}}
Vegem que X n P 0 {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} 0} : en efecte, donat qualsevol ε > 0 {\displaystyle \varepsilon >0} , si n > ε {\displaystyle n>\varepsilon } ,
P ( | X n 0 | ε ) = P ( X n = n ) = 1 n n 0. {\displaystyle P(\vert X_{n}-0\vert \geq \varepsilon )=P(X_{n}=n)={\frac {1}{n}}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }} 0.}

Propietats de la convergència en probabilitat

1. Unicitat de límit. El límit d'una successió convergent en probabilitat és únic (q.s.):

X n P X X n P Y } X = Y ,   q.s. {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\end{array}}\right\}\quad \Longrightarrow \quad X=Y,\ {\text{q.s.}}}
2. Propietat de Cauchy. Si X n P X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X} aleshores la successió és de Cauchy en probabilitat, és a dir, per a qualsevol ε > 0 {\displaystyle \varepsilon >0} ,
lim n , m P { | X n X m | ε } = 0. {\displaystyle \lim _{n,m\to \infty }P\{\vert X_{n}-X_{m}\vert \geq \varepsilon \}=0.}
Recíprocament, si una successió és de Cauchy en probabilitat, aleshores convergeix en probabilitat.


3. Composició amb una funció contínua.

X n P X g : R R contínua } g ( X n ) P g ( X ) . {\displaystyle \left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits ^{P}} g(X).}
4. Operacions amb successions convergents en probabilitat.
X n P X Y n P Y h : R 2 R contínua } h ( X n , Y n ) P h ( X , Y ) . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\\h:\mathbb {R} ^{2}\longrightarrow \mathbb {R} \quad {\text{contínua}}\end{array}}\right\}\quad \Longrightarrow \quad h(X_{n},Y_{n})\mathrel {\mathop {\longrightarrow } \limits ^{P}} h(X,Y).}
El mateix és cert per a k {\displaystyle k} successions i h : R k R {\displaystyle h:\mathbb {R} ^{k}\longrightarrow \mathbb {R} } contínua.


D'aquí es dedueix:

X n P X Y n P Y } X n + Y n P X + Y i X n Y n P X Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X+Y\quad {\text{i}}\quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\,Y.}



5. Relacions amb la convergència en llei

(a) X n P X X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} .
(b) X n n D a X n n P a {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{\mathcal {D}}} a\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} a} , on a {\displaystyle a} és una constant.

La propietat (a) també es formula dient que la convergència en probabilitat és més forta que la convergència en distribució, o que la convergència en distribució és més feble que la convergència en probabiliat.

6. Teorema de convergència dominada (vegeu a l'apartat de convergència en mitjana una altra versió d'aquest teorema). Suposem que X n n P X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X} i sigui Y {\displaystyle Y} una variable aleatòria positiva amb E [ Y ] < {\displaystyle E[Y]<\infty } tal que per a tot n {\displaystyle n} tenim | X n | Y {\displaystyle \vert X_{n}\vert \leq Y} (es diu que la successió està dominada per Y {\displaystyle Y} ). Aleshores totes les variables X n {\displaystyle X_{n}} i X {\displaystyle X} tenen esperança finita i

lim n E [ X n ] = E [ X ] . {\displaystyle \lim _{n\to \infty }E[X_{n}]=E[X].}

Metrització de la convergència en probabilitat

Recordem que es diu que dues variables aleatòries X {\displaystyle X} i Y {\displaystyle Y} són iguals quasi segurament (o amb probabilitat 1) si existeix un esdeveniment N A {\displaystyle N\in {\mathcal {A}}} de probabilitat zero, P ( N ) = 0 {\displaystyle P(N)=0} , tal que per a qualsevol ω N c {\displaystyle \omega \in N^{c}}

X ( ω ) = Y ( ω ) . {\displaystyle X(\omega )=Y(\omega ).}
S'escriu
X = Y , q.s. {\displaystyle X=Y,\quad {\text{q.s.}}}
Designem per L 0 {\displaystyle {\mathcal {L}}^{0}} el conjunt de totes les variables aleatòries, que és un espai vectorial. Definim la relació
X Y X = Y ,   q.s. {\displaystyle X\sim Y\quad \Longleftrightarrow \quad X=Y,\ {\text{q.s.}}}
Es demostra que és una relació d'equivalència i designem el conjunt quocient per L 0 {\displaystyle L^{0}} . En general s'utilitza la mateixa notació per a una variable aleatòria i per a la seva classe d'equivalència, i tàcitament es tracten les classes d'equivalència com si fossin variables aleatòries; això es pot fer perquè moltes propietats només depenen de la classe d'equivalència: per exemple, si un element d'una classe té esperança finita, aleshores tots els elements de la classe tenen esperança finita, i l'esperança és la mateixa per a tots. A L 0 {\displaystyle L^{0}} definim
d Pr ( X , Y ) = E [ | X Y | 1 + | X Y | ] . {\displaystyle d_{\text{Pr}}(X,Y)=E{\Big [}{\frac {\vert X-Y\vert }{1+\vert X-Y\vert }}{\Big ]}.}
Es comprova que és una distància:

  1. d Pr ( X , Y ) = d Pr ( Y , X ) . {\displaystyle d_{\text{Pr}}(X,Y)=d_{\text{Pr}}(Y,X).}
  2. d Pr ( X , Y ) 0 i d Pr ( X , Y ) = 0 X = Y . {\displaystyle d_{\text{Pr}}(X,Y)\geq 0\quad {\text{i}}\quad d_{\text{Pr}}(X,Y)=0\quad \Longleftrightarrow \quad X=Y.}
  3. d Pr ( X , Y ) d Pr ( X , Z ) + d Pr ( Z , Y ) . {\displaystyle d_{\text{Pr}}(X,Y)\leq d_{\text{Pr}}(X,Z)+d_{\text{Pr}}(Z,Y).}

Finalment, es demostra que

X n n P X lim n d P r ( X n , X ) = 0. {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X\quad \Longleftrightarrow \quad \lim _{n}d_{Pr}(X_{n},X)=0.}
Es diu que la convergència en probabilitat és metritzable. Aquesta és una propietat important, ja que les convergències en espais mètrics tenen moltes propietats que es poden aplicar directament a la convergència en probabiitat. Atès que hem vist que les successions de Cauchy en probabilitat són convergents en probabilitat, tenim que L 0 {\displaystyle L^{0}} amb la distància d P r {\displaystyle d_{Pr}} és un espai mètric complet.

Cas multidimensional

Sigui X 1 , X 2 , {\displaystyle {\boldsymbol {X}}_{1},{\boldsymbol {X}}_{2},\dots } una successió de vectors aleatoris k {\displaystyle k} dimensionals i sigui X {\displaystyle {\boldsymbol {X}}} un altre vector aleatori de dimensió k {\displaystyle k} . Es diu que la successió convegeix en probabilitat a X {\displaystyle {\boldsymbol {X}}} si per qualsevol ε > 0 {\displaystyle \varepsilon >0} ,

lim n P ( X n X ε ) = 0 , {\displaystyle \lim _{n\to \infty }P(\Vert {\boldsymbol {X}}_{n}-{\boldsymbol {X}}\Vert \geq \varepsilon )=0,}
on {\displaystyle \Vert \cdot \Vert } és la norma habitual de R k {\displaystyle \mathbb {R} ^{k}}  : si z = ( z 1 , . z k ) R k {\displaystyle z=(z_{1},\dots .z_{k})\in \mathbb {R} ^{k}} , z = ( i = 1 k z i ) 1 / 2 {\displaystyle \Vert {\boldsymbol {z}}\Vert =(\sum _{i=1}^{k}z_{i})^{1/2}} .

Tenim la següent propietat: siguin X 1 = ( X 1 ( 1 ) , , X 1 ( k ) ) {\displaystyle {\boldsymbol {X}}_{1}=(X_{1}^{(1)},\dots ,X_{1}^{(k)})} , X 2 = ( X 2 ( 1 ) , , X 2 ( k ) ) {\displaystyle {\boldsymbol {X}}_{2}=(X_{2}^{(1)},\dots ,X_{2}^{(k)})} ,..., i X = ( X ( 1 ) , , X ( k ) ) {\displaystyle {\boldsymbol {X}}=(X^{(1)},\dots ,X^{(k)})} . Aleshores

X n P X X n ( i ) P X ( i ) ,   i = 1 , , k . {\displaystyle {\boldsymbol {X}}_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} {\boldsymbol {X}}\quad \Longleftrightarrow \quad X_{n}^{(i)}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X^{(i)},\ i=1,\dots ,k.}

Convergència quasi segura

Sigui X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } una successió de variables aleatòries i X {\displaystyle X} una altra variable aleatòria definides en un espai de probabilitat ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} . Es diu que la successió convergeix quasi segurament a X {\displaystyle X} si sexisteix un esdeveniment N A {\displaystyle N\in {\mathcal {A}}} de probabilitat zero, P ( N ) = 0 {\displaystyle P(N)=0} , tal que per a qualsevol ω N c {\displaystyle \omega \in N^{c}} ,

lim n X n ( ω ) = X ( ω ) . {\displaystyle \lim _{n\to \infty }X_{n}(\omega )=X(\omega ).}
S'escriu
lim n X n = X ,   q.s. o X n q . s . X . {\displaystyle \lim _{n\to \infty }X_{n}=X,\ {\text{q.s.}}\quad {\text{o}}\quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X.}
Malgrat l'aparent simplicitat de la definició, en general és difícil provar la convergència q.s., ja que normalment es coneixen les probabilitats associades amb les variables, però no el seu valor per a cada ω {\displaystyle \omega } . El següent criteri és de molta utilitat. Noteu que el criteri diu que si una successió convergeix en probabilitat de manera ràpida aleshores hi ha convergència q.s.

Criteri de convergència q.s.

Si per qualsevol ε > 0 {\displaystyle \varepsilon >0} tenim

n P { | X n X | > ε } < , {\displaystyle \sum _{n}P\{\vert X_{n}-X\vert >\varepsilon \}<\infty ,}
aleshores
X n q . s . X . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X.}

Exemple 1. (Aquest exemple és trivial però ens ajudarà a veure la dificultat que comentavem abans.) Sigui Y {\displaystyle Y} una variable aleatòria i definim

X n = 1 n Y . {\displaystyle X_{n}={\frac {1}{n}}\,Y.}
Aleshores és evident que
X n q . s . 0. {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} 0.}
Exemple 2. Sigui Y 1 , Y 2 , , {\displaystyle Y_{1},\,Y_{2},\dots ,} una successió de variables aleatòries independents, totes amb la mateixa distribució (i.i.d.), amb esperança finita. Definim
X n = 1 n Y n . {\displaystyle X_{n}={\frac {1}{n}}\,Y_{n}.}
Anem a veure que
X n q . s . 0. {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} 0.}
Aquest cas, però, és completament diferent que l'exemple 1, ja que ara el valor de Y n ( ω ) {\displaystyle Y_{n}(\omega )} pot canviar amb n {\displaystyle n} . Malgrat que la convergència a 0 sembla força intuitiva, la demostració ja no és directa i utilitzarem el criteri de convergència q.s. Per qualsevol ε > 0 {\displaystyle \varepsilon >0} tenim
P { | X n 0 | ε } = P { | X n | ε } = P { | Y n | ε n } = P { | Y 1 ε | n } , {\displaystyle P\{\vert X_{n}-0\vert \geq \varepsilon \}=P\{\vert X_{n}\vert \geq \varepsilon \}=P\{\vert Y_{n}\vert \geq \varepsilon n\}=P{\Big \{}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }\geq n{\Big \}},}
ja que totes les variables Y n {\displaystyle Y_{n}} tenen la mateixa distribució. Llavors,
n = 1 P { | Y 1 ε | n } E [ | Y 1 ε | ] = 1 ε E [ | Y 1 | ] < , {\displaystyle \sum _{n=1}^{\infty }P{\Big \{}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }\geq n{\Big \}}\leq E{\Big [}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }{\Big ]}={\frac {1}{\varepsilon }}E[\vert Y_{1}\vert ]<\infty ,}
on hem utilitzat que per una varible aleatòria positiva Z {\displaystyle Z} (vegeu),[7]
n = 1 P { Z n } E [ Z ] . {\displaystyle \sum _{n=1}^{\infty }P\{Z\geq n\}\leq E[Z].}

Propietats de la convergència q.s.

1. Unicitat del límit. Evidentment, el límit d'una successió convergent q.s. és únic q.s.

2. Operacions amb successions que convergeixen q.s. La convergència q.s. hereta moltes de les propietats de les successions de nombres reals. Per exemple,

X n n q . s . X Y n n q . s . Y } X n + Y n n q . s . X + Y i X n Y n n q . s . X Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X+Y\quad {\text{i}}\quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\,Y.}


3. Composició amb funcions contínues. També tenim

X n n q . s . X g : R R contínua } g ( X n ) n q . s . g ( X ) . {\displaystyle \left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} g(X).}

4. Relacions entre la convergència q.s. i la convergència en probabilitat.

(a) La convergència q.s. iimplica la convergència en probabilitat:

X n n q . s . X X n n P X . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X.}

Es diu que la convergència q.s. és més forta que la convergència en probabilitat, o que la convergència en probabilitat és més feble que la convergència q.s. Com a conseqüència de les propetats de la convergència en probabilitat, es té que la convergència q.s. també és més forta que la convergència en distribució.

(b) Si X n P X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X} , aleshores existeix una successió parcial X n 1 , X n 2 , , {\displaystyle X_{n_{1}},X_{n_{2}},\dots ,} tal que X n j q . s . X {\displaystyle X_{n_{j}}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X}

5. Teorema de convergència dominada (vegeu a l'apartat de convergència en mitjana una altra versió d'aquest teorema). El teorema de convergència dominada també és veritat si tenim convergència q.s. Suposem que X n n q . s X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s}} X} i sigui Y {\displaystyle Y} una variable aleatòria positiva amb E [ Y ] < {\displaystyle E[Y]<\infty } tal que per a tot n {\displaystyle n} tenim | X n | Y {\displaystyle \vert X_{n}\vert \leq Y} . Aleshores totes les variables X n {\displaystyle X_{n}} i X {\displaystyle X} tenen esperança finita i

lim n E [ X n ] = E [ X ] . {\displaystyle \lim _{n\to \infty }E[X_{n}]=E[X].}
6. Teorema de representació de Skorohod. Suposem que X n D X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X} . Aleshores existeix un espai de probabilitat ( Ω , A , P ) {\displaystyle (\Omega ',{\mathcal {A}}',P')} , una succesó de variables aleatòries X 1 , X 2 , {\displaystyle X_{1}',X_{2}',\dots } i una variable aleatòria X {\displaystyle X'} , definides en aquest espai, tals que:

  1. Per a n 1 {\displaystyle n\geq 1} , X n {\displaystyle X_{n}} i tenen X n {\displaystyle X_{n}'} la mateixa distribució.
  2. X {\displaystyle X} i X {\displaystyle X'} tenen la mateixa distribució.
  3. X n q . s . X {\displaystyle X_{n}'\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X'}

Convergència en mitjana d'ordre p

Considerem un nombre real p > 0 {\displaystyle p>0} i sigui X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } una successió de variables aleatòries i X {\displaystyle X} una altra variable aleatòria definides en un espai de probabilitat ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} , totes les variables amb moment d'ordre p {\displaystyle p} , és a dir, E [ | X n | p ] < {\displaystyle E[\vert X_{n}\vert ^{p}]<\infty } i E [ | X | p ] < {\displaystyle E[\vert X\vert ^{p}]<\infty } . Direm que la successió convergeix a X {\displaystyle X} en mitjana d'ordre p {\displaystyle p} o en L p {\displaystyle L^{p}} si

lim n E [ | X n X | p ] = 0. {\displaystyle \lim _{n\to \infty }E{\big [}\vert X_{n}-X\vert ^{p}{\big ]}=0.}
En aquest cas s'escriu
lim n X n = X ,   en mitjana d'ordre   p   o   en   L p , {\displaystyle \lim _{n\to \infty }X_{n}=X,\ {\text{en mitjana d'ordre}}\ p\ {\text{o}}\ {\text{en}}\ L^{p},}
o bé
X n m p X o X n L p X . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{m_{p}}} X\quad {\text{o}}\quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X.}
Quan p = 1 {\displaystyle p=1} s'anomena convegència en mitjana i p = 2 {\displaystyle p=2} convergència en mitjana quadràtica.

Propietats de la convergència en mitjana d'ordre p {\displaystyle {\boldsymbol {p}}}

1. Unicitat del límit. El límit d'una successió convergent en mitjana d'ordre p {\displaystyle p} és únic q.s.

2. Si 0 < r < s {\displaystyle 0<r<s} , i X n L s X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{s}}} X} , llavors X n L r X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{r}}} X} .

3. Convergència dels moments. Si X n L p X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X} , llavors

lim n E [ X n p ] = E [ X p ] i lim n E [ | X n | p ] = E [ | X | p ] . {\displaystyle \lim _{n\to \infty }E[X_{n}^{p}]=E[X^{p}]\quad {\text{i}}\quad \lim _{n\to \infty }E[\vert X_{n}\vert ^{p}]=E[\vert X\vert ^{p}].}
En particular, aplicant les propietats 2 i 3, si p = 2 {\displaystyle p=2} , tenim que
lim n Var ( X n ) = Var ( X ) . {\displaystyle \lim _{n\to \infty }{\text{Var}}(X_{n})={\text{Var}}(X).}

4. Operacions amb successions.

(a)
X n L p X Y n L p Y } X n + Y n L p X + Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X+Y.}
(b)
X n L 2 X Y n L 2 Y } X n Y n L 1 X Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{2}}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{2}}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{1}}} X\,Y.}
(c) Més generalment,[8] si p > 1 {\displaystyle p>1} i 1 / p + 1 / q = 1 {\displaystyle 1/p+1/q=1} , aleshores
X n L p X Y n L q Y } X n Y n L 1 X Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{q}}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{1}}} X\,Y.}

(d) Si les variables X n , n 1 {\displaystyle X_{n},n\geq 1} i X {\displaystyle X} són independents de les variables Y n , n 1 {\displaystyle Y_{n},n\geq 1} i Y {\displaystyle Y} , aleshores

X n L 1 X Y n L 1 Y } X n Y n L 1 X Y . {\displaystyle \left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{1}}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{1}}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{1}}} X\,Y.}
5. Propietat de Cauchy. Si X n L p X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X} , aleshores la successió X 1 , X 2 , {\displaystyle X_{1},X_{2},\dots } és de Cauchy en mitjana d'ordre p {\displaystyle p} :
lim n , m E [ | X n X m | p ] = 0. {\displaystyle \lim _{n,m\to \infty }E{\big [}\vert X_{n}-X_{m}\vert ^{p}{\big ]}=0.}
Recíprocament, tota successió de Cauchy en mitjana d'ordre p {\displaystyle p} convergeix en mitjana d'ordre p {\displaystyle p} .


6. La convergència en mitjana d'ordre p {\displaystyle p} implica la convergència en probabilitat:

X n n L p X X n n P X . {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{L^{p}}} X\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X.}
7. Teorema de convergència dominada. Suposem que X n q . s . X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X} o X n P X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X} i sigui Y {\displaystyle Y} una variable aleatòria positiva amb E [ Y p ] < {\displaystyle E[Y^{p}]<\infty } tal que per a tot n {\displaystyle n} tenim | X n | Y {\displaystyle \vert X_{n}\vert \leq Y} , aleshores X n L p X {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{L^{p}}} X} .

Espais L p {\displaystyle {\boldsymbol {L^{p}}}}

Els espais L p {\displaystyle L^{p}} corresponents a un espai de probabilitat són un cas particular dels espais L p {\displaystyle L^{p}} associats a un espai de mesura general, i aquí ens limitarem a comentar les propietats relacionades amb la convergència de variables aleatòries. Designarem per L p {\displaystyle {\mathcal {L}}^{p}} el conjunt de les variables aleatòries amb moment d'ordre p {\displaystyle p} . Es tracta d'un espai vectorial. A l'igual com hem fet en l'apartat de la convergència en probabilitat, considerem la relació d'equivalència

X Y X = Y ,   q.s. {\displaystyle X\sim Y\quad \Longleftrightarrow \quad X=Y,\ {\text{q.s.}}}
i designem per L p {\displaystyle L^{p}} el conjunt quocient.

Quan 0 < p < 1 {\displaystyle 0<p<1} , definim
d p ( X , Y ) = E [ | X Y | p ] , {\displaystyle d_{p}(X,Y)=E{\big [}\vert X-Y\vert ^{p}],}
que és una distància a L p {\displaystyle L^{p}} .


Quan p 1 , {\displaystyle p\geq 1,} tenim que
X p = ( E [ X p ] ) 1 / p {\displaystyle \Vert X\Vert _{p}={\big (}E[X^{p}]{\big )}^{1/p}}
és una norma en L p {\displaystyle L^{p}} i

defineix una distància en aquest espai:

d p ( X , Y ) = X Y p . {\displaystyle d_{p}(X,Y)=\Vert X-Y\Vert _{p}.}
En ambdós casos tenim que
X n n L p X lim n d p ( X n , X ) = 0. {\displaystyle X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{L^{p}}} X\quad \Longleftrightarrow \quad \lim _{n}d_{p}(X_{n},X)=0.}
La propietat de Cauchy que hem esmentant abans implica que els espais mètrics L p {\displaystyle L^{p}} són complets. A més, quan p 1 , {\displaystyle p\geq 1,} L p {\displaystyle L^{p}} és un espai de Banach.


El cas p = 2 {\displaystyle p=2} mereix atenció especial, ja que es pot definir un producte escalar:
< X , Y >= E [ X Y ] . {\displaystyle <X,Y>=E[X\,Y].}
Aleshores L 2 {\displaystyle L^{2}} és un espai de Hilbert.

Quadre de les implicacions entre els diversos tipus de convergència

Resum de les relacions entre els diversos tipus de convergències de variables aleatòries
Resum de les relacions entre els diversos tipus de convergències de variables aleatòries

Referències

  1. Serfling, Robert J.. Approximation theorems of mathematical statistics. Nova York: Wiley, 1980. ISBN 0-471-02403-1. 
  2. Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, ©1994-, p. 374. ISBN 0-412-05221-0. 
  3. Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 17. ISBN 0-471-21927-4. 
  4. Billingsley, Patrick.. Probability and measure. 2a edició. Nova York: Wiley, 1986, p. 360. ISBN 0-471-80478-9. 
  5. Johnson, N. L., Kotz, S, Kemp, A. W.. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 151. ISBN 0-471-54897-9. 
  6. Billingsley, Patrick.. Convergence of probability measures.. New York,: Wiley, [1968], p. 48. ISBN 0-471-07242-7. 
  7. Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 45. ISBN 978-0-08-052298-2. 
  8. Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 74. ISBN 978-0-08-052298-2.