Hotellingsche T-Quadrat-Verteilung

Hotellingsche T-Quadrat-Verteilung
Dichtefunktion
Verteilungsfunktion
Parameter p – Dimension der Zufallsvariablen
m – verknüpft mit der Stichprobengröße
Träger x ( 0 , + ) {\displaystyle x\in (0,+\infty )\;} if p = 1 {\displaystyle p=1}
x [ 0 , + ) {\displaystyle x\in [0,+\infty )\;} otherwise.

Die Hotellingsche T-Quadrat-Verteilung[1] ist eine Wahrscheinlichkeitsverteilung, die 1931 von Harold Hotelling erstmals beschrieben wurde.[2] Sie ist eine Verallgemeinerung der Studentschen t-Verteilung.

Definition

Die quadratische Form

t 2 = n ( x μ ) W 1 ( x μ ) T ( p , n 1 ) {\displaystyle t^{2}=n({\mathbf {x} }-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\mathbf {x} }-{\mathbf {\mu } })\sim T(p,n-1)}

folgt einer Hotellingschen T-Quadrat-Verteilung mit

  • n {\displaystyle n} einer Anzahl von Punkten
  • x {\displaystyle {\mathbf {x} }} ist ein Spaltenvektor mit p {\displaystyle p} Elementen
  • W {\displaystyle {\mathbf {W} }} ist eine p × p {\displaystyle p\times p} -Kovarianzmatrix

Eigenschaften

Es sei x N p ( μ , V ) {\displaystyle x\sim N_{p}(\mu ,{\mathbf {V} })} eine Zufallsvariable mit einer multivariaten Normalverteilung und W W p ( m , V ) {\displaystyle {\mathbf {W} }\sim W_{p}(m,{\mathbf {V} })} (unabhängig von x {\displaystyle x} ) habe eine Wishart-Verteilung mit einer nicht-singulären Kovarianzmatrix V {\displaystyle \mathbf {V} } und mit m = n 1 {\displaystyle m=n-1} . Dann ist die Verteilung von t 2 {\displaystyle t^{2}} : T 2 ( p , m ) {\displaystyle T^{2}(p,m)} , Hotellingsche T-Quadrat-Verteilung mit Parametern p {\displaystyle p} und m {\displaystyle m} .

Für die F-Verteilung F {\displaystyle F} gilt:

m p + 1 p m T 2 F p , m p + 1 {\displaystyle {\frac {m-p+1}{pm}}T^{2}\sim F_{p,m-p+1}} .

Unter der Annahme, dass

x 1 , , x n {\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}}

p × 1 {\displaystyle p\times 1} -Spaltenvektoren mit reellen Zahlen sind.

x ¯ = ( x 1 + + x n ) / n {\displaystyle {\overline {\mathbf {x} }}=(\mathbf {x} _{1}+\cdots +\mathbf {x} _{n})/n}

sei der Mittelwert. Die positiv definite p × p {\displaystyle p\times p} -Matrix

W = i = 1 n ( x i x ¯ ) ( x i x ¯ ) / ( n 1 ) {\displaystyle {\mathbf {W} }=\sum _{i=1}^{n}(\mathbf {x} _{i}-{\overline {\mathbf {x} }})(\mathbf {x} _{i}-{\overline {\mathbf {x} }})'/(n-1)}

sei ihre Stichproben-Kovarianzmatrix. (Die Transponierte einer Matrix M {\displaystyle M} sei mit M {\displaystyle M'} bezeichnet). μ {\displaystyle \mu } sei ein p × 1 {\displaystyle p\times 1} -Spaltenvektor (bei Anwendung ein Schätzer des Mittelwertes). Dann ist die Hotellingsche T-Quadrat-Verteilung

t 2 = n ( x ¯ μ ) W 1 ( x ¯ μ ) . {\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } }).}

t 2 {\displaystyle t^{2}} hat eine enge Beziehung zum quadrierten Mahalanobis-Abstand.

Wenn x 1 , , x n N p ( μ , V ) {\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}\sim N_{p}(\mu ,{\mathbf {V} })} unabhängig sind und x ¯ {\displaystyle {\overline {\mathbf {x} }}} und W {\displaystyle {\mathbf {W} }} wie oben definiert sind, dann hat W {\displaystyle {\mathbf {W} }} eine Wishart-Verteilung mit n 1 {\displaystyle n-1} Freiheitsgraden, so dass[3]

W W p ( V , n 1 ) {\displaystyle \mathbf {W} \sim W_{p}(V,n-1)}

und ist unabhängig von x ¯ {\displaystyle {\overline {\mathbf {x} }}} und

x ¯ N p ( μ , V / n ) {\displaystyle {\overline {\mathbf {x} }}\sim {\mathcal {N}}_{p}(\mu ,V/n)} .

Daraus folgt

t 2 = n ( x ¯ μ ) W 1 ( x ¯ μ ) T 2 ( p , n 1 ) . {\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } })\sim T^{2}(p,n-1).}

Einzelnachweise

  1. Hotelling's T². Glossary of statistical terms. In: International Statistical Institute. 1. Juni 2011, abgerufen am 25. September 2020 (englisch). 
  2. H. Hotelling (1931). The generalization of Student’s ratio, Ann. Math. Statist., 2(3), S. 360–378, doi:10.1214/aoms/1177732979 JSTOR:2957535.
  3. K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press, ISBN 0-12-471250-9.
Diskrete univariate Verteilungen

Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | Dirac | diskret uniform | empirisch | hypergeometrisch | kategorial | negativ hypergeometrisch | Rademacher | verallgemeinert binomial | Zipf | Zipf-Mandelbrot | Zweipunkt

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta

Kontinuierliche univariate Verteilungen

Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | Trapez | U-quadratisch | stetig uniform | Wigner-Halbkreis

Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi | Chi-Quadrat | Coxian | Erlang | Exponential | Extremwert | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hartman-Watson | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Kolmogorow-Verteilung | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt

Multivariate Verteilungen

Diskrete multivariate Verteilungen:
Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch

Kontinuierliche multivariate Verteilungen:
Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart