Mehrdimensionale Tschebyscheffsche Ungleichung

Die Mehrdimensionale Tschebyscheffsche Ungleichung ist eine Ungleichung aus dem Bereich der Stochastik. Sie ist eine Verallgemeinerung der Tschebyscheff-Ungleichung und nach dem Mathematiker Pafnuti Lwowitsch Tschebyschow benannt.

Eindimensionale Tschebyscheffsche Ungleichung

Hauptartikel: Tschebyscheffsche Ungleichung

Die (eindimensionale) Tschebyscheffsche Ungleichung besagt, dass für eine reelle Zufallsvariable X {\displaystyle X} mit dem Erwartungswert μ {\displaystyle \mu } und der Varianz σ 2 {\displaystyle \sigma ^{2}} die Wahrscheinlichkeit, dass X {\displaystyle X} einen Wert außerhalb des Intervalls ( μ k σ , μ + k σ ) {\displaystyle (\mu -k\sigma ,\mu +k\sigma )} annimmt, höchstens gleich 1 / k 2 {\displaystyle 1/k^{2}} ist, d. h.

1 P ( μ k σ X μ + k σ ) 1 k 2 für alle   k > 0 . {\displaystyle 1-P(\mu -k\sigma \leq X\leq \mu +k\sigma )\leq {\frac {1}{k^{2}}}\quad {\text{für alle}}\ k>0\;.}

Z. B. ergibt sich für k = 2 {\displaystyle k=2}

1 P ( μ 2 σ X μ + 2 σ ) 1 4 , {\displaystyle 1-P(\mu -2\sigma \leq X\leq \mu +2\sigma )\leq {\frac {1}{4}},}

d. h. außerhalb des 2 σ {\displaystyle 2\sigma } -Intervalls um dem Erwartungswert μ {\displaystyle \mu } liegt höchstens die Wahrscheinlichkeit 1/4. Bei einer Zufallsstichprobe sind höchstens 25 % der Werte von X {\displaystyle X} außerhalb des Intervalls zu erwarten.

Mehrdimensionale Verallgemeinerung

X {\displaystyle \mathbf {X} } sei ein d {\displaystyle d} -dimensionaler Zufallsvektor mit Erwartungswertvektor μ {\displaystyle {\boldsymbol {\mu }}} und invertierbarer Kovarianzmatrix Σ {\displaystyle {\boldsymbol {\Sigma }}} . Dann hat die reelle Zufallsvariable Y = ( X μ ) T Σ 1 ( X μ ) {\displaystyle Y=(\mathbf {X} -{\boldsymbol {\mu }})^{T}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -{\boldsymbol {\mu }})} den Erwartungswert d {\displaystyle d} [1] und mit der Markow-Ungleichung folgt

1 P ( Y < k 2 ) = P ( Y k 2 ) d k 2 für alle  k > 0 {\displaystyle 1-P(Y<k^{2})=P(Y\geq k^{2})\leq {\frac {d}{k^{2}}}\quad {\text{für alle }}k>0} .

Damit gilt für den Zufallsvektor X {\displaystyle \mathbf {X} } die Ungleichung

P ( ( X μ ) T Σ 1 ( X μ ) k 2 ) d k 2 für alle  k > 0 {\displaystyle P((\mathbf {X} -{\boldsymbol {\mu }})^{T}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -{\boldsymbol {\mu }})\geq k^{2})\leq {\frac {d}{k^{2}}}\quad {\text{für alle }}k>0} .

Diese Ungleichung ergibt sich als Spezialfall einer Ungleichung für quadratische Formen von Zufallsvariablen.[2][3] Die Ungleichung wurde bereits 1962 von Samuel Stanley Wilks angegeben.[4]

Die Menge

{ x R d ( x μ ) Σ 1 ( x μ ) k 2 } {\displaystyle \{\mathbf {x} \in \mathbb {R} ^{d}\mid (\mathbf {x} -{\boldsymbol {\mu }})'{\boldsymbol {\Sigma }}^{-1}(\mathbf {x} -{\boldsymbol {\mu }})\leq k^{2}\}}

ist ein Ellipsoid mit Mittelpunktvektor μ {\displaystyle {\boldsymbol {\mu }}} . Die mehrdimensionale Tschebyscheffsche Ungleichung besagt somit für d = 2 {\displaystyle d=2} , dass außerhalb einer Konzentrationsellipse mit k = 2 {\displaystyle k=2} höchstens 50 % der Stichproben-Tupel liegen. Das ist (wie im Eindimensionalen) eine grobe Abschätzung.

Beachte, dass die quadratische Form x Σ 1 x = k 2 {\displaystyle \mathbf {x} '{\boldsymbol {\Sigma }}^{-1}\mathbf {x} =k^{2}} den Rand der Streuregion einer zentrierten d {\displaystyle d} -dimensionalen Normalverteilung N d ( 0 , Σ ) {\displaystyle {\mathcal {N}}_{d}(\mathbf {0} ,{\boldsymbol {\Sigma }})} mit invertierbarer Kovarianzmatrix Σ {\displaystyle {\boldsymbol {\Sigma }}} beschreibt. Siehe auch Streuregionen der mehrdimensionalen Normalverteilung und Quadratische Formen von Zufallsvariablen.

Literatur

  • Tilo Arens, Frank Hettlich, Christian Karpfinger, Ulrich Kockelkorn, Klaus Lichtenegger, Hellmuth Stachel: Mathematik. 5. Auflage. Springer Spektrum, Berlin 2023, ISBN 978-3-662-64388-4, S. 1391, doi:10.1007/978-3-662-64389-1. 
  • D. R. Jensen: Joint Distributions of Quadratic Forms. In: SIAM Journal on Applied Mathematics. Band 42, Nr. 2, 1982, S. 297–301, Theorem 1, S. 297, JSTOR:2101213. 
  • A. M. Mathai, Serge B. Provost: Quadratic Forms in Random Variables – Theory and Applications (= Statistics: Textbooks and Monographs. Band 126). Dekker, New York / Basel / Hong Kong 1992, ISBN 0-8247-8691-2, Theorem 4.8.1, S. 188. 

Einzelnachweise

  1. Siehe dazu Erwartungswert einer quadratischen Form von Zufallsvariablen.
  2. A. M. Mathai, Serge B. Provost: Quadratic Forms in Random Variables – Theory and Applications (= Statistics: Textbooks and Monographs. Band 126). Dekker, New York / Basel /Hong Kong 1992, ISBN 0-8247-8691-2, Theorem 4.8.1, S. 188. 
  3. D. R. Jensen: Joint Distributions of Quadratic Forms. In: SIAM Journal on Applied Mathematics. Band 42, Nr. 2, 1982, S. 297–301, Theorem 1, S. 297, JSTOR:2101213. 
  4. S. S. Wilks: Mathematical Statistics. Wiley, New York 1962, S. 92 (referenziert nach D. R. Jensen: Joint Distributions of Quadratic Forms, S. 298).