Dirichletverdeling

Dirichletverdelingen met K = 3 {\displaystyle K=3} en verschillende vectoren van parameters α {\displaystyle \alpha } ; met de klok mee: α = ( 6 , 2 , 2 ) ,   α = ( 3 , 7 , 5 ) ,   α = ( 6 , 2 , 6 ) {\displaystyle \alpha =(6,2,2),\ \alpha =(3,7,5),\ \alpha =(6,2,6)} en α = ( 2 , 3 , 4 ) {\displaystyle \alpha =(2,3,4)} .

De dirichletverdelingen, genoemd naar Johann Dirichlet, vormen een familie van continue multivariate kansverdelingen die een generalisatie zijn van de bètaverdeling en de geconjugeerde a-prioriverdelingen van de multinomiale verdeling in de Bayesiaanse statistiek. Een dirichletverdeling is de verdeling van de kansen op een aantal disjuncte gebeurtenissen als deze gebeurtenissen een gegeven aantal keren zijn opgetreden.

Illustratie

De multinomiale verdeling geeft voor k {\displaystyle k} disjuncte gebeurtenissen de kans dat in n {\displaystyle n} experimenten deze gebeurtenissen een gegeven aantal keren x 1 , , x k {\displaystyle x_{1},\ldots ,x_{k}} voorkomen, als zij optreden met voorgeschreven kansen p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} , waarvoor p 1 + + p k = 1 {\displaystyle p_{1}+\ldots +p_{k}=1} . De dirichletverdeling geeft, omgekeerd, bij gevonden aantallen α 1 = x 1 , , α k = x k {\displaystyle \alpha _{1}=x_{1},\ldots ,\alpha _{k}=x_{k}} de verdeling van de kansen p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} .

In bijvoorbeeld 20 worpen met een eerlijke dobbelsteen geeft de multinomiale verdeling onder andere de kans dat de ogenaantallen 1 tot en met 6 respectievelijk 3, 6, 0, 5, 4 en 2 keer voorkomen. De dirichletverdeling van de orde 6 en met de genoemde aantallen als parameters, geeft dan aan hoe "waarschijnlijk" het bijvoorbeeld is dat de dobbelsteen zuiver is; preciezer, wat de kansdichtheid is voor mogelijke waarden van de parameters p 1 , , p 6 {\displaystyle p_{1},\ldots ,p_{6}} .

Kansdichtheid

De kansdichtheid van de dirichletverdeling van de orde k 2 {\displaystyle k\geq 2} met parameters α 1 , , α k > 0 {\displaystyle \alpha _{1},\ldots ,\alpha _{k}>0} wordt voor p 1 , , p k 0 {\displaystyle p_{1},\ldots ,p_{k}\geq 0} met p 1 + + p k = 1 {\displaystyle p_{1}+\ldots +p_{k}=1} gegeven door:

f ( p 1 , , p k ; α 1 , , α k ) = 1 B ( α 1 , , α k ) i = 1 k p i α i 1 {\displaystyle f(p_{1},\ldots ,p_{k};\alpha _{1},\ldots ,\alpha _{k})={\frac {1}{\mathrm {B} (\alpha _{1},\dots ,\alpha _{k})}}\prod _{i=1}^{k}p_{i}^{\alpha _{i}-1}}

De normeringsconstante is de multinomiale bètafunctie, die uitgedrukt kan worden in gammafuncties:

B ( α 1 , , α k ) = i = 1 k Γ ( α i ) Γ ( i = 1 k α i ) {\displaystyle \mathrm {B} (\alpha _{1},\ldots ,\alpha _{k})={\frac {\prod _{i=1}^{k}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum _{i=1}^{k}\alpha _{i}{\bigr )}}}}

Momenten

Laat X = ( X 1 , , X k ) {\displaystyle X=(X_{1},\ldots ,X_{k})} een dirichletverdeling van orde k {\displaystyle k} hebben met parameters α 1 , , α k {\displaystyle \alpha _{1},\ldots ,\alpha _{k}} . Noem

α 0 = i = 1 k α i {\displaystyle \alpha _{0}=\sum _{i=1}^{k}\alpha _{i}}

Dan zijn[1][2]

E ( X i ) = α i α 0 {\displaystyle \mathrm {E} (X_{i})={\frac {\alpha _{i}}{\alpha _{0}}}}

en

v a r ( X i ) = α i ( α 0 α i ) α 0 2 ( α 0 + 1 = 1 α 0 + 1 α i α 0 ( 1 α i α 0 ) {\displaystyle \mathrm {var} (X_{i})={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1}}={\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}\left(1-{\frac {\alpha _{i}}{\alpha _{0}}}\right)}

Verder is voor i j {\displaystyle i\neq j}

c o v ( X i , X j ) = α i α j α 0 2 ( α 0 + 1 ) = 1 α 0 + 1 α i α 0 α j α 0 {\displaystyle \mathrm {cov} (X_{i},X_{j})={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}=-{\frac {1}{\alpha _{0}+1}}{\frac {\alpha _{i}}{\alpha _{0}}}{\frac {\alpha _{j}}{\alpha _{0}}}}

De zo gedefinieerde covariantiematrix is singulier.

Externe links

  • Artikel in 'Encyclopedia of Mathematics "(Springer)
  • Multivariate verdelingen (script), pagina 9
Bronnen, noten en/of referenties
  1. Eq. (49.9) on page 488 of Kotz, Balakrishnan & Johnson (2000). Continuous Multivariate Distributions. Volume 1: Models and Applications. New York: Wiley.
  2. BalakrishV. B. (2005). A Primer on Statistical Distributions. John Wiley & Sons, Inc., Hoboken, NJ, ""Chapter 27. Dirichlet Distribution"", p. 274. ISBN 978-0-471-42798-8.
· · Sjabloon bewerken
Kansverdelingen
Discrete verdelingen:Bernoulli · binomiaal · geometrisch · hypergeometrisch · negatief-binomiaal · Poisson · uniform · zèta
Continue verdelingen:bèta · Cauchy · chi-kwadraat · Erlang · exponentieel · F-verdeling · gamma · Gumbel · hyperexponentieel · logistisch · lognormaal · normaal · Pareto · Rayleigh · student (t-) · uniform · Weibull
Meerdimensionale verdelingen:multinomiaal · multivariaat normaal