Categorische verdeling

Categorische verdeling
Kansfunctie
Verdelingsfunctie
Parameters k Z + {\displaystyle k\in \mathbb {Z} ^{+}} aantal categorieën (natuurlijk getal)
p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} kans op uitkomst ( p i 0 , Σ p i = 1 ) {\displaystyle (p_{i}\geq 0,\,\Sigma p_{i}=1)}
Portaal  Portaalicoon   Wiskunde

In de kansrekening en de statistiek is een categorische verdeling, ook wel een gegeneraliseerde bernoulli-verdeling genoemd,[1] een discrete kansverdeling die de kansen beschrijft op elk van k {\displaystyle k} mogelijke uitkomsten, categorieën, die slechts van nominale schaal hoeven te zijn. De categorische verdeling is het speciale geval van de multinomiale verdeling voor één trekking.

Definitie

De categorische verdeling op de k {\displaystyle k} categorieën c 1 , , c k {\displaystyle c_{1},\ldots ,c_{k}} met parameters p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} wordt gegeven door de kansfunctie:

p ( c i ) = p i {\displaystyle p(c_{i})=p_{i}}

Er geldt dus p i > 0 {\displaystyle p_{i}>0} en p 1 + + p k = 1 {\displaystyle p_{1}+\ldots +p_{k}=1} .

De categorische verdeling is de verdeling van de overeenkomstige categorische variabele.

De mgelijke uitkomsten c 1 , , c k {\displaystyle c_{1},\ldots ,c_{k}} worden wel voorgesteld door de rijtjes van een 1 en k 1 {\displaystyle k-1} nullen, waarbij de uitkomst c i {\displaystyle c_{i}} wordt opgevat als het rijtje met de 1 op plaats i {\displaystyle i} .

Voorbeelden

De kansverdeling van een enkele worp met een mogelijk onzuivere dobbelsteen is een categorische verdeling met de ogenaantallen als de 6 categorieën en parameters p 1 , , p 6 {\displaystyle p_{1},\ldots ,p_{6}} . Voor een zuivere dobbelsteen geldt p 1 = = p 6 = 1 / 6 {\displaystyle p_{1}=\ldots =p_{6}=1/6} .

De verdeling van de bevolking over de Nederlandse provincies is een categorische verdeling met de twaalf provincies als de categorieën en als parameters de relatieve bevolkingsaantallen.

Bronnen, noten en/of referenties
  1. K. P. (2012). Machine learning: a probabilistic perspective, p. 35. MIT press. ISBN 0262018020