Categorische verdeling

Kansfunctie

Verdelingsfunctie

Parameters

k\in \mathbb {Z} ^{+}

aantal categorieën (natuurlijk getal)

p_{1},\ldots ,p_{k}

kans op uitkomst

(p_{i}\geq 0,\,\Sigma p_{i}=1)

Portaal

Wiskunde

In de kansrekening en de statistiek is een categorische verdeling, ook wel een gegeneraliseerde bernoulli-verdeling genoemd,^[1] een discrete kansverdeling die de kansen beschrijft op elk van $k$ mogelijke uitkomsten, categorieën, die slechts van nominale schaal hoeven te zijn. De categorische verdeling is het speciale geval van de multinomiale verdeling voor één trekking.

Definitie

De categorische verdeling op de $k$ categorieën $c_{1},\ldots ,c_{k}$ met parameters $p_{1},\ldots ,p_{k}$ wordt gegeven door de kansfunctie:

p(c_{i})=p_{i}

Er geldt dus $p_{i}>0$ en $p_{1}+\ldots +p_{k}=1$ .

De categorische verdeling is de verdeling van de overeenkomstige categorische variabele.

De mgelijke uitkomsten $c_{1},\ldots ,c_{k}$ worden wel voorgesteld door de rijtjes van een 1 en $k-1$ nullen, waarbij de uitkomst $c_{i}$ wordt opgevat als het rijtje met de 1 op plaats $i$ .

Voorbeelden

De kansverdeling van een enkele worp met een mogelijk onzuivere dobbelsteen is een categorische verdeling met de ogenaantallen als de 6 categorieën en parameters $p_{1},\ldots ,p_{6}$ . Voor een zuivere dobbelsteen geldt $p_{1}=\ldots =p_{6}=1/6$ .

De verdeling van de bevolking over de Nederlandse provincies is een categorische verdeling met de twaalf provincies als de categorieën en als parameters de relatieve bevolkingsaantallen.

Bronnen, noten en/of referenties