Formhypothesen

Als Formhypothesen bezeichnet man in der mathematischen Statistik eine Erweiterung des Standardformalismus bei Konfidenzbereichen. Dabei wird durch die Formhypothesen vorgegeben, welche Werte im Konfidenzbereich enthalten sein sollen und welche nicht. Dies ermögliche die Formulierung von Optimalitätsbegriffen für Konfidenzbereich wie beispielsweise gleichmäßig beste Konfidenzbereiche. Über das duale Konzept der zugehörigen Testhypothesen lässt sich dann eine Beziehung von Konfidenzbereichen und Tests herstellen, mit der sich Konfidenzintervalle aus Test konstruieren lassen und umgekehrt.

Formhypothesen

Gegeben sei ein statistisches Modell ( X , A , ( P ϑ ) ϑ Θ ) {\displaystyle (X,{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })} , wobei Θ {\displaystyle \Theta } die Indexmenge der Wahrscheinlichkeitsmaße ist. Des Weiteren sei eine zu schätzende Funktion

g : Θ Γ {\displaystyle g\colon \Theta \to \Gamma }

gegeben, die im parametrischen Fall meist als Parameterfunktion bezeichnet wird und in den Entscheidungsraum Γ {\displaystyle \Gamma } abbildet.

Als Formhypothesen zu g {\displaystyle g} wird dann eine Familie ( H ~ ϑ , K ~ ϑ ) ϑ Θ {\displaystyle ({\tilde {H}}_{\vartheta },{\tilde {K}}_{\vartheta })_{\vartheta \in \Theta }} bezeichnet, so dass H ~ ϑ Γ {\displaystyle {\tilde {H}}_{\vartheta }\subset \Gamma } und K ~ ϑ Γ {\displaystyle {\tilde {K}}_{\vartheta }\subset \Gamma } ist sowie

H ~ ϑ K ~ ϑ = {\displaystyle {\tilde {H}}_{\vartheta }\cap {\tilde {K}}_{\vartheta }=\emptyset } für alle ϑ Θ {\displaystyle \vartheta \in \Theta }

Anschaulich enthält H ~ ϑ {\displaystyle {\tilde {H}}_{\vartheta }} alle „korrekten“ Werte, welche von dem Konfidenzbereich möglichst überdeckt werden sollen. Analog enthält K ~ ϑ {\displaystyle {\tilde {K}}_{\vartheta }} alle „inkorrekten“ Werte, die möglichst nicht im Konfidenzbereich enthalten sein sollen.

Beispiel

Gegeben sei ein einfaches statistisches Modell ( R , B ( R ) , ( P ϑ ) ϑ R ) {\displaystyle (\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ),(P_{\vartheta })_{\vartheta \in \mathbb {R} })} , wobei P ϑ = N ( ϑ , 1 ) {\displaystyle P_{\vartheta }={\mathcal {N}}(\vartheta ,1)} die Normalverteilung mit Varianz eins ist. Geschätzt werden soll der Mittelwert, also ist

g ( ϑ ) = ϑ {\displaystyle g(\vartheta )=\vartheta } .

Somit sind die Indexmenge und der Entscheidungsraum beide gleich, es ist Θ = Γ = R {\displaystyle \Theta =\Gamma =\mathbb {R} } .

Mögliche Formhypothesen wären

H ~ ϑ = [ ϑ 2 ; ϑ + 2 ] {\displaystyle {\tilde {H}}_{\vartheta }=[\vartheta -2;\vartheta +2]} sowie K ~ ϑ = R H ~ ϑ {\displaystyle {\tilde {K}}_{\vartheta }=\mathbb {R} \setminus {\tilde {H}}_{\vartheta }} für alle ϑ R {\displaystyle \vartheta \in \mathbb {R} } .

Diese sagen aus, dass der Bereich, welcher symmetrisch um den Mittelwert liegt möglichst überdeckt werden soll, wohingegen alles außerhalb möglichst nicht überdeckt werden soll. Zu beachten ist, dass in der Definition nicht gefordert wird, dass H ~ ϑ K ~ ϑ = Γ {\displaystyle {\tilde {H}}_{\vartheta }\cup {\tilde {K}}_{\vartheta }=\Gamma } , die Hypothesen also für jedes ϑ {\displaystyle \vartheta } den Entscheidungsraum disjunkt zerlegen. So wäre in diesem Beispiel durchaus möglich, K ~ ϑ = ( ϑ + 2 , + ) {\displaystyle {\tilde {K}}_{\vartheta }=(\vartheta +2,+\infty )} oder K ~ ϑ = {\displaystyle {\tilde {K}}_{\vartheta }=\emptyset } zu wählen.

Konfidenzbereiche zu Formhypothesen

Definition

Ist ein Konfidenzbereich

C : X P ( Γ ) {\displaystyle C\colon X\to {\mathcal {P}}(\Gamma )}

gegeben sowie Formhypothesen ( H ~ ϑ , K ~ ϑ ) ϑ Θ {\displaystyle ({\tilde {H}}_{\vartheta },{\tilde {K}}_{\vartheta })_{\vartheta \in \Theta }} , so heißt C {\displaystyle C} ein Konfidenzbereich für g {\displaystyle g} zum Konfidenzniveau 1 α {\displaystyle 1-\alpha } , wenn für alle ϑ Θ {\displaystyle \vartheta \in \Theta } gilt:

P ϑ ( { γ C } ) 1 α {\displaystyle P_{\vartheta }(\{\gamma \in C\})\geq 1-\alpha } für alle γ H ~ ϑ {\displaystyle \gamma \in {\tilde {H}}_{\vartheta }} .

Beispiel

Wählt man als Formhypothesen

H ~ ϑ := { g ( ϑ ) } {\displaystyle {\tilde {H}}_{\vartheta }:=\{g(\vartheta )\}} ,

und K ~ ϑ {\displaystyle {\tilde {K}}_{\vartheta }} beliebig (aber disjunkt), so lautet der Konfidenzbereich zu den Formhypothesen

P ϑ ( { g ( ϑ ) C } ) 1 α {\displaystyle P_{\vartheta }(\{g(\vartheta )\in C\})\geq 1-\alpha } für alle ϑ Θ {\displaystyle \vartheta \in \Theta }

und entspricht somit genau der klassischen Formulierung eines Konfidenzbereiches zum Konfidenzniveau 1 α {\displaystyle 1-\alpha } .

Testhypothesen

Analog zu den Formhypothesen werden die Testhypothesen zu gegebenen Formhypothesen definiert. Im Gegensatz zu diesen sind sie Teilmengen der Indexmenge Θ {\displaystyle \Theta } statt des Entscheidungsraumes Γ {\displaystyle \Gamma } .

Definition

Gegeben seien Formhypothesen ( H ~ ϑ , K ~ ϑ ) ϑ Θ {\displaystyle ({\tilde {H}}_{\vartheta },{\tilde {K}}_{\vartheta })_{\vartheta \in \Theta }} . Dann heißt ( H γ , K γ ) γ Γ {\displaystyle (H_{\gamma },K_{\gamma })_{\gamma \in \Gamma }} , definiert durch

H γ := { ϑ Θ γ H ~ ϑ } {\displaystyle H_{\gamma }:=\{\vartheta \in \Theta \mid \gamma \in {\tilde {H}}_{\vartheta }\}}

und

K γ := { ϑ Θ γ K ~ ϑ } {\displaystyle K_{\gamma }:=\{\vartheta \in \Theta \mid \gamma \in {\tilde {K}}_{\vartheta }\}}

die Testhypothesen zu den Formhypothesen.

Beispiel

Führt man das obige Beispiel fort, so erhält man

H γ := { ϑ Θ γ [ ϑ 2 ; ϑ + 2 ] } = [ ϑ 2 ; ϑ + 2 ] {\displaystyle H_{\gamma }:=\{\vartheta \in \Theta \mid \gamma \in [\vartheta -2;\vartheta +2]\}=[\vartheta -2;\vartheta +2]}

und

K γ := { ϑ Θ γ H ~ ϑ } = R [ ϑ 2 ; ϑ + 2 ] {\displaystyle K_{\gamma }:=\{\vartheta \in \Theta \mid \gamma \notin {\tilde {H}}_{\vartheta }\}=\mathbb {R} \setminus [\vartheta -2;\vartheta +2]}

In diesem Beispiel sind die Formhypothesen und die Testhypothesen identisch, auch wenn sie formell auf verschiedenen Mengen definiert sind: Einmal auf der Indexmenge Θ {\displaystyle \Theta } und einmal auf dem Entscheidungsraum Γ {\displaystyle \Gamma } . Im Allgemeinen stimmen diese beiden Mengen nicht überein.

Literatur

  • Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 240–247, doi:10.1007/978-3-642-41997-3.