Kapitel 18 Standardfehler des Mittelwertes

Interessiert uns nur diese Gruppe, und nicht die Population, so berechnen wir die Standardabweichung, nicht den Standardfehler.

Wir lernen in diesem Kapitel den Standardfehler des Mittelwertes (“Standard Error of the Mean”) genauer kennen.

Wir haben im vorherigen Kapitel gelernt, dass bei mehrmaligem Ziehen einer Stichprobe aus derselben Population, nicht immer der gleiche Mittelwert resultiert.

Stellen wir uns folgendes Gedankenspiel vor:

  • Wir haben eine Population. Die durschnittliche Grösse in der Population ist 178cm
  • Wir ziehen eine Stichprobe, in der die gesamte Population enthalten ist (das wäre eigentlich keine Stichprobe, sondern ein Zensus). Wir berechnen den Mittelwert. Ja genau, der ist 178cm
  • Wir wiederholen dies 1000 Mal. Wir berechnen die Standardabweichung aller Mittelwerte. Wie gross wird diese Standardabweichung sein? Ja genau: 0cm! Weil ja jedesmal alle der Population gemessen wurden und somit jedesmal die durschnittliche Grösse 178cm war.
  • Nun ziehen wir wieder eine Stichprobe, bei der wir eine Person nicht in die Stichprobe aufnehmen. Wir berechnen wieder den Mittelwert. Er ist 178.2cm.
  • Wir wiederholen dies 1000 Mal. Wieder berechnen wir die Standardabweichung aller Mittelwerte. Dieses Mal wird die Standardabweichung nicht 0 sein, da wir in jeder Stichprobe einen leicht anderen Mittelwert erhalten haben (da ja immer eine Person fehlt). Die Standardabweichung wird jedoch klein sein.
  • Wir ziehen wieder 1000 Stichproben, dieses Mal immer mit einer Stichprobengrösse von 500. Die Standardabweichung der Stichprobenmittelwerte wird grösser sein als beim vorherigen Beispiel.
  • Wir ziehen wieder 1000 Stichproben, dieses Mal immer mit einer Stichprobengrösse von 10. Die Standardabweichung der Stichprobenmittelwerte wird wiederum grösser sein als beim vorherigen Beispiel.

Der Standardabweichung dieser Mittelwerte sagen wir übrigens Standardfehler des Mittelwertes oder auf Englisch Standard Error of the Mean, oft auch einfach Standardfehler oder Standard Error.

Wenn wir nun in der Wirklichkeit eine Studie durchführen, können wir natürlich nicht die Standardabweichung aller Stichprobenmittelwerte berechnen, da wir nur eine Stichprobe haben. Wir können aber die folgende Formel benutzen (wobei SE für den Standardfehler steht und SD für Standardabweichung):

\[ SE = \frac{SD}{\sqrt{n}} \]

Wie kommen wir auf diese Formel? Wenn wir eine Stichprobe der Grösse n haben, so besteht diese Stichprobe aus n Zufallszahlen. Warum Zufallszahlen? Weil ja jede zufällig aus der Population ausgewählt wurde. Jede Zufallsvariable hat die theoretische Varianz der Populations, also: \[\sigma^{2}\]

Für die Berechnung des Mittelwertes müssen wir ja alle Werte summieren. Für die Varianz des Mittelwertes müssen wir nun alle Varianzen summieren. Wir haben also \[ n \cdot \sigma^{2}\]. Für den Mittelwert müssen wir ja die Summe der Zahlen noch durch n teilen. Für die Varianz des Mittelwertes müssen wir nun aber durch \(n^{2}\) teilen. \[\frac{n \cdot \sigma^{2}}{n^{2}} = \frac{\sigma^{2}}{n}\]

Der Standardfehler des Mittelwertes ist nun die Wurzel der Varianz des Mittelwertes, also: \[\sqrt{\frac{\sigma^{2}}{n}}\] oder anders ausgedrückt: \[\frac{\sigma}{\sqrt{n}}\]

Da wir ja \(\sigma\) (d.h. die Populationsstandardabweichung) nicht kennen, bleibt uns nichts anders übrig, als die Standardabweichung der Stichprobe als Schätzung der Populationsstandardabweichung zu nehmen, daher unsere Formel: \[\frac{SD}{\sqrt{n}}\]

Der Standardfehler des Mittelwertes quantifiziert die statistische Präzision der Schätzung des Populationsmittelwertes.

Wenn wir eine Populationsproportion schätzen möchten, ist der Standardfehler übrigens wie folgt (aber mehr dazu im Master Studium):

\[\sqrt{\frac{p(1-p)}{n}}\]

Wir benutzen den Standardfehler, wenn wir von der Stichprobe auf die Population schliessen. Zum Beispiel, wenn wir mit der durschnittlichen Körpergrösse der Stichprobe die durchschnittliche Körpergrösse der Population schätzen wollen.