Kapitel 32 Messfehler

Ein wiederholtes Wiegen sollte immer zum gleichen Resultat führen. Natürlich unter der Bedinung, dass sich das wahre Gewicht nicht verändert hat. ## Was ist der Messfehler?

Wenn wir 100 Mal auf eine Waage stehen, ohne dazwischen unser Gewicht verändert zu haben, so sollte die Waage immer das gleiche Gewicht anzeigen. Je nach Zuverlässigkeit der Waage wird es jedoch leichte Schwankungen geben. Die Standardabweichung dieser Messungen - falls sie bei einer Person durchgeführt wurden - nennt man den Messfehler, oder auf Englisch auch den Standard Error of Measurement.

Wenn wir für den Einsatz eines Tests in einer bestimmten Population und einer bestimmten Situation den Messfehler bestimmen wollen, werden wir jedoch eher viele Studienteilnehmende zwei Mal auf die Waage stehen lassen. Hier wird der Standardmessfehler die Standardabweichung der Differenz geteilt durch die Wurzel von 2 sein.

\[\frac{SD(Differenzen)}{\sqrt{2}}\]

32.1 Achtung culture générale!

Warum ist der Standardmessfehler die Standardabweichung der Differenz geteilt durch die Wurzel von 2, wenn wir viele Personen zweimal testen?

\[\frac{SD(Differenzen)}{\sqrt{2}}\] Uns interessiert ja nicht eigentlich die Standardabweichung der Differenz, sondern die Standardabweichung der Messungen. Da wir in Studien jedoch nicht eine Person öfters messen, sondern viele Personen jeweils zweimal, und dann die Standardabweichung der Differenzen berechnen, haben wir eine grössere Standardabweichung. Warum? Die Standardabweichung der Differenz von zwei abhänigen Gruppen ist wie folgt:

  1. Varianz(x1 - x2) = Varianz(x1) + Varianz(x2) - 2Covarianz(x1,x2)

  2. Wir kennen ja jetzt Varianz(x1-x2), das können wir ja mit den Differenzen der einezlnen Personen zwischen beiden Tests ausrechnen. Da wir davon ausgehen, dass die Varianz(x1) gleich ist wie die Varianz(x2), können wir die Formel vereinfachen:

  3. Varianz(x1 - x2) = 2Varianz(x) + 2Covarianz(x1,x2)

  4. Wir formulieren um: 2Varianz(x) = Varianz(x1 - x2) - 2Covarianz(x1,x2)

  5. Wir formulieren weiter um: \(\sqrt{2Varianz(x)}\) = \(\sqrt{Varianz(x1 - x2) - 2Covarianz(x1,x2)}\)

  6. Wir formulieren weiter um: \(\sqrt{\frac{Varianz(x)}{2}}\) = \(\sqrt{\frac{Varianz(x1 - x2) - 2Covarianz(x1,x2)}{2}}\)

https://www.quora.com/How-do-you-calculate-the-standard-deviation-for-the-differences-when-comparing-two-dependent-samples-matched-pairs-data

In der Physiotherapie benutzen wir den Messfehler (Standard Error of Measurement, SEM), um zu bestimmen, ab wie viel beobachteter Veränderungen, wir davon ausgehen können, dass die beobachte Veränderung nicht nur auf den Messfehler zurückzuführen ist. Wir nennen diese Grösse den Smallest Detectable Change oder die Minimal Detectable Difference or Change (Diese Begriffe können im Prinzip als Synomyme benutzt werden).

Diese Minimal Detectable Change Werte werden in unterschiedlicher Strenge benutzt. Die strengste Variante ist die MDC95, hier wird der SEM mit 1.96 * $ = 2.77 multipliziert.

Beim etwas weniger strengen MDC multipliziert man den SEM mit 1.64 * $. Ein Beispiel aus der wissenschaftlichen Literatur findet man hier. Hier unten sehen Sie die Tabelle 4 aus diesem Artikel mit dem Minimal Dedectable Change (MDC)90 für die Short Physical Performance Battery, den One Leg Stance Test und den TUG.

Standard error of measurement for repeated measures and minimal detectable change scores at a 90% confidence interval (MDC90) for the SPPB, OLST, and TUG test.

Noch eine Klammerbemerkung: Wir haben früher schon den Standardfehler besprochen, den Standard Error of the Mean. Es ist wichtig, diese beiden Fehler nicht zu verwechseln. Beide werden mit SEM abgekürzt, was zu Verwirrung führen kann. Den Standard Error of the Mean benutzen wir, wenn wir in einer Stichprobe abschätzen wollen, die statistisch präzise unsere Schätzung des Populationsparameters ist (Kurz gesagt: je grösser die Stichprobe, desto kleiner der Standardfehler). Den Standard Error of Measurement benutzen wir, wenn wir die Messgenauigkeit eines Messinstrumentes feststellen wollen.

Der Messfehler ist Teil der Reliabilität. Wenn wir von Reliabilität sprechen, meinen wir jedoch oft den Intraclass Correlation Coefficient (ICC). Der ICC ist eine Art relative Reliabilität, da der Messfehler ins Verhältnis zur Streuung zwischen den Patienten gesetzt wird.

Wir schauen uns einmal ein Beispiel an: Wir messen die gesunde und die schmerzhafte Schulter von Patientinnen und Patienten. Natürlich ist die Variabilität in den schmerzhaften SChultern grösser - da gibt es grössere Unterschiede in der Beweglichkeit als in den gesunden Schultern. Der Messfehler (SEM) ist bei beiden Seiten gleichgross. Der ICC ist jedoch nun durch die Variabilität (d.h. Standardabweichung) beeinflusst: Er ist grösser (d.h. bessere Reliabilität) bei den schmerzhaften Schultern, da hier die Variabilität, d.h. die Standardabweichung grösser ist als bei den gesunden Schultern. Die Variabilität hat einen grossen Einfluss auf die relative Reliabilität (ICC).

Übrigens: Der Messfehler und die Reliabilität interessieren uns einerseits in Situationen, wo ein Text zweimal von der selben Person durchgeführt wird, anderseits in Situationen, zwei Personen den Test an der selben Patientin durchführen. Wir nennen dies Intra-Rater (oder Test-Retest), respektive Inter-Rater Reliabilität.

Jetzt haben wir aber noch nicht gelernt, wie man den SEM berechnen kann. Es gibt mindestens drei unterschiedliche Formeln zur Berechnung. Für das Verständnis dieser Berechnungen ist es einfacher, wenn wir zuerst den Intraklassen-Korrelations-Koeffizienten (Intraclass-Correlation-Coefficient, ICC) kennenlernen. Das tun wir im nächsten Kapitel.

So, jetzt seid ihr sicher schon motiviert, mehr über den ICC zu lernen. Siehe nächstes Kapitel.