Äquivalenztest bei zwei Stichproben

Vergleich von Mittelwerten mit dem Ziel deren "Gleichheit" aufzuzeigen.

Diese Art von Statistik ist besonders in der Medizintechnik und Pharmaindustrie (aber auch für andere industrielle Bereiche) von großer Bedeutung. Die FDA empfiehlt für die Prozess Validierung statistische Tests einzusetzen.

Im Gegensatz zu anderen Hypothesentests werden mit Äquivalenztests keine signifikanten Unterschiede nachgewiesen. Vielmehr wird damit ermittelt, ob die Mittelwerte von Stichproben so nah beieinander liegen, dass sie als gleich (äquivalent) betrachtet werden können.

Folgende Fragestellung können damit beantwortet werden:

• Zeigt ein Produkt die gleiche Eigenschaft wie ein anderes Produkt?
• Liefern zwei unterschiedliche Hersteller Drähte mit der gleichen durchschnittlichen Zugfestigkeit?
• Ist der Wirkstoffgehalt eines Medikamentes gleich dem Wirkstoffgehalt eines Generikums?

Der Äquivalenztest bei 2 Stichproben prüft, ob die Mittelwerte zweier Grundgesamtheiten innerhalb einer festgelegten Differenz ähnlich (äquivalent) sind. Dabei betrachtet man die Differenz zwischen den Mittelwerten. Für diese Differenz definiert man eine Spannweite, die als vernachlässigbar angesehen wird und führt statistische Tests durch. Diese Spannweite ist die Differenz, die als technisch / praktisch nicht relevant angesehen wird.

 

Bei der Durchführung des Tests erhalten wir p-Werte für die separaten Hypothesentests:

Äquivalenz kann angenommen werden, wenn beide p-Werte kleiner als das akzeptierte alpha-Risiko (oft 5%) sind. Wenn einer die Signifikanzgrenze übersteigt, dann wird die Null-Hypothese abgelehnt und es kann keine Äquivalenz angenommen werden.
In obiger Grafik kann Äquivalenz angenommen werden, da das Konfidenzintervall für die Differenz zwischen Testmittelwert und Referenzmittelwert innerhalb des Äquivalenzbereiches liegt. Wenn ein Ende des Konfidenzintervalls außerhalb des Äquivalenzbereichs liegt, kann keine Äquivalenz behauptet werden.

Beispiel aus Minitab-Hilfe:

Sie haben eine neue, preiswertere Rezeptur Ihres beliebten Katzenfutters für Discount-Märkte entwickelt. Sie möchten sicherstellen, dass der Proteingehalt des billigeren Futters dem des Originalprodukts entspricht. Sie messen die Proteinmenge pro 100 Gramm Futter in beiden Rezepturen und testen, ob sie zu +/- 0,5 Gramm äquivalent sind.

 

Das Konfidenzintervall liegt vollständig innerhalb des Äquivalenzintervalls, daher kann von Äquivalenz ausgegangen werden.

Anmerkung:
Im Grunde werden beim Äquivalenztest zwei einseitige t-Tests durchgeführt.
Die Testdifferenzen entsprechen dabei jeweils der unteren bzw. oberen Äquivalenzgrenze.