Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit
in nur 12 Minuten? Du willst ganz einfach ein neues
Thema lernen in nur 12 Minuten?
-
5 Minuten verstehen
Unsere Videos erklären Ihrem Kind Themen anschaulich und verständlich.
92%der Schüler*innen hilft sofatutor beim selbstständigen Lernen. -
5 Minuten üben
Mit Übungen und Lernspielen festigt Ihr Kind das neue Wissen spielerisch.
93%der Schüler*innen haben ihre Noten in mindestens einem Fach verbessert. -
2 Minuten Fragen stellen
Hat Ihr Kind Fragen, kann es diese im Chat oder in der Fragenbox stellen.
94%der Schüler*innen hilft sofatutor beim Verstehen von Unterrichtsinhalten.
Grundlagen zum Thema Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit
Wie kann man eine statistische Aussage über alle Schüler in Deutschland treffen, ohne jeden einzelnen zu befragen? Anstelle der Grundgesamtheit betrachtet man nur eine Stichprobe. Doch wie groß muss die Stichprobe sein, um von der Stichprobe auf die Grundgesamtheit schließen zu können? Ist die Stichprobe zu klein, so kann keine sichere Aussage getroffen werden. Solchen Fragen und Problemen stellt man sich in der beurteilenden Statistik. Dabei werden einige Elemente der beschreibenden Statistik und der Wahrscheinlichkeitsrechnung vorausgesetzt. Anhand des Ergebnisses eines Versuchs soll im Hypothesentest eine zuvor gestellte Hypothese geprüft werden. Die Irrtumswahrscheinlichkeit wird vorgegeben. Hypothesentests mit einer Irrtumswahrscheinlichkeit von 5% nennt man signifikant.
Transkript Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit
In diesem Film werden einige der Grundprobleme der beurteilenden Statistik behandelt. Stellen wir uns vor, der Elektronikkonzern Tomato möchte eine neues Smartphone auf den Markt bringen, ein sehr teures Produkt. Daher will man bei Tomato schon vorab in Erfahrung bringen, wie viele Menschen in Deutschland so ein Gerät kaufen würden. Natürlich können dazu nicht zig Millionen Menschen befragt werden. Also werden nur 3000 ausgewählte Personen von Tomato angerufen. Die Menge aller möglichen Käufer, vereinfacht alle volljährigen Einwohner Deutschlands, stellt hier die sogenannte Grundgesamtheit dar. Die 3000 Personen, die tatsächlich angerufen werden, sind die Stichprobe. Das Grundproblem bei dieser Vorgehensweise ist nun: Ab welcher Teilnehmerzahl und mit welcher Sicherheit oder Unsicherheit kann man von einer Stichprobe auf die Grundgesamtheit schließen? Mit solchen Fragen beschäftigt sich die beurteilende Statistik. Sie setzt die beschreibende Statistik und einige Elemente der Wahrscheinlichkeitsrechnung voraus. Ehe wir uns aber um die Sorgen der Firma Tomato kümmern, vereinfachen wir die Problematik in einem Modell. Diese Urne enthält vorgeblich gleich viele weiße und schwarze Kugeln. Für eine Überprüfung dieser Angabe durch einfaches Nachzählen sind jedoch viel zu viele Kugeln in der Urne. Die Kugeln stellen in ihrer vorgegebenen, aber ungeprüften Aufteilung in Schwarz und Weiß nun die Grundgesamtheit dar. Jetzt wird eine Stichprobe entnommen. Tatsächlich wird ein Bernoulli-Prozess gestartet. Es wird zehnmal je eine Kugel gezogen, die immer wieder in die Urne zurückgelegt wird. Anhand des Ergebnisses soll die Hypothese überprüft werden, dass sich in der Urne 50% weiße und 50% schwarze Kugeln befinden. Daher wird ein solcher Versuch Hypothesentest genannt. Vor Versuchsbeginn wird definiert, welches Ergebnis erwartet wird. Wenn jeweils die Hälfte der Kugeln weiß und schwarz sind und zehnmal gezogen wird, sollten weiß und schwarz gleich oft gezogen werden, also je fünfmal. Die Wahrscheinlichkeit für weiß und für schwarz liegt bei jeder Ziehung bei 0,5. Das Produkt aus der Anzahl der Ziehungen und der Trefferwahrscheinlichkeit für jeden einzelnen Zug schließlich ist der Erwartungswert. Hier liegt er bei 0,5•10, also 5. Jetzt wird tatsächlich zehnmal eine Kugel gezogen. Das Ergebnis: sechsmal ist die Kugel weiß, viermal schwarz. Wie ist dieses Ergebnis zu bewerten? Sind die Kugeln doch eher im Verhältnis 60 zu 40 verteilt? Hier kann nun die Formel für die Trefferwahrscheinlichkeiten bei Bernoulli-Versuchen zu Hilfe genommen werden. Unter der Hypothese, dass jeweils 50% der Kugeln weiß und 50% schwarz sind, liegt danach die Wahrscheinlichkeit bei zehn Zügen sechsmal weiß zu ziehen, bei genau 20,5%. Mit Hilfe der Formel für die Wahrscheinlichkeit bei Bernoulli-Versuchen können wir ausrechnen, mit welcher Wahrscheinlichkeit jedes mögliche Ergebnis auftritt und dies grafisch darstellen. Wir sehen, dass die möglichen Ergebnisse sich um den Erwartungswert herum gruppieren. Die Wahrscheinlichkeit, genau den Erwartungswert, also Fünf zu erhalten, ist jedoch nur wenig größer als die für das Ergebnis Sechs, nämlich 24,6%. Eine sichere Aussage über die Verteilung der Kugeln in der Urne ist damit noch nicht möglich. Die Stichprobe ist einfach zu klein. Um ein schärferes Ergebnis zu erhalten, wird die Stichgruppe daher vergrößert. Es wird 100 mal gezogen, 45 mal davon weiß. Die Wahrscheinlichkeit dafür: 4,8%. Die Wahrscheinlichkeit, exakt den Erwartungswert, also 50 zu erreichen, knapp acht Prozent. Wir kommen einen Schritt weiter, wenn wir uns wieder die Verteilung der möglichen Trefferwahrscheinlichkeiten ansehen. Nur interessiert uns jetzt nicht mehr, wie groß die Wahrscheinlichkeit ist, genau eine bestimmte Anzahl weißer oder schwarzer Kugeln zu ziehen. Wir wollen wissen, wie groß die Wahrscheinlichkeit ist, dass die Ergebnisse der Ziehung in einem bestimmten Bereich liegen. Die Wahrscheinlichkeit, dass die Anzahl weißer Kugeln im Bereich von 40 bis 60 liegt, ist die Summe aller Einzelwahrscheinlichkeiten für diesen Fall. Hier sind dies 95,4%. Für alle anderen Verteilungsmöglichkeiten bleibt gerade einmal eine Wahrscheinlichkeit von 4,6% übrig. Das bedeutet im Umkehrschluss: Wenn wir bei 100 Zügen 40 bis 60 weiße Kugeln ziehen, können wir mit einer Wahrscheinlichkeit von 95,4% davon ausgehen, dass gleich viele weiße wie schwarze Kugeln in der Urne sind. In 4,6% der Fälle irren wir uns dagegen. Darum sind diese 4,6% auch die Irrtumswahrscheinlichkeit. Offenbar hängt der Bereich, in dem die Treffer erwartet werden dürfen, von der Größe der Stichprobe und ihrer Streuung ab. Für diese Streuung gibt es eine Maßzahl, die Standardabweichung. Diese hängt wiederum mit der Größe der Stichprobe zusammen. Für die Standardabweichung verwendet man den kleinen griechischen Buchstaben σ. Es gilt: Bei n Bernoulli-Versuchen mit der Trefferwahrscheinlichkeit 0,5 liegen 95% der Treffer in einem „zwei mal σ“-großen Intervall, jeweils rechts und links vom Erwartungswert. In der beurteilenden Statistik hat es sich eingebürgert, die Irrtumswahrscheinlichkeit vorzugeben. Daraus wird dann der Bereich bestimmt, in dem die Treffer liegen dürfen, um der Hypothese zuzustimmen. Erst dann wird der eigentliche Test durchgeführt. Bei einer Irrtumswahrscheinlichkeit von fünf Prozent und n Versuchen ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „2 σ"-Intervall um den Erwartungswert herum. Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von fünf Prozent nennt man „signifikant“. Wird dieses Intervall in Abhängigkeit von der Größe der Stichprobe grafisch dargestellt, zeigt sich, wie sich das Intervall mit zunehmender Stichprobengröße immer mehr verengt. Dies ist der 95%-Signifikanztrichter. In der statistischen Praxis gibt es noch weitere Standard-Irrtumswahrscheinlichkeiten. Zum Beispiel ein Prozent für sogenannte „sehr signifikante“ Tests. Und 0,1% für „hochsignifikante“ Tests. In diesen Fällen sind die Signifikanztrichter schmaler. Und schließlich gibt es auch Standardabweichungsintervalle für andere Trefferwahrscheinlichkeiten als 0,5. Übrigens, die Firma Tomato hat festgestellt, dass mit einer Irrtumswahrscheinlichkeit von einem Prozent das neue Smartphone weniger als 1000-mal verkauft werden würde. Das ergab sich schon daraus, dass unter den 3000 Befragten kein einziger Interesse an dem Gerät hatte. Die Entwicklung wurde sofort gestoppt.
Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit Übung
-
Gib die Ergebnisse des Hypothesentests wieder.
TippsDie Wahrscheinlichkeit bei Bernoulli-Versuchen wird wie folgt berechnet:
- $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$
Die Menge aller Kugeln stellt hier die sogenannte Grundgesamtheit dar. Die $10$ gezogenen Kugeln sind die Stichprobe.
Der Erwartungswert für die Anzahl schwarzer Kugeln wird wie folgt berechnet:
- $p_{\text{schwarz}}\cdot n$
LösungWir gehen davon aus, dass sich in der Urne $50\%$ weiße und $50\%$ schwarze Kugeln befinden. Damit nehmen wir die folgenden Erfolgswahrscheinlichkeiten an:
- $p_{\text{schwarz}}=0,5$
- $p_{\text{weiß}}=0,5$
- $p_{\text{schwarz}}\cdot n=0,5\cdot 10=5$
Es werden jedoch $4$ schwarze und $6$ weiße Kugeln gezogen. Wie ist dieses Ergebnis zu bewerten? Sind die Kugeln doch eher im Verhältnis $60$ zu $40$ verteilt?
Hierzu wird die Trefferwahrscheinlichkeit dafür, dass genau $6$ Kugeln einer Farbe gezogen werden, berechnet:
- Die Wahrscheinlichkeit bei Bernoulli-Versuchen wird wie folgt berechnet:
- $p_6=0,5^6\cdot (1-0,5)^{10-6}\cdot \binom{10}{6}\approx 0,205$
- $p_5=0,5^5\cdot (1-0,5)^{10-5}\cdot \binom{10}{5}\approx 0,246$
Eine sichere Aussage über die Verteilung der Kugeln in der Urne ist damit nicht möglich. Um ein schärferes Ergebnis zu erhalten, muss die Stichgruppe vergrößert werden.
-
Definiere die Begriffe zu Hypothesentests.
TippsWenn aus einer Urne $100$ mal eine Kugel mit Zurücklegen gezogen wird, so beschreibt die $100$ die Stichprobe.
Die Anzahl aller Kugeln in der Urne ist die Grundgesamtheit.
LösungEs soll in Erfahrung gebracht werden, wie viele Menschen in Deutschland ein neu entwickeltes Smartphone kaufen würden. Natürlich können dazu nicht Millionen Menschen befragt werden. Also werden nur $3000$ ausgewählte Personen angerufen.
- „Die Menge aller möglichen Käufer ist die Grundgesamtheit.“ Das könnten zum Beispiel alle volljährigen Einwohner Deutschlands sein.
- „Die $3000$ Personen, die angerufen werden, sind die Stichprobe.“ Je mehr Personen angerufen werden, desto besser kann man von der Stichprobe auf die Grundgesamtheit schließen.
- „Wenn wir mit einer Wahrscheinlichkeit von $95,4\%$ davon ausgehen können, dass unsere Hypothese stimmt, dann sind $4,6\%$ die Irrtumswahrscheinlichkeit.“ Wenn wir mit einer Wahrscheinlichkeit von $95,4\%$ davon ausgehen können, dass unsere Hypothese stimmt, dann würden wir uns in $4,6\%$ der Fälle irren. Darum nennt man diesen Anteil Irrtumswahrscheinlichkeit.
- „Der Bereich, in dem die Treffer erwartet werden dürfen, hängt von der Stichprobengröße und Streuung ab. Die Maßzahl für die Streuung ist die Standardabweichung.“
-
Zeige die Formeln, mit denen der Bereich ermittelt wird, in dem die Treffer liegen dürfen, um der jeweiligen Hypothese mit $5\%$ Irrtumswahrscheinlichkeit zuzustimmen.
TippsBei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, das „$2\sigma$“-Intervall um den Erwartungswert herum.
LösungBei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „$2\sigma$“-Intervall um den Erwartungswert herum.
Wenn $\mu$ der Erwartungswert und $\sigma$ die Standardabweichung ist, dann können wir die Grenzen dieses Bereiches wie folgt berechnen:
- untere Grenze: $\mu-2\sigma$
- obere Grenze: $\mu+2\sigma$
-
Ermittle die gesuchte Wahrscheinlichkeit und die daraus folgende Irrtumswahrscheinlichkeit.
TippsAddiere alle Einzelwahrscheinlichkeiten von $p_{95}$ bis $p_{105}$ auf.
Die Irrtumswahrscheinlichkeit erhältst du, wenn du die Trefferwahrscheinlichkeit von $100\%$ abziehst.
Mit folgender Formel berechnest du die Einzelwahrscheinlichkeiten:
- $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$
LösungWir müssen alle Einzelwahrscheinlichkeiten von $p_{95}$ bis $p_{105}$ aufaddieren.
Mit folgender Formel berechnen wir die Einzelwahrscheinlichkeiten:
- $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$
- $p_{95}= 0,5 ^{95}\cdot (1-0,5)^{200-95}\cdot \binom{200}{95}\approx 0,0439$
- $p_{96}= 0,5 ^{96}\cdot (1-0,5)^{200-96}\cdot \binom{200}{96}\approx 0,0481$
- $p_{97}= 0,5 ^{97}\cdot (1-0,5)^{200-97}\cdot \binom{200}{97}\approx 0,0515$
- $p_{98}= 0,5 ^{98}\cdot (1-0,5)^{200-98}\cdot \binom{200}{98}\approx 0,0541$
- $p_{99}= 0,5 ^{99}\cdot (1-0,5)^{200-99}\cdot \binom{200}{99}\approx 0,0558$
- $p_{100}= 0,5 ^{100}\cdot (1-0,5)^{200-100}\cdot \binom{200}{100}\approx 0,0563$
- $p_{101}= 0,5 ^{101}\cdot (1-0,5)^{200-101}\cdot \binom{200}{101}\approx 0,0558$
- $p_{102}= 0,5 ^{102}\cdot (1-0,5)^{200-102}\cdot \binom{200}{102}\approx 0,0541$
- $p_{103}= 0,5 ^{103}\cdot (1-0,5)^{200-103}\cdot \binom{200}{103}\approx 0,0515$
- $p_{104}= 0,5 ^{104}\cdot (1-0,5)^{200-104}\cdot \binom{200}{104}\approx 0,0481$
- $p_{105}= 0,5 ^{105}\cdot (1-0,5)^{200-105}\cdot \binom{200}{105}\approx 0,0439$
Damit erhalten wir folgende Irrtumswahrscheinlichkeit: $~100\%-56,32\%= 43,68\%$
-
Beschrifte die Graphen zum Signifikanztest.
TippsJe schmaler der Signifikanztrichter ist, desto kleiner ist die Standardabweichung.
Ein sehr signifikanter Test hat eine größere Standardabweichung als ein hochsignifikanter Test.
Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von $5\%$ nennt man signifikant.
LösungEinen Hypothesentest mit einer Irrtumswahrscheinlichkeit von $5\%$ nennt man signifikant. Wird dieses Intervall in Abhängigkeit von der Größe der Stichprobe grafisch dargestellt, zeigt sich, wie sich das Intervall mit zunehmender Größe der Stichprobe immer mehr verengt.
Die beiden gelben Kurven bilden den $95\%$-Signifikanztrichter. Bei diesem signifikanten Test beträgt die Standardabweichung $5\%$.
In der statistischen Praxis gibt es noch weitere Standard-Irrtumswahrscheinlichkeiten. Zum Beispiel $1\%$ Prozent für sogenannte sehr signifikante Tests (grüne Kurven) und $0,1\%$ für hochsignifikante Tests (blaue Kurven). In diesen Fällen sind die Signifikanztrichter schmaler.
-
Bestimme die Grenzen der jeweiligen Bereiche.
TippsBei $n$ Bernoulli-Versuchen mit der Trefferwahrscheinlichkeit $0,5$ liegen $95\%$ der Treffer in einem „$2\sigma$“ großen Intervall, jeweils rechts und links vom Erwartungswert.
Es gilt: $~\sigma=\sqrt{n\cdot p\cdot (1-p)}$
Den Erwartungswert erhältst du, indem du die Erfolgswahrscheinlichkeit mit $n$ multiplizierst.
Sieh dir folgendes Beispiel an:
- $n=300$
- $\mu-2\sigma=150-2\cdot 0,5\cdot \sqrt{300}\approx 133$
- $\mu+2\sigma=150+2\cdot 0,5\cdot \sqrt{300}\approx 167$
LösungBei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „$2\sigma$“-Intervall um den Erwartungswert herum.
Wenn $\mu$ der Erwartungswert und $\sigma$ die Standardabweichung ist, dann können wir die Grenzen dieses Bereiches wie folgt berechnen:
- untere Grenze: $\mu-2\sigma$
- obere Grenze: $\mu+2\sigma$
Für den Erwartungswert $\mu$ und die Standardabweichung $\sigma$ gilt:
- $\mu=n\cdot p$
- $\sigma=\sqrt{n\cdot p\cdot (1-p)}$
Stichprobe $n=200$
- untere Grenze: $\mu-2\sigma=200\cdot 0,5-2\sqrt{200\cdot 0,5\cdot (1-0,5)}=100- \sqrt{200}\approx 86$
- obere Grenze: $\mu+2\sigma=200\cdot 0,5+2\sqrt{200\cdot 0,5\cdot (1-0,5)}=100+ \sqrt{200}\approx 114$
- untere Grenze: $\mu-2\sigma=220\cdot 0,5-2\sqrt{220\cdot 0,5\cdot (1-0,5)}=110- \sqrt{220}\approx 95$
- obere Grenze: $\mu+2\sigma=220\cdot 0,5+2\sqrt{220\cdot 0,5\cdot (1-0,5)}=110+ \sqrt{220}\approx 125$
- untere Grenze: $\mu-2\sigma=190\cdot 0,5-2\sqrt{190\cdot 0,5\cdot (1-0,5)}=95- \sqrt{190}\approx 81$
- obere Grenze: $\mu+2\sigma=190\cdot 0,5+2\sqrt{190\cdot 0,5\cdot (1-0,5)}=95+ \sqrt{190}\approx 109$
- untere Grenze: $\mu-2\sigma=210\cdot 0,5-2\sqrt{210\cdot 0,5\cdot (1-0,5)}=105- \sqrt{210}\approx 91$
- obere Grenze: $\mu+2\sigma=210\cdot 0,5+2\sqrt{210\cdot 0,5\cdot (1-0,5)}=105+ \sqrt{210}\approx 119$
8.883
sofaheld-Level
6.601
vorgefertigte
Vokabeln
7.850
Lernvideos
37.590
Übungen
33.704
Arbeitsblätter
24h
Hilfe von Lehrkräften
Inhalte für alle Fächer und Klassenstufen.
Von Expert*innen erstellt und angepasst an die Lehrpläne der Bundesländer.
Testphase jederzeit online beenden
Beliebteste Themen in Mathematik
- Römische Zahlen
- Prozentrechnung
- Primzahlen
- Geometrische Lagebeziehungen
- Was ist eine Ecke?
- Rechteck
- Was ist eine Gleichung?
- Pq-Formel
- Binomische Formeln
- Trapez
- Volumen Zylinder
- Umfang Kreis
- Quadrat
- Division
- Raute
- Parallelogramm
- Polynomdivision
- Was Ist Eine Viertelstunde
- Prisma
- Mitternachtsformel
- Äquivalenzumformung
- Grundrechenarten Begriffe
- Größer Kleiner Zeichen
- Dreiecksarten
- Aufbau von Dreiecken
- Quader
- Satz Des Pythagoras
- Dreieck Grundschule
- Erste Binomische Formel
- Kreis
- Trigonometrie
- Trigonometrische Funktionen
- Standardabweichung
- Flächeninhalt
- Volumen Kugel
- Zahlen In Worten Schreiben
- Meter
- Orthogonalität
- Schriftlich Multiplizieren
- Brüche gleichnamig machen
- Brüche Multiplizieren
- Potenzgesetze
- Distributivgesetz
- Flächeninhalt Dreieck
- Rationale Zahlen
- Volumen Berechnen
- Brüche Addieren
- Kongruenz
- Exponentialfunktion
- Exponentialfunktion Beispiel