Zugang zur Poissonverteilung

Aus Medienvielfalt-Wiki
Wechseln zu: Navigation, Suche

Heidi Metzger-Schuhäker, Peter Hofbauer, Gabi Bleier (Überarbeitung: Kurt Söser)


Nuvola apps edu miscellaneous.png
Über diesen Lernpfad

Dieser Lernpfad bietet eine kurze Einführung in das Thema diskrete Wahrscheinlichkeits- und Verteilungsfunktionen anhand eines Anwendungsbeispiels. Dabei wird eine Unfallstatistik als Maß der Sicherheit genauer untersucht. Als Alternative zur im Unterricht häufig verwendeten Binomialverteilung wird hier bewusst die Poissonverteilung eingesetzt.

Kompetenzen:

Das kannst du schon:

  • Werte einer Tabelle grafisch darstellen und interpretieren
  • statistische Zentral - und Streuungsmaße berechnen und ihre Bedeutung kennen
  • die Begriffe des Zufalls, der Zufallsvariablen und der Wahrscheinlichkeitsfunktion kennen
  • Treppenfunktionen zeichnen und ihren Graph interpretieren

Das kannst du lernen:

  • Übersetzen von einer Realsituation in ein mathematisches Modell
  • grafische Darstellung diskreter Zufallsvariable erkennen
  • Treppenfunktionen als Graphen von diskreten Verteilungsfunktionen identifizieren
  • charakteristische Merkmale einer poissonverteilten Zufallsvariable kennenlernen
  • Parameter variieren und die Auswirkung dieser Variation beschreiben
  Pfeil.gif Für die Lehrerinnen und Lehrer:

Pdf20.gif Didaktischer Kommentar


Inhaltsverzeichnis

Es gibt nur gute Autofahrer, oder?

Die Behauptung

Die meisten Autofahrer behaupten von sich, dass ihre Fahrkünste nicht schlechter als durchschnittlich sind. Ist das möglich oder handelt es sich um Selbstüberschätzung? Wie kann man die Fahrkünste überhaupt bewerten?

Als Maß der Sicherheit soll die Anzahl der Unfälle gelten, in die ein Fahrer/-in im Laufe des Lebens verwickelt ist. Das bedeutet: Je weniger Unfälle ein Autofahrer/-in in seinem Leben hat, desto sicherer ist er unterwegs, so die Behauptung.

Statistische Auswertung

Da als Maß der Sicherheit die Anzahl der Unfälle gilt, in die ein(e) Fahrer(in) im Laufe des Lebens verwickelt ist, legen wir unserer Analyse eine Unfallstatistik zugrunde. Hier sind die Daten, die die Polizei gesammelt hat: Stichprobe: 100 Fahrer


Unfallstatistik
Anzahl der Unfälle 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Personen 6 17 23 20 14 9 4 1 1 1 1 1 1 0 0 0 0 1 0 0 0



  Aufgabe   Stift.gif
  1. Stelle die Daten aus der Tabelle in einem Koordinatensystem dar.
  2. In wie viele Unfälle ist ein "durchschnittlicher" Autofahrer verwickelt? Oder anders gesagt: Wie viel Unfälle hat ein Fahrer durchschnittlich in seinem Leben? Berechne wichtige statistische Zentral- und Streuungsmaße und interpretiere deine Ergebnisse!
  3. Berechne, wie viele Autofahrer der Stichprobe nicht schlechter als der Durchschnitt sind, wenn man die Anzahl der Unfälle als Maß nimmt!
  4. Zur Diskussion: Was könnte problematisch sein, wenn die Anzahl der Autounfälle im Laufe eines Lebens als Maß der Sicherheit gewählt wird? Findest du ein anderes geeignetes Modell?
  5. Zusatz: Mach dich auf die Suche nach vergleichbare Statistiken im Internet!



Lösung:

Mittelwert: 3,22
Standardabweichung: 2,63
Anzahl der Autofahrer mit höchstens 3 Unfällen: 66 von 100, also 66%.
Lösung als Excel-Datei


Der Begriff der Wahrscheinlichkeitsfunktion

Als erstes Modell könntest du nun als Beurteilung der Sicherheit eines Autofahrers bzw. einer Autofahrerin die Anzahl der Unfälle, in welche die Person im Laufe ihres Lebens verwickelt war, heranziehen.

Die Zufallsvariable

Zufallsvariable
Maehnrot.jpg
Merke:

Eine Zufallsvariable X ordnet jedem Ergebnis eines Zufallsexperimentes verschiedenene, nicht vorhersagbare Zahlen x zu.


In diesem Beispiel ist die Zufallsvariable X das Maß der Sicherheit eines Autofahrers, es werden hier entsprechend die Anzahlen der Unfälle, also die Zahlen 0 bis 20 zugeordnet.

diskrete Zufallsvariable
Maehnrot.jpg
Merke:

Wenn dabei die zugeordneten Werte abzählbar sind, also einem Zählprozess zugrunde liegen, spricht man von diskreten Zufallsvariablen.


  Aufgabe   Stift.gif

Finde eigenständig weitere Beispiele für diskrete Zufallsvariable!



Wir wollen nun versuchen, aus der vorliegenden Stichprobe der Polizei etwas allgemeinere Aussagen treffen zu können. Da es sich um eine Stichprobe mittlerer Größe handelt, ist es sinnvoll, sich die relativen Häufigkeiten genauer anzusehen.



  Aufgabe   Stift.gif
  1. Recherchiere eigenständig, was man unter der "statistischen Definition von Wahrscheinlichkeit" versteht.
  2. Stelle die Wahrscheinlichkeitsfunktion dieses Beispiels mit Hilfe relativer Häufigkeiten sowohl in einer Tabelle als auch grafisch dar!


Unfallstatistik
Zufallsvariable (Anzahl der Unfälle) X=x x=0 x=1 x=2 x=3 x=4 x=5 x=6 x=7 x=8 x=9 x=10 x=11 x=12 x=13 x=14 x=15 x=16 x=17 x=18 x=19 x=20
relative Häufigkeiten 0.06 0,17 0,23 0,20


Lösung zu 1:

Approximation der (statistischen) Wahrscheinlichkeit mit Hilfe von relativen Häufigkeiten: Nähern sich bei wachsendem Stichprobenumfang die relativen Häufigkeiten des Eintretens eines Ereignisses E einer bestimmten Zahl p(E) so bezeichnet man p(E) als Wahrscheinlichkeit für das Eintreten des Ereignises E. Man schreibt p(E)\approx h_n für sehr großes n.

Diese statistische Definition der Wahrscheinlichkeit findet vor allem dann Anwendung, wenn man kein mathematisches Modell zur Berechnung der Wahrscheinlichkeit findet. Es handelt sich um eine empirische Größe, die eine große Versuchsreihe voraussetzt, um einen guten „Schätzwert“ liefern zu können. Somit ist die nach dieser Definition die Wahrscheinlichkeit die optimale Prognose der relativen Häufigkeiten.

Lösung zu 2:

Lösung als Excel-Datei


Doppelklick öffnet die Geogebra-Datei in eigenem Fenster

Die Darstellung mittels relativer Häufigkeiten

Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable
Maehnrot.jpg
Merke:

Unter einer Wahrscheinlichkeitsfunktion f der diskreten Zufallsvariablen X versteht man die Funktion, die den Funktionswerten von X, also den zugeordneten Werten x die Wahrscheinlichkeit p ihres Eintretens zuordnet.


In unserem Beispiel wird die Wahrscheinlichkeitsfunktion durch die grafische Darstellung der relativen Häufigkeiten dargestellt.


  Aufgabe   Stift.gif
  1. Beschreibe den Verlauf der Funktionswerte. Macht es Sinn, die einzelnen Werte miteinander zu verbinden?
  2. Zusatz: Kennst du noch andere Wahrscheinlichkeitsfunktionen


Lösung:

Wenn man die Darstellung der relativen Häufigkeiten betrachtet, so zeigt sich eine deutlich asymmetrische/schiefe Verteilung. Bei einer zufällig aus der Stichprobe gewählten Person ist der berechnete Mittelwert von 3 Unfällen eine optimale Prognose, der Erwartungswert. Aus der Graphik zeigt sich, dass die meisten Personen eher in wenige Unfälle verwickelt sind. Größere Unfallanzahlen treten hingegen viel seltener auf.

Da Unfälle nur ganzzahlige auftreten können (du kannst nicht 0,3 Unfälle haben) ist es nicht sinnvoll, die einzelnen Werte zu verbinden. Die Wahrscheinlichkeitsfunktion ist deshalb nur für ganzzahlige nicht negative Werte definiert. Somit haben wir hier ein Paradebeispiel für eine Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable

Die Poissonverteilung

Poisson-Verteilung
Maehnrot.jpg
Merke:

Wahrscheinlichkeitsfunktionen mit einer grafischen Darstellung wie jener des Autofahrerbeispiels, wurden nach dem französischen Mathematiker Simeón Denis Poisson (1781–1840) benannt und treten bei sehr seltenen Ereignissen und einer großen Stichprobe auf. Poisson hat erkannt, dass der Verlauf der relativen Häufigkeiten eine Form hat, die an den Graphen folgender Funktion erinnert:
f(x)={{e^{{-p\cdot n}}}\cdot (p\cdot n)^x \over x!} , wobei p die Wahrscheinlichkeit darstellt, mit welcher das Ereignis eintritt; n ist die Anzahl der Stichprobengröße.

Man spricht bei einer stetigen Funktion dieser Form von einer "Trägerkurve" als Annäherung der diskreten Wahrscheinlichkeitsfunktion.

Eine diskrete Zufallsvariable X heißt poissonverteilt, wenn gilt:
f(x)=P(X=x)\begin{cases}{{e^{{-p\cdot n}}}\cdot (p\cdot n)^x \over x!}& \mbox{wenn }x\in \mathcal{f} 0,1,2,... \mathcal{g}\\ 0 & \mbox{sonst}\end{cases}


  Aufgabe   Stift.gif

Finde durch Probieren mit Hilfe des GeoGebra-Applets eine "Trägerkurve" (Funktion) der oben erwähnten Form, die der Wahrscheinlichkeitsfunktion der Autounfälle möglichst nahe kommt. Variiere dabei die Parameter p und n mithilfe der Schieberegler.




Der Begriff der Verteilungsfunktion

In der ursprünglichen Aufgabenstellung interessiert uns nicht die Wahrscheinlichkeit, mit welcher ein Autofahrer im Laufe seines Lebens eine bestimmte Anzahl von Unfällen hat. Vielmehr interessiert uns die Wahrscheinlichkeit, mit welcher Zufallsvariable Werte annehmen, die nicht größer als ein fest vorgegebener Wert sind, also ein Autofahrer nicht mehr als zum Beispiel vier Unfälle (mehr als der Mittelwert) im Laufe seines Lebens hat. Man berechnet die Wahrscheinlichkeit, dass die Zufallsvariable höchstens den Wert x annimmt, folgendermaßen:

Maehnrot.jpg
Merke:

Unter einer Verteilungsfunktion der diskreten Zufallsvariablen X versteht man die Funktion F(x)=P(X \le x)=\sum_{k=0}^x f(k)

Jede diskrete Wahrscheinlichkeitsfunktion einer Zufallsvariablen X besitzt als Verteilungsfunktion eine Treppenfunktion F(x), die an den ganzzahligen Werten x Sprungstellen aufweist. Dazwischen verläuft die Funktion konstant.



  Aufgabe   Stift.gif
  1. Berechne in unserem Beispiel die summierten Häufigkeiten und stelle diese sowohl in einer Tabelle als auch grafisch dar!
  2. Überlege, warum sich die Funktionswerte bei größer werdenden x-Werten der Zahl 1 annähern müssen, sie jedoch nie überschreiten!
  3. Wie lässt sich die Wahrscheinlichkeit berechnen, dass ein Autofahrer höchstens 3 Unfälle hat? Berechne die Lösung sowohl mit Hilfe der Werte der Stichprobe als auch annähernd durch die POISSONVERTEILUNG.
  4. Formuliere allgemein die Verteilungsfunktion der POISSONVERTEILUNG.


Lösung zu 1:

Lösung zu 2:

Die Wahrscheinlichkeit \lehöchste Anzahl ist ein sicheres Ereignis und liegt bei 100% bzw. 1.

Lösung zu 3:

P(X\le3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)=66%; POISSONVERTEILUNG: zB. bei n=4500, p=0,00062: 69%

Lösung zu 4:

Formulierung als Summe: F(x)=\sum_{k=0}^x f(k)

Weitere Aufgaben

Zum Schluss noch weitere Aufgaben, um die neuerlernte Poissonverteilung selbständig anzuwenden:

  Aufgabe   Stift.gif

Ein deutscher Statistiker namens Bortkiewicz führte zu Beginn des 20. Jahrhunderts eine versicherungsmathematisch interessante Untersuchung durch: Zu wie vielen tödlichen Unfällen durch Pferdehufschlag kam es in der preußischen Armee? Die folgende Tabelle enthält die Statistik der Unfallopfer von 10 Kavallerieregimentern für einen Zeitraum von 20 Jahren (dies entspricht 200 "Regimentsjahren"). Berechne das arithmetische Mittel und setzte diese Zahl als Parameter \lambda in die stetige Poissonverteilung ein´. (da sich der Erwartungswert der stetigen Poissonverteilung aus \lambda=p\cdot n berechnet).

f(x)={{e^{{\lambda}}}\cdot (\lambda)^x \over x!}

Vergleiche mit Hilfe einer Tabelle die Werte der relativen Häufigkeiten und der possionverteilten Wahrscheinlichkeitsfunktion!


Unfallstatistik
Zahl der Todesopfer 0 1 2 3 4 >4
Zahl der Regimentsjahre 109 65 22 3 1 0
  Aufgabe   Stift.gif

Die mittlere Ankunftsrate der Bestellungen per E-Mail auf unserem Server beträgt \lambda=4 pro Tag. Wie groß ist die Wahrscheinlichkeit, dass mehr als 8 Bestellungen pro Tag hereinkommen.


  Aufgabe   Stift.gif

Die Häufigkeit von Kreditausfällen kann näherungsweise durch eine POISSON-Verteilung dargestellt werden. Wie groß ist für ein Portfolio von z.B. n=1000 Krediten mit einer einheitlichen und unabhängigen Ausfallwahrscheinlichkeit von p=1% die Wahrscheinlichkeit, dass es – etwa innerhalb eines Jahres – zu mehr als 2 Ausfällen kommt.


Team.gif
Dieser Lernpfad wurde erstellt von:

Peter Hofbauer, Heidi Metzger-Schuhäker, Gabi Bleier Überarbeitung: Kurt Söser