Wahrscheinlichkeitsrechnung Grundlagen – Laplace Experiment

Ein Zufallsexperiment ist ein Vorgang, bei dem mindestens zwei Ergebnisse möglich sind und bei dem man vor Ablauf des Vorgangs das Ergebnis nicht vorhersehen kann. Beispiel: Ein Würfel wird geworfen. Auf welcher Seite er landet, ist vor Abwurf des Würfels aus der Hand nicht zu sagen. Das Zufallsexperiment gehört damit zum Gebiet der Wahrscheinlichkeitsrechnung.

Unter einem Laplace Experiment versteht man ein Zufallsexperiment, bei dem alle Möglichkeiten des Versuchsausgangs die gleiche Wahrscheinlichkeit aufweisen. Man spricht hier oftmals von „gleichwahrscheinlich“.

Woran erkennt man nun, ob es sich um einen Laplace Versuch handelt oder nicht? Die Frage ist oftmals nicht ganz so einfach zu beantworten und erfordert in vielen Fällen Vorkenntnisse auf dem entsprechenden Gebiet. Es folgen ein paar Beispiele:

  • Ein normaler Würfel hat sechs Seiten. Sofern an dem Würfel nichts manipuliert wurde, ist die Wahrscheinlichkeit, dass du die Zahl 1 würfelst, genauso groß, wie es die Wahrscheinlichkeit ist, dass du die Zahl 6 würfelst. Es handelt sich somit um ein Laplace Experiment / Versuch.
  • Eine Münze hat zwei Seiten: Kopf und Zahl. Bei einer nicht manipulierten Münze ist die Wahrscheinlichkeit „Zahl“ zu werfen genauso groß wie die Wahrscheinlichkeit „Wappen“ zu werfen. Somit handelt es sich um einen Laplace Versuch.
  • Bei einem Pferderennen treten 10 Reiter samt Pferde gegeneinander an. Da sich die Fähigkeiten der Teilnehmer voneinander unterschieden, ist die Chance auf einen Sieg bei jedem Teilnehmer verschieden. Somit haben wir kein Laplace Experiment.

Man sollte versuchen solche Aufgaben mit etwas gesundem Menschenverstand anzupacken. Hat man keinen Grund, das Eintreten irgendeines der Ergebnisse eines Zufallsexperiments für wahrscheinlicher als das der anderen Ergebnisse zu halten, so kann man erst einmal von einem Laplace Experiment ausgehen.

Ein Zufallsexperiment ist ein Vorgang, bei dem mindestens zwei Ergebnisse möglich sind und bei dem man vor Ablauf des Vorgangs das Ergebnis nicht vorhersehen kann. Auf welcher Seite er landet, ist vor Abwurf des Würfels aus der Hand nicht zu sagen

Zufallsexperiment in der Wahrscheinlichkeitsrechnung?

Unter einem einstufigen Zufallsexperiment der Wahrscheinlichkeitsrechnung versteht man ein Zufallsexperiment, welches nur ein einziges Mal durchgeführt wird.

  • Du wirfst einen Würfel einmal
  • oder du wirfst eine Münze einmal

In den meisten Fällen ist es notwendig, einen Versuch mehrfach durchzuführen. So könntest du beim Wurf eines Würfels die Zahl 4 würfeln. Doch nach einem Versuch könntest du dann glauben, dass du bei einem Würfel immer die Zahl 4 werfen wirst. Aus diesem Grund sind einstufige Zufallsexperimente in den meisten Fällen nicht aussagekräftig.

Von einem mehrstufigen Zufallsexperiment sprich man, wenn ein zufälliger Vorgang mehrfach nacheinander durchgeführt wird. Beispiel: Wirf einen Würfel mehrfach hintereinander. Besteht ein mehrstufiger Zufallsversuch aus k – Teilversuchen, so spricht man von einem k-stufigen Zufallsexperiment. Der Ausgang eines Zufallsexperimentes kann dabei Ergebnis genannt werden. Die Ergebnismenge enthält alle möglichen Ergebnisse eines Zufallsexperimentes.

Das Gegenereignis wird mit einem Strich über dem E dargestellt. Nimmt man die Wahrscheinlichkeit von Ereignis und Gegenereignis zusammen, ergibt dies in Summe 1 (oder in Prozent sind es 100 %). Kennt man das Ereignis kann man damit das Gegenereignis ausrechnen und umgekehrt.

 

Was ist ein Baumdiagramm?

Das Baumdiagramm wird verwendet, um den möglichen Ablauf eines mehrstufigen Zufallsexperiments mit endlich vielen möglichen Ergebnissen in seiner komplexen Struktur zu erfassen, darstellen und analysieren. Zudem ist es damit möglich, auf Grundlage der ersten und zweiten Pfadregel die Wahrscheinlichkeiten für atomare und zusammengesetzte Ereignisse eines solchen Experiments in einfacher Weise zu berechnen.

Um beim Rechnen mit Wahrscheinlichkeiten einen guten Überblick zu behalten, legen wir sogenannte Baumdiagramme an. Aus einem Baumdiagramm kannst du die unterschiedlichen Ausgänge, und die jeweiligen Wahrscheinlichkeiten, eines Zufallsexperimentes ablesen. Der große Vorteil solcher Baumdiagramme ist, dass du auch mehrstufige Zufallsexperimente übersichtlich darstellen kannst.

Wie verwende ich das Baumdiagramm?

Ein Baumdiagramm ist eine graphische Darstellung, welche die möglichen Ergebnisse eines bestimmten Ablaufs hierarchischer Entscheidungen zeigt. In der Wahrscheinlichkeitsrechnung werden Baumdiagramme zur Berechnung von Wahrscheinlichkeiten mehrstufiger Zufallsexperimente eingesetzt.

Dabei verzweigt sich ein stilisierter Baum auf jeder Stufe des Zufallsexperiments in Äste, die den möglichen Ergebnissen bzw. Ereignissen der entsprechenden Stufe des Zufallsexperiments entsprechen, wobei die Verzweigungsstelle mit den entsprechenden Ergebnissen bzw. Ereignissen beschriftet wird. Baumdiagramme werden häufig von links nach rechts, aber nicht selten auch von oben nach unten gezeichnet.

Das Baumdiagramm verwendet man in der Stochastik zur Darstellung möglicher Versuchsausgänge von Zufallsexperimenten. Mit einem Baumdiagramm kann man unter anderem die Wahrscheinlichkeiten der verschiedenen Versuchsausgänge in einfacher Weise bestimmen.

Die Stochastik ist ein Teilgebiet der Mathematik und fasst als Oberbegriff die Gebiete Wahrscheinlichkeitstheorie und Statistik zusammen.

Das Baumdiagramm dient dazu Zufallsexperimente übersichtlich darzustellen. Dies macht insbesondere dann sind, wenn das Zufallsexperiment aus mehreren Stufen besteht. Wie wahrscheinlich es ist, dass ein bestimmter Pfad oder mehrere Pfade eintreten, berechnet man mit den Pfadregeln.

Die Pfadwahrscheinlichkeit ist die Wahrscheinlichkeit, dass ein solches Ergebnis eintritt. Um die Wahrscheinlichkeiten einzelner Ergebnisse eines mehrstufigen Zufallsexperimentes zu berechnen, ermittelst du die zugehörigen Pfadwahrscheinlichkeiten mit Hilfe der Produktregel

Für die Berechnung der oben genannten Wahrscheinlichkeiten gelten zwei Pfadregeln.

Erste Pfadregel (Produktregel):

Bei einem mehrstufigen Zufallsexperiment ist die Wahrscheinlichkeit eines atomaren Ereignisses gleich seiner Pfadwahrscheinlichkeit, d.h. gleich dem Produkt der Wahrscheinlichkeiten entlang des Pfades, der dem zugehörigen Ergebnis im Baumdiagramm entspricht.

Zweite Pfadregel(Summenregel):

Bei einem mehrstufigen Zufallsexperiment ist die Wahrscheinlichkeit eines (zusammengesetzten) Ereignisses gleich der Summen der Wahrscheinlichkeiten aller der Pfade, die zu seinen zugehörigen Ergebnissen führen.

Varianz und Standardabweichung in der Statistik

Die Varianz ist ein Streuungsmaß, welches die Verteilung von Werten um den Mittelwert kennzeichnet. Berechnen kannst du diese, indem du die Summe der quadrierten Abweichungen aller Messwerte vom arithmetischen Mittel durch die Anzahl der Messwerte dividierst. Außerdem ist diese ein Maß für die Streuung der Wahrscheinlichkeitsdichte um ihren Schwerpunkt. Mathematisch kann man sie als die mittlere quadratische Abweichung einer reellen Zufallsvariablen von ihrem Erwartungswert definieren. 

Die Varianz kann man physikalisch als Trägheitsmoment interpretieren. Des Weiteren ist sie das Quadrat der Standardabweichung, des wichtigsten Streuungsmaßes in der Stochastik. Die Varianz kann mit einem Varianzschätzer, z. B. der Stichprobenvarianz, geschätzt werden.

Eigenschaften der Varianz

Zu den Eigenschaften der Varianz gehören, dass sie niemals negativ ist und sich bei Verschiebung der Verteilung nicht ändert. Die Varianz einer Summe unkorrelierter Zufallsvariablen ist gleich der Summe ihrer Varianzen. Ein Nachteil der Varianzen für praktische Anwendungen ist, dass sie im Unterschied zur Standardabweichung eine andere Einheit als die Zufallsvariable besitzen. Da sie über ein →Integral definiert wird, existiert sie nicht für alle Verteilungen, d. h., sie kann auch unendlich sein.

Eine Verallgemeinerung ist die Kovarianz. Im Unterschied zur Varianz, die die Variabilität der betrachteten Zufallsvariable misst, ist die Kovarianz ein Maß für die gemeinsame Variabilität von zwei Zufallsvariablen. Aus dieser Definition folgt, dass die Kovarianz einer Zufallsvariable mit sich selbst gleich der Varianz dieser →Zufallsvariablen ist.

Was sagt die empirische Standardabweichung aus?

Die Standardabweichung ist ein Maß für die Streubreite der Werte eines Merkmals rund um dessen Mittelwert (arithmetisches Mittel). Vereinfacht gesagt, ist die Standardabweichung die durchschnittliche Entfernung aller gemessenen Ausprägungen eines Merkmals vom Durchschnitt.

Sie gehört zu den Streuungsmaßen und beschreibt die mittlere quadratische Abweichung der einzelnen Messwerte vom empirischen Mittelwert. Sie stellt damit eine Art durchschnittliches Abweichungsquadrat dar. Die positive Wurzel der empirischen Varianz ist die empirische Standardabweichung. Verwende die Standardabweichung, um die Streubreite der Daten um den Mittelwert zu ermitteln. Ein höherer Wert der Standardabweichung verweist auf eine größere Streubreite der Daten.

 

Was ist die Statistik?

Statistik wird einerseits als eigenständige mathematische Disziplin über das Sammeln, die Analyse, die Interpretation oder Präsentation von Daten betrachtet. Andererseits als Teilgebiet der Mathematik, insbesondere der Stochastik, angesehen. Dabei kannst du die Statistik auch als Lehre von Methoden zum Umgang mit quantitativen Informationen (Daten) verstehen. Unter anderem macht sie es möglich eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen. Darunter versteht man auch die Zusammenfassung bestimmter Methoden zur Analyse empirischer Daten. Ein alter Ausdruck dafür war Sammelforschung.

Die Statistik wird in die folgenden drei Teilbereiche eingeteilt

  1. Die deskriptive Statistik (auch beschreibende oder empirische). Vorliegende Daten werden in geeigneter Weise beschrieben, aufbereitet und zusammengefasst. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen.
  2. Die induktive Statistik (auch mathematische, schließende, beurteilende oder Inferenzstatistik). Bei der induktiven Art leitet man aus den Daten einer Stichprobe Eigenschaften einer Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.
  3. Die explorative Statistik (auch hypothesen-generierende, analytische oder Data-Mining). Dies ist methodisch eine Zwischenform der beiden vorgenannten Teilbereiche, bekommt als Anwendungsform jedoch zunehmend eine eigenständige Bedeutung. Mittels deskriptiver Verfahren und induktiver Testmethoden sucht sie systematisch mögliche Zusammenhänge (oder Unterschiede) zwischen Daten in vorhandenen Datenbeständen und will sie zugleich in ihrer Stärke und Ergebnissicherheit bewerten. Die so gefundenen Ergebnisse lassen sich als Hypothesen verstehen, die erst, nachdem darauf aufbauende, induktive Testverfahren mit entsprechenden (prospektiven) Versuchsplanungen sie bestätigen, als statistisch gesichert gelten können.

Der Unterschied zwischen deskriptiver und explorativer Methode wird auch an den Fragestellungen deutlich. Bei der deskriptive Statistik kannst du dich fragen, wie man eine Verteilung eines Merkmals beschreiben kann. Bei der explorative Statistik fragst du dich, was an einer Verteilung eines Merkmals bemerkenswert oder ungewöhnlich ist.

Vor allem benötigen wir die Statistik, um informierte, das heißt, richtige oder bessere Entscheidungen für Probleme treffen zu können. Diese beziehen sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen. Oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind.

Die wichtigsten Diagrammtypen:

  • Säulendiagramm. Das Säulendiagramm ist die am häufigsten verwendete und einfachste Diagrammart
  • Balkendiagramm
  • Additives Diagramm
  • Kurvendiagramm
  • Flächendiagramm
  • Kreisdiagramm
  • Verbunddiagramm
  • Netzdiagramm.

Was ist ein Box Plot?

Der Box-Plot (auch Box-Whisker-Plot, Kastenschaubild oder Kastengrafik) ist ein Diagramm, das zur grafischen Darstellung der Verteilung eines mindestens ordinalskalierten Merkmals verwendet wird. Es fasst dabei verschiedene robuste Streuungs- und Lagemaße in einer Darstellung zusammen. Ein Box-Plot soll schnell einen Eindruck darüber vermitteln, in welchem Bereich die Daten liegen und wie sie sich über diesen Bereich verteilen. Deshalb werden alle Werte der sogenannten Fünf-Punkte-Zusammenfassung, also der Median, die zwei Quartile und die beiden Extremwerte, dargestellt.

Ein Box-Plot besteht immer aus einem Rechteck, genannt Box, und zwei Linien, die dieses Rechteck verlängern. Diese Linien werden als „Antenne“ oder seltener als „Fühler“ oder „Whisker“ bezeichnet und werden durch einen Strich abgeschlossen. In der Regel repräsentiert der Strich in der Box den Median der Verteilung.

Was ist ein Box Plot?

Die Box entspricht dem Bereich, in dem die mittleren 50 % der Daten liegen. Sie wird also durch das obere und das untere Quartil begrenzt, und die Länge der Box entspricht dem Interquartilsabstand. Dieser ist ein Maß der Streuung der Daten und wird durch die Differenz des oberen und unteren Quartils bestimmt. Des Weiteren wird der Median als durchgehender Strich in der Box eingezeichnet. Dieser Strich teilt das gesamte Diagramm in zwei Bereiche, in denen jeweils 50 % der Daten liegen. Durch seine Lage innerhalb der Box bekommt man also einen Eindruck von der Schiefe der den Daten zugrunde liegenden Verteilung vermittelt. Ist der Median im linken Teil der Box, so ist die Verteilung rechtsschief, und umgekehrt.

Aufgrund des einfachen Aufbaus von Box-Plots verwendet man diese hauptsächlich, wenn man sich schnell einen Überblick über bestehende Daten verschaffen will. Dabei muss nicht bekannt sein, welcher Verteilung diese Daten unterliegen. Die Box gibt an, in welchem Bereich 50 % der Daten liegen. An der Lage des Medians innerhalb dieser Box kann man erkennen, ob eine Verteilung symmetrisch oder schief ist. 

Box-Plots eignen sich auch, um eventuelle Ausreißer zu identifizieren, oder liefern Hinweise darauf, ob die Daten einer bestimmten Verteilung unterliegen. 

Wenn der Box-Plot stark asymmetrisch ist, eine ungewöhnlich hohe Ausreißerzahl oder weit von der Box entfernte Ausreißer enthält, deutet das beispielsweise darauf hin, dass die Daten nicht normalverteilt sind.

Der wesentliche Vorteil des Box-Plot besteht im raschen Vergleich der Verteilung in verschiedenen Untergruppen. Während ein Histogramm eine zweidimensionale Ausdehnung hat, ist ein Box-Plot im Wesentlichen eindimensional. So lassen sich leicht mehrere Datensätze nebeneinander (oder untereinander bei waagerechter Darstellung) auf derselben Skala darstellen und vergleichen.

Lineare Optimierung – Ungleichungssysteme

Um eine Lineare Optimierung bzw. ein lineares Optimierungsproblem lösen zu können, solltest du mit Ungleichungen und deren Systemen vertraut sein. Eine Ungleichung ist eine Behauptung, die von einer (oder mehreren) Variablen abhängt. Allerdings behauptet sie nicht, dass zwei Terme gleich sind, sondern dass ein Term größer oder kleiner (oder größer-gleich oder kleiner-gleich) als ein anderer Term ist. Variablenwerte, die eine Ungleichung erfüllen, stellen Lösungen dar. Die Menge aller Lösungen heißt Lösungsmenge. Einfache Ungleichungen kannst du ohne großartigen Formalismus durch ein bisschen Nachdenken (nach Art einer Denksportaufgabe) lösen. Es gibt Verfahren (Äquivalenzumformungen), die gewissen Regeln genügen, systematisch angewandt helfen sie dir beim Auffinden der Lösungsmenge. Um sicher zu gehen, kannst du für einzelne „Lösungskandidaten“ immer die Probe durch Einsetzen machen. Führt sie auf eine wahre Aussage, so handelt es sich tatsächlich um eine Lösung

Allerdings gibt es auch wichtige Unterschiede zwischen Gleichungen und Ungleichungen, die du beachten solltest:

Eine Ungleichung besitzt in der Regel nicht nur eine, sondern viele (unendlich viele, siehe grafischen Lösungsansatz) Lösungen. Um die Menge all dieser Lösungen angeben zu können, sind etwas mehr mathematische Kenntnisse nötig als beim Hinschreiben einer einzigen Zahl. Die Regeln zum Umformen von Ungleichungen (Äquivalenzumformungen) sind etwas komplizierter als die Regeln zum Umformen von Gleichungen. Manchmal führen sie auf Fallunterscheidungen. Um die Lösungsmenge einer Ungleichung zu finden, sind dann mehrere vereinfachte Ungleichungen zu lösen und deren Lösungsmengen zu kombinieren.

Was ist eine Lineare Optimierung?

Ungleichungsprobleme werden manchmal von vornherein in Form mehrerer Ungleichungen gestellt. Diese sollen alle gleichzeitig erfüllt sein (oder – was auch vorkommt – von denen zumindest eine erfüllt sein soll). In solchen Fällen handelt es sich genau genommen um Ungleichungssysteme, aber diese lassen sich von den Ungleichungen weniger scharf trennen als Gleichungssysteme von Gleichungen. Auch wenn eine einzige Ungleichung gegeben ist, kannst du durch eine Fallunterscheidung erkennen, dass du mehrere Ungleichungen betrachten musst. All das macht die Sache etwas komplizierter als das Gleichungslösen.

Die lineare Optimierung oder lineare Programmierung beschäftigt sich mit der Optimierung linearer Zielfunktionen über einer Menge, die durch lineare Gleichungen und Ungleichungen eingeschränkt ist. Häufig lassen sich lineare Programme (LPs) zur Lösung von Problemen einsetzen, für die keine speziell entwickelten Lösungsverfahren bekannt sind, beispielsweise bei der Planung von Verkehrs- oder Telekommunikationsnetzen oder in der Produktionsplanung. 

Das ökonomische Prinzip tritt dabei in den Formen des Maximaprinzips und des Minimalprinzips auf. Beim Maximalprinzip möchte man aus einem Bestand an Mitteln (Material, Arbeitsstunden, Kapital etc.) ein möglichst großer Nutzen und/oder Gewinn erzielen. Beim Minimalprinzip soll ein Ziel mit möglichst kleinen Aufwand oder Kosten erreicht werden.

Eine Lineare Zielfunktion, deren Funktionswert maximal oder minimal werden soll und Nebenbedingungen, die die Möglichkeiten einschränken und den Lösungsbereich begrenzen, stehen dabei als mathematische Werkzeuge zur Verfügung.