|
Das Boxplot ist eine sehr gute Methode zur grafischen Darstellung der wichtigsten Verteilungsmerkmale von Wertausprägungen einer
Variablen.
Die meisten Häufigkeitsverteilungen besitzen eine hohe Dichte von Werten in der Mitte und streuen mehr oder weniger in ihren Randbereichen. In der Praxis benötigt man daher zumeist eine
Darstellung, die zeigt, wo das Zentrum einer Verteilung liegt und wie weit links und rechts dieses Zentrums sich ein Hauptteil der Daten verteilt (streut). Gleichzeitig soll eine grafische Darstellung der
wichtigsten Verteilungseigenschaften einen Eindruck über Symmetrie oder Schiefe der Verteilung geben und nach Möglichkeit auch Details über ihre Randbereiche, d. h. Minimum, Maximum, stark streuende Bereiche
und Ausreißer.
Die wichtigsten Eigenschaften einer Verteilung ohne Ausreißer lassen sich bereits mit fünf Werten darstellen (Median, unteres und oberes Quartil, Minimum und Maximum). Zwischen
Median und dem jeweiligen Quartil liegen dabei je 25% der Verteilung, ebenso links des unteren und rechts des oberen Quartils..
Insgesamt erhält man mit einer derartigen Darstellung einen
unmittelbaren Eindruck über die wichtigsten Eigenschaften einer Verteilung wie Zentrum, Streuung, Symmetrie, Schiefe.
Häufig beinhaltet eine empirische Verteilung sog. Ausreißer, d. h. Werte, die
betraglich so hoch oder so niedrig liegen, daß die Benutzung von Minimum und Maximum, die dann auch gleich Ausreißer sind, das Gesamtbild verfälschen.
Über eine von Tukey vorgeschlagene
"Daumenregel" lassen sich Ausreißer leicht identifizieren und in der grafischen Darstellung gesondert behandeln (siehe Abb. unten Klasse Süd!).
Man spricht bei Außenpunkten auch von
"einfachen Ausreißern" und bei Fernpunkten von "extremen Ausreißern". Die Einbeziehung der Ausreißer in die Darstellung eines Boxplots wird als "punktiertes Boxplot" bezeichnet.
Eine wichtige und zumeist naheliegende Methode ist es, die zu einem bestimmten |