VGSPS
News
QuerySys
StatSys
DBMSys
ToolSys
MiningTree
Kontakt
Downloads
kostenlos 
 testen
Bestellung

Boxplot

Formular zur Einstellung von einfachen und multiplen Boxplots

Das Boxplot ist eine sehr gute Methode zur grafischen Darstellung der wichtigsten Verteilungsmerkmale von Wertausprägungen einer Variablen.

Die meisten Häufigkeitsverteilungen besitzen eine hohe Dichte von Werten in der Mitte und streuen mehr oder weniger in ihren Randbereichen. In der Praxis benötigt man daher zumeist eine Darstellung, die zeigt, wo das Zentrum einer Verteilung liegt und wie weit links und rechts dieses Zentrums sich ein Hauptteil der Daten verteilt (streut). Gleichzeitig soll eine grafische Darstellung der wichtigsten Verteilungseigenschaften einen Eindruck über Symmetrie oder Schiefe der Verteilung geben und nach Möglichkeit auch Details über ihre Randbereiche, d. h. Minimum, Maximum, stark streuende Bereiche und Ausreißer.

Die wichtigsten Eigenschaften einer Verteilung ohne Ausreißer lassen sich bereits mit fünf Werten darstellen (Median, unteres und oberes Quartil, Minimum und Maximum).
Zwischen Median und dem jeweiligen Quartil liegen dabei je 25% der Verteilung, ebenso links des unteren und rechts des oberen Quartils..

Insgesamt erhält man mit einer derartigen Darstellung einen unmittelbaren Eindruck über die wichtigsten Eigenschaften einer Verteilung wie Zentrum, Streuung, Symmetrie, Schiefe.

Häufig beinhaltet eine empirische Verteilung sog. Ausreißer, d. h. Werte, die betraglich so hoch oder so niedrig liegen, daß die Benutzung von Minimum und Maximum, die dann auch gleich Ausreißer sind, das Gesamtbild verfälschen.

Über eine von Tukey vorgeschlagene "Daumenregel" lassen sich Ausreißer leicht identifizieren und in der grafischen Darstellung gesondert behandeln (siehe Abb. unten Klasse Süd!).

Man spricht bei Außenpunkten auch von "einfachen Ausreißern" und bei Fernpunkten von "extremen Ausreißern". Die Einbeziehung der Ausreißer in die Darstellung eines Boxplots wird als "punktiertes Boxplot" bezeichnet.

Eine wichtige und zumeist naheliegende Methode ist es, die zu einem bestimmten

Ergebnisgrafik: multiples Boxplot mit Ausreißern, Vertrauensintervallen und Häufigkeitsverteilung

Merkmal erhobenen Datenwerte in Untergruppen aufzuteilen und in separaten Boxplots darzustellen. Man spricht dann von "multiplen Boxplots".

Zur Darstellung eines multiplen Boxplots benötigt man neben dem eigentlich zu untersuchenden Merkmal noch eine Gruppierungsvariable, deren Einzelausprägungen jeweils ein Boxplot definieren. Die Gruppierungsvariable wird i. d. R. kategorial sein und zweckmäßigerweise nicht beliebig viele Klassen umfassen, da sonst die Anzahl der Boxplots in der multiplen Darstellung zu unübersichtlich wird.
 

[VGSPS]  [News ]  [QuerySys]  [DBMSys]  [StatSys] [ToolSys]  [MiningTree]  [kostenlos testen] [Downloads]   [Auszug Kundenliste]   [Kontakt]  [web-Suche]   [frühere VGSPS-Newsletter]   [Bestellung]

Copyright 2000, VGSPS mbH.       Alle Rechte vorbehalten.       Haftungsausschluss (Disclaimer)