|
Die multiple Streudiagrammanalyse in PS-Explore ist ein exploratives visuelles Datenanalyseinstrument, welches es erlaubt mehrere i.d.R.
kontinuierliche - aber auch ordinale und klassifikatorische - Merkmale in einer Gesamtschau von zu einer grafischen Matrix zusammengestellten bivariaten Streudiagrammen zu betrachten und zu
analysieren. Die Grundidee der multiplen Streudiagramme geht dabei zurück auf sog. Draftman´s Displays, wie sie etwa von Chambers/Cleveland/Kleiner/Tukey in
Graphical Methods for Data Analysis (Wadsworth, Belmont, California, 1983) beschrieben wurden.Die multiplen Streudiagramme beziehen jedoch zusätzlich eine Vielzahl ganz unterschiedlicher statistischer
und grafischer Methoden mit ein, so dass dieses Verfahren zu einem sehr universellen explorativen Datenanalysewerkzeug wird. So z.B. können in der Hauptdiagonalen der Streudiagrammmatrix, verschiedene
univariate Grafiken eingeblendet werden, die Aufschluss geben über Verteilung der jeweiligen Einzelmerkmale. Hierzu gehört etwa das Boxplot, anhand dessen man sofort auch Informationen über das Vorhandensein von Ausreißern
erhält. Ebenso kann in der Hauptdiagonalen die multiple Korrelation eingeblendet werden, sodass für jedes Merkmal auch gleich dessen Bezug zu allen anderen Merkmalen des Diagramms numerisch bewertet
werden kann.Die untere Dreiecksmatrix gibt im Standardfall die Produkt-Moment-Korrelationen zu den entsprechenden paarweisen Kombinationen der Merkmale im bivariaten Streudiagramm wieder. Da in den
einzelnen bivariaten Streudiagrammen wahlweise Regressionslinien nach dem least-square oder resistant-line Ansatz eingeblendet werden können, ist es ergänzend möglich, in der unteren Dreiecksmatrix auch
Residuendiagramme darstellen zu lassen. Im Streudiagramm können neben den Regressionslinien auch die Hauptkomponenten und der sich hieraus ergebende Ellipsoid dargestellt werden (-> Faktorenanalyse). Für den Fall
nicht-linearer Zusammenhänge zwischen zwei Merkmalen ist es möglich statt der Regressionsgeraden auch polynome höheren Grades berechnen zu lassen. Zur statistischen Absicherung nicht linearer Verläufe können
Test auf Nicht-Linearität durchgeführt werden. Ebenso können die Korrelationen auf Signifikanz geprüft |