Multidimensionale Skalierung
aus Wikipedia, der freien Enzyklopädie
Die Multidimensionale Skalierung (MDS) ist eine Sammlung spezieller statistischer Rechenverfahren. Sie stellt Objekte auf Basis ihrer (Un-)Ähnlichkeit zueinander in einem zwei oder mehrdimensionalen Raum dar. Die Distanzen zwischen Punkten im Raum geben die Unähnlichkeit zweier Objekte wieder (Borg & Staufenbiel, 1997). Die klassische MDS ist verwandt mit der Hauptkomponentenanalyse. Das Verfahren geht zurück auf den Psychologen Warren S. Torgerson.
Die MDS wird auch Ähnlichkeitsstrukturanalyse genannt. Ihr formales Ziel ist es, die Objekte räumlich so anzuordnen, dass die Abstände (Distanzen) zwischen den Objekten im Raum möglichst exakt den erhobenen Un-/ Ähnlichkeiten entsprechen. Der Lösungsraum der MDS, die sogenannte Konfiguration, hat in den meisten Fällen zwei Dimensionen, was die Darstellung auf dem Papier und die Interpretierbarkeit erleichtert. Statistikprogramme können die MDS laufen lassen.
Neben der räumlichen Konfiguration von Objekten, liefert die MDS eine Reihe von Kennziffern (z.B. Stress, RSQ, siehe unten), die die Güte der Messung des Wahrnehmungsraumes beurteilen lassen. Abweichungen schlagen sich in der Erhöhung des Stress-Maßes und der Verringerung des RSQ nieder.
Es werden Informationen über Paare von Objekten erhoben, um daraus metrische Informationen über die Objekte zu ermitteln. Die Distanzen zwischen ihnen in der Konfiguration sollen die Ähnlichkeitsurteile zu den Objektpaaren widerspiegeln. Dabei unterschiedet man verschiedene Distanzmetriken.
[Bearbeiten] Iterativer Prozess der nichtmetrischen MDS
Die Verwendung der euklidischen Metrik hat den Vorteil, dass sie die Interpretation der Konfiguration erleichtert, da die Distanzen zwischen den Objekten Luftlinien entsprechen. Bei der Bestimmung der Konfiguration verwendet die MDS einen iterativen Prozess. Neben den (wie auch in Faktorenanalysen verwendeten) euklidischen Distanzmaßen, kommen auch solche der Manhattan-Metrik zum Einsatz.
Alle Objekte werden zunächst willkürlich im Raum angeordnet und im nächsten Schritt die Distanzen zwischen den Objekten mit deren Ähnlichkeiten verglichen. Wenn nun zwei Objekte im Verhältnis zu ihrer Ähnlichkeit zu weit auseinanderliegen, werden sie aufeinander zu geschoben. Zwei eher unähnliche Objekte, die zu nahe bei einander liegen, bewegt man voneinander weg und setzt das fort, bis die Konfiguration der Objekte die erhobenen Ähnlichkeiten zufriedenstellend widerspiegelt. Hierzu monotone Regression ((.Halbsatz?.)).
[Bearbeiten] Gütekriterium der Messung
- STRESS und RSQ (R²)
Ziel des Verfahrens ist eine optimale Anpassung der MDS-Lösung an die Rohdaten und somit ein möglichst geringer STRESS. Dieser Wert ist als Unterschied zwischen Disparität und Distanz zu verstehen. Wenn der STRESS der Konfiguration klein genug ist oder sich nicht mehr wesentlich verändert hat, wird nach dem letzten Optimierungsschritt die Iteration abgebrochen und das Ergebnis der MDS ausgegeben.
Der STRESS berechnet sich als Wurzel aus der Summe der quadrierten Abweichungen der Disparitäten von den Distanzen, geteilt durch die Summe der quadrierten Distanzen.
Prinzipiell gibt es keine exakten Vorgaben dafür, welcher STRESS-Wert noch akzeptabel ist und welchen man als „gut“ bezeichnen kann. „Um überhaupt eine Norm zu haben, hat man die ‚nullste aller Null-Hypothesen’ untersucht und tausende von Zufallsdaten per MDS skaliert und dabei registriert, welche Stress-Werte sich ergeben“ (vgl. BORG/ STAUFENBIEL 1989).
Kruskal hat in seinen Arbeiten Anhaltswerte für den STRESS-Wert erstellt, an denen man sich orientieren kann:
Anpassungsgüte | STRESS 1 | STRESS 2 |
---|---|---|
gering | 0,2 | 0,4 |
ausreichend | 0,1 | 0,2 |
gut | 0,05 | 0,1 |
ausgezeichnet | 0,025 | 0,05 |
perfekt | 0 | 0 |
Neben dem STRESS wird ein weiteres Maß als Gütekriterium für die Anpassung der Konfiguration an die Rohdaten betrachtet: RSQ (auch R² genannt). R² ist die quadrierte Korrelation der Distanzen mit den Disparitäten und als Pegel der linearen Anpassung der Disparitäten an die Distanzen zu sehen. In der Praxis gelten Werte, die größer sind als 0,9 für R²/ RSQ als akzeptabel.
[Bearbeiten] Literatur
- Torgerson, W. S. (1958). Theory & Methods of Scaling. New York: Wiley.
- Borg, I. & Staufenbiel, Th. (1997). Theorien und Methoden der Skalierung. Bern: Huber.
- Backhaus, Erichson, Plinke, Weiber (2000). Multivariate Analysemethoden Berlin: Springer Verlag
- Mathar, R. (1997). Multidimensionale Skalierung Stuttgart: Teubner
- Borg, I. & Groenen, P. (2005). Modern Multdimensional Scaling: Theory and Applications. New York: Springer.