Auswertung (Statistik)
aus Wikipedia, der freien Enzyklopädie
Die (Statistische) Auswertung oder (Statistische Daten-)analyse stellt den vierten Prozess einer Erhebung (Empirie) dar, der nach der Datenaufbereitung abläuft. Wesentliches Ziel der Auswertung ist die Bereitstellung statistischer Ergebnisse für Veröffentlichungen, statistische Datenbanken, CD-ROMs oder (anonymisierte) Mikrodaten.
Neben der Datenerhebung ist die Datenauswertung ein wichtiger Teilbereich der Methoden der empirischen Sozialforschung, d.h. die Frage, wie die erhobenen Daten inhaltlich ausgewertet und analysiert werden. Nur mit Methoden der Datenauswertung ist es möglich, erhobene Daten mit einer Fragestellung bzw. mit einer zu überprüfenden Hypothese in Verbindung zu bringen.
Diese Daten können sowohl empirisch erhoben werden (beispielsweise durch Fragebögen und Umfragen), als auch - z.B. in Form von Dokumenten oder in Datenbanken - bereits gesammelt vorliegen (siehe auch Dokumentenanalyse).
Inhaltsverzeichnis |
[Bearbeiten] Gliederung
nach Hauptbereichen der Statistik:
- Verfahren der deskriptiven Statistik
- Verfahren der inferentiellen Statistik:
- Ist der in der Stichprobe beobachtete Zusammenhang deutlich genug/stark genug, damit sich mit einer geringen Irrtumswahrscheinlichkeit die Annahme verwerfen lässt, in der Grundgesamtheit gebe es keinen Zusammenhang oder Unterschied? Derartige Fragen lassen sich über die Durchführung von sogenannten Signifikanztests beantworten.
nach Anzahl der beteiligten Variablen:
- Univariate Analysemethoden: Univariate Verteilung
- Im Bereich der univariaten Analyse will man Daten zusammenfassend darstellen (deskriptiv), oder man will wissen, wie gut ein Stichprobenkennwert den entsprechenden Parameter der Grundgesamtheit repräsentiert. Diese Fragen lassen sich über sogenannte Punktschätzungen und Intervallschätzungen beantworten.
- Bivariate Analysemethoden: Bivariate Verteilung Interaktive Animation
- Multivariate Analysemethoden: Multivariate Verteilung
nach dem Forschungsansatz:
Die Dichotomie quantitativ vs. qualitativ wird heute nicht mehr so streng gesehen wie zu Zeiten des Positivismusstreits. Vielmehr werden fließende Übergänge zwischen beiden Gruppen von Methoden gesehen; auch werden quantitative mit qualitativen Methoden kombiniert.
[Bearbeiten] Schritte
Statistische Auswertungsverfahren werden vor allem in der quantitativen Sozialforschung eingesetzt. Die Auswertung setzt auswertbare, d.h. (teil-)plausible Einzeldaten voraus und beginnt meistens mit der Erstellung von Tabellen (Tabellierung). Bei Stichprobenerhebungen gehört zur Auswertung auch die Hochrechnung, d.h. der Schluss von einer Stichprobe auf eine Grundgesamtheit. So können z.B. die Ergebnisse einer Unternehmensstichprobe für einen Wirtschaftszweig mit Hilfe von Hochrechnungsfaktoren auf alle Unternehmen des Wirtschaftszweiges hochgerechnet werden. Die hochgerechneten Ergebnisse entsprechen "im Wesentlichen" den Verhältnissen der betreffenden Grundgesamtheit, d.h. sie sind mehr oder weniger mit zufälligen Fehlern behaftet. Eine gute Praxis stellt daher die Fehlerrechnung zur entsprechenden Hochrechnung dar. Sie enthält hauptsächlich Kennzahlen über mögliche Ergebnisschwankungen ((relativer) Standardfehler). Die Fehlerrechnung erleichtert erheblich die Interpretation statistischer Ergebnisse. Statistische Ergebnisse setzen die Teilnahmebereitschaft von Auskunftgebenden voraus. Auskunftgebende, wie z.B. Unternehmen, geben nur dann Auskunft, wenn sie aufgrund ihrer Angaben in den Tabellen nicht reidentifiziert werden können. Diesen Belangen der Auskunftgebenden wird Rechnung getragen, indem vorliegende Ergebnistabellen anonymisiert werden, d.h. Tabellenzellen mit nur einem Auskunftgebenden werden z.B. gelöscht.
Neben der Tabellierung stellen die Überprüfung von Hypothesen mit Hilfe statistischer Methoden, die Formulierung und Berechnung von mathematisch-statistischen Modellen und die Entwicklung von Graphiken weitere wichtige Aktivitäten dar.
Für die o.g. Aufgaben werden mathematisch-statistische Methoden benötigt, die durch (statistische) Standardsoftware bereitgestellt werden.
Datenanalysen finden sowohl in der Marktforschung statt, als auch im Rahmen der Software-Anwendungsentwicklung, wo die Datenanalyse meist mit der Systemanalyse einher geht und eine der Grundlagen für ein Pflichtenheft darstellt (siehe auch Software-Engineering).
[Bearbeiten] Analysemethoden (Analyseverfahren) in der empirischen Sozialforschung
Statistische Auswertungsverfahren werden vor allem in der quantitativen Sozialforschung eingesetzt. Sie können sowohl dazu dienen, das vorliegende Datenmaterial (Fälle) auf einzelne Merkmale hin zu beschreiben (deskriptive Statistik), die Komplexität des Datenmaterials zu reduzieren (etwa Faktorenanalyse, Clusteranalyse, Multidimensionale Skalierung), aber auch dazu, Schlüsse zu ziehen und Hypothesen zu überprüfen (schließende oder inferentielle Statistik). Darüber hinaus gibt es zahlreiche Verfahren, die Ergebnisse sowohl deskriptiver wie schließender Statistik grafisch aufzubereiten. Die Visualisierung (statistischer Ergebnisse), d.h. die grafische Aufbereitung in Form von Kurven und Graphen, stellt besonders dank computergestützter Verfahren inzwischen eine Methode dar, um die angemessene Interpretation zu erleichtern. Sie wird aufgrund der Möglichkeit, ihre Ergebnisse fehlzudeuten, von Wissenschaftlern oft noch kritisch betrachtet.
- Statistische Analyse
- Komparativ-statistische Analyse
- Dynamische Analyse
- Evolutorische Analyse
[Bearbeiten] Soziometrie und sozialwissenschaftliche Netzwerkanalyse
Die Soziometrie ist ein Verfahren Netzwerke zwischen Akteuren zu untersuchen. Von der Soziometrie ist, aufgrund einer anderen theoretischen Perspektive, die sozialwissenschaftliche Netzwerkanalyse zu unterscheiden, die sich erst in den 70er Jahren als eigenes Paradigma etablierte. Wenn keine zusammenhängenden Netzwerke, sondern nur einzelne Akteure und deren Netzwerk untersucht werden, spricht man von egozentrierter Netzwerkanalyse. Die Soziometrie versucht soziales Handeln nicht individualisiert wie manche quantitative Befragungsmethoden zu untersuchen. Bei der Netzwerkanalyse geht es darum, Zusammenhänge zwischen sozialem Handeln und den Strukturen des Netzwerks der Akteure zu erforschen.
[Bearbeiten] Analyse einzelner Größen
[Bearbeiten] siehe auch
Statistischer Test, Statistische Signifikanz, Schließende Statistik, Schätzfunktion, Statistisches Schätzverfahren, Statistischer Test, Methode der kleinsten Quadrate, Schätzer, Erwartungstreue, Konsistenz (Statistik), Stochastische Konvergenz, Deskriptive Statistik
Nach der Auswertung folgt die Ergebnispräsentation.
[Bearbeiten] Weblinks
- Artikel "Business Intelligence for better decisions - Datenanalyse im Wandel" von Peter Gentsch
Mathematisch-statistische Methoden
- http://www.statsoft.com/textbook/stathome.html guter Überblick der wichtigsten statistischen Verfahren.
- http://www.statistik.tuwien.ac.at/public/dutt/vorles/inf_bak/node1.html Zusammenhängender Text über die Grundlagen
- http://mathworld.wolfram.com/topics/ProbabilityandStatistics.html
- http://www.mathe-online.at/mathint/lexikon/index.html Das Lexikon ist eher auf die Mathematik ausgerichtet.
- Online-Tutorium "Recurrence Plot" (Flash-Animation) mit Beispielen
Statistische Software: siehe dort
Datenanalyse im Bereich Data-Mining / Knowledge Discovery / Knowledge Discovery in Databases (KDD) / Maschinelles Lernen
- Intelligent Data Analysis (IDA), internationale Zeitschrift
- International Symposium on Intelligent Data Analysis (IDA-2005), internationale Tagung
- http://sf.yale.net/ YALE (Yet Another Learning Environment), Open Source Software - Gratis, Umgebung für Maschinelles Lernen, Data-Mining und Knowledge Discovery (Wissensentdeckung), die auch statistische und andere Verfahren zur Datenanalyse bereitstellt
Weitere Informationen über Datenanalyse
- Webseite Portal datenanalyse.org, Informationen rund um das Thema Datenanalyse