Histogramm
aus Wikipedia, der freien Enzyklopädie
Ein Histogramm ist die graphische Darstellung der Häufigkeitsverteilung von Messwerten. Man geht dabei von den nach Größe geordneten Daten aus und teilt den gesamten Bereich der Stichprobe in k Klassen auf. Diese müssen nicht notwendig gleich breit sein. Allerdings vereinfachen zumindest im Mittelbereich gleichgroße Klassen die Interpretation. Über jeder Klasse wird ein Rechteck errichtet, dessen Fläche proportional zur klassenspezifischen Häufigkeit ist. Ist die Fläche des Rechtecks gleich der absoluten Häufigkeit, wird das Histogramm absolut genannt, wenn die relativen Häufigkeiten verwendet werden, wird es entsprechend als relativ oder normiert bezeichnet.
Anwendung finden Histogramme in der beschreibenden Statistik und in der Bildverarbeitung. Man verwendet Histogramme dann,
- wenn man vermutet, dass mehrere Faktoren einen Prozess beeinflussen, und man diese nachweisen will
- wenn man sinnvolle Spezifikationsgrenzen für einen Prozess definieren möchte
- wenn man den tatsächlichen Verlauf der Häufigkeitsverteilung sehen möchte und nicht nur Einzeldaten, wie den Mittelwert und die Standardabweichung
Inhaltsverzeichnis |
[Bearbeiten] Konstruktion eines Histogramms
Um ein Histogramm zeichnen zu können, muss eine genügend große Anzahl an Messwerten einen sinnvollen Verlauf ergeben. Drei Kennzeichen eines Histogramms können zu dessen Beurteilung herangezogen werden:
- der allgemeine Kurvenverlauf
- die Streuung
- die Zentrierung
Ist die Variation innerhalb des Prozesses zufällig, so ergibt sich eine "normale" Kurve, auch Glockenkurve genannt. Zukünftige Werte können in diesem Fall gemäß der Standardabweichung vorhergesagt werden. Andere Verteilungskurven sind möglich, aber weniger üblich.
Anzahl der Messungen | Balkenzahl |
---|---|
<50 | 5 bis 7 |
50 bis 100 | 6 bis 10 |
100 bis 250 | 7 bis 12 |
>250 | 10 bis 20 |
Gegebenenfalls kann man die Anzahl der Balken k auch nach der Sturgess-Regel (1926) berechnen zu
Alternativ kann die Klassenbreite h mit der Regel nach Scott (1979)
oder der Regel nach Freedman und Diaconis (1981)
berechnet werden. Dabei sind σ die Standardabweichung, n die Anzahl der Messungen und Q3 − Q1 der Interquartilsabstand.
Die Sturgess-Regel sollte nicht mehr verwendet werden, da sie die Streuung nicht berücksichtigt.
[Bearbeiten] Beispiel für ein Histogramm
Es liegen für 32 europäische Länder als Indikator für den Wohlstand die Zahlen der PKWs pro 1000 Einwohner vor. Die Werte werden in Klassen eingeteilt wie folgt.
j | Zahl der PKW pro 1000 | Zahl der Länder absolute Häufigkeit nj |
Klassenbreite dj |
Säulenhöhe hj = nj/dj |
1 | über 0 - bis 200 | 5 | 200 - 0 = 200 | 0,025 |
2 | über 200 bis 300 | 6 | 100 | 0,06 |
3 | über 300 bis 400 | 6 | 100 | 0,06 |
4 | über 400 bis 500 | 9 | 100 | 0,09 |
5 | über 500 bis 700 | 6 | 200 | 0,03 |
Σ | 32 |
Da die Fläche einer Säule gleich der Häufigkeit nj ist, errechnet sich die Höhe der Säule hj als
mit dj als Klassenbreite.
In der Regel gibt man bei einem Histogramm die Ordinate nicht an, weil man sonst versucht ist, die Höhe einer Säule anstatt ihrer Fläche als Häufigkeit zu interpretieren. Sind dagegen alle Klassen gleich breit, kann man für die Höhe der Säule die Klassenhäufigkeit nj verwenden, also
- hj = nj.
Hier könnte dann die Ordinate angegeben werden.
[Bearbeiten] Histogramm in der Bildverarbeitung
In der digitalen Bildverarbeitung versteht man unter einem Histogramm die statistische Häufigkeit der Grauwerte bzw. der Farbwerte in einem Bild. Das Histogramm eines Bildes erlaubt eine Aussage über die vorkommenden Grau- bzw. Farbwerte und über Kontrastumfang und Helligkeit des Bildes. In einem farbigen Bild kann entweder ein Histogramm über alle möglichen Farben oder drei Histogramme über die einzelnen Farbkanäle erstellt werden; letzteres ist meist sinnvoller, da die meisten Verfahren auf Grauwertbildern basieren und so die sofortige Weiterverarbeitung möglich ist.
Ein Histogramm visualisiert die Verteilung der Helligkeitswerte eines Bildes. Über einer Achse, die den Wertebereich der Farbwerte darstellt, sind als Balken die einzelnen Häufigkeiten des Vorkommens der Farbwerte aufgetragen. Je höher der Balken über einem Farbwert ist, desto häufiger kommt dieser Farbwert im Bild vor.
Histogramme findet man häufig im Bereich der digitalen Fotografie. Gut ausgestattete digitale Fotoapparate zeigen auf dem Display während der Motivsuche als Hilfe für ein ausgewogeneres Bild in Echtzeit oder für bereits gespeicherte Aufnahmen ein Histogramm an. Das Betrachten eines Histogramms erlaubt es dem Fotografen, das Ergebnis oder das geplante Foto genauer zu kontrollieren, als es das Kameradisplay erlaubt. Zum Beispiel kann man typische Fehler wie Unter- und Überbelichtung erkennen und diese durch entsprechende Belichtungskorrektur beheben. Da die Helligkeit und v.a. Kontrastumfang des Bildes bei der späteren Bearbeitung und Verwertung eine große Rolle spielen, lohnt es sich beim Fotografieren, auf die Histogrammanzeige zu achten.
Eine klassische Anwendung von Histogrammen in der Bildverarbeitung liegt in der Egalisierung (engl. equalizing), bei der das Histogramm mit einer Egalisierungsfunktion transformiert wird. Dadurch kann eine bessere Verteilung der Farbgebung erreicht werden, die über eine bloße Kontrastverstärkung hinausgeht.
[Bearbeiten] Beispiel High-key- und Low-key-Fotografie
Bei Low-key-Aufnahmen konzentrieren sich die Details in den niedrigen Tonwerten. Der Ausschlag ist demnach im unteren Bereich am stärksten. (Es liegen viele Pixel mit niedrigen Tonwerten vor.)
Für High-key-Aufnahmen gilt das Gegenteil, also viele Pixel mit hohen Tonwerten und kaum ein Ausschlag in den niedrigen Tonwerten.