Digraph (Linguistik)
aus Wikipedia, der freien Enzyklopädie
In der Graphematik bezeichnet Digraph im weiteren Sinne zwei Buchstaben (Grapheme), die sich einem Phonem zuordnen lassen (z. B. die Konsonantenbuchstabenkombination ng im Deutschen dem Phonem /ŋ/). Ebenso als Digraph wird eine Buchstabenkombination bezeichnet, die sich einer Phonemkombination zuordnen lässt, wenn deren Bestandteile nicht eindeutig und getrennt voneinander auf die Bestandteile der Buchstabenkombination bezogen sind (z. B. ch im Englischen der Phonemkombination /tʃ/ - es wäre nicht sinnvoll, das c dem /t/ und das h dem /ʃ/ zuzuordnen).
Manchmal wird der Begriff auch nicht in diesem phonographischen Sinne gebraucht. In einem phonemunabhängigen graphematischen Ansatz, der aber (aus distributionellen Gründen) davon ausgeht, dass ein Graphem aus mehreren Buchstaben (Graphen/Glyphen) bestehen kann (und z. B. ch und qu als jeweils ein Graphem bewertet), wird Digraph als Bezeichnung für solch ein Graphem verwendet (ohne dass damit schon etwas über die Zuordnung zu Phonemen gesagt wäre).
Im engeren Sinne sind Digraphen die Buchstabenpaare, die in einer Sprache als so eng zusammengehörig betrachtet werden, dass sie zum Beispiel auch bei der alphabetischen Sortierung wie ein Buchstabe behandelt werden. Dieser Gebrauch des Begriffes kann aber vom ersten abweichen. Die Vorkommen in der alphabetischen Sortierung garantiert noch nicht, dass es sich bei der zugehörigen Lautung um ein Phonem (oder eine Phonemkombination im obigen Sinne) handelt. (Es lässt sich z. B. darüber streiten, ob dž im Kroatischen ein Digraph im ersten Sinne ist. Das hängt auch von der vorausgesetzten Phonemdefinition ab. Wenn man /dʒ/ im Kroatischen als zwei Phoneme wertet, lassen sich die Bestandteile der Laut- und Buchstabenkombination eindeutig zuordnen - d zu /d/ und ž zu /ʒ/ -, und dž ist dann genauso wenig ein Digraph wie z. B. dr.)
Lateinische Digraphen werden auch für die Transliteration und Transkription der kyrillischen und anderer Schriften benutzt. Außerdem dienen sie vielfach der Darstellung von diakritischen Zeichen (vgl. tschech. č, ř mit poln. cz, rz), wenn diese selbst etwa aus technischen Gründen nicht zur Verfügung stehen.
[Bearbeiten] Trigraph, Tetragraph, Pentagraph …
Entsprechend wird der Begriff „Trigraph“ für eine Kombination aus drei Buchstaben gebraucht (z. B. sch im Deutschen und Schwedischen für das Phonem /ʃ/, ieh im Deutschen für /i:/). Die Reihe lässt sich beliebig fortsetzen: „Tetragraph“ (z. B. ough im Englischen für /ɔ:/ in brought, zsch für /tʃ/ in Eigennamen wie Zschopau), „Pentagraph“ (z. B. tzsch für /tʃ/ in Eigennamen wie Nietzsche) usw. Als „Heptagraph“ lässt sich schtsch zur Transkription des Russischen Graphems „щ“ bezeichnen, wenn man davon ausgeht, dass im modernen Russisch dieses Graphem als ein Phonem /ʃʲ:/ (früher [ʃʲtʃʲ]) gesprochen wird.
[Bearbeiten] Beispiele
Beispiele für Mehrgraphe (und andere Buchstabenkombinationen):
1. Mehrgraphe (für einen Laut), deren Aussprache sich synchron nicht oder nur teilweise aus der Aussprache der Einzelbuchstaben begründen lässt,
2. Mehrgraphe (für einen Laut), deren Aussprache sich aus einer in der jeweiligen Sprache geltenden, allgemeinen Ausspracheregel für die Kombination der Einzelbuchstaben ergibt (produktive, potenziell reihenbildende Regel),
3. Mehrgraphe und andere besondere Buchstabenverbindungen für Lautkombinationen (für Diphthonge, Affrikaten und andere), deren Aussprache sich nicht aus einer in der jeweiligen Sprache geltenden, allgemeinen Ausspracheregel für die Kombination der Einzelbuchstaben ergibt.
(Mehrgraphe/Buchstabenkombinationen mit einem eigenen Platz im Alphabet sind fett gesetzt.)
- Albanisch
- dh, gj, ll, nj, rr, sh, th, xh, zh
- Dänisch
- aa
- Deutsch
- 1. ch, sch, ph, ng, ie, ou, (nur als Ersatz für ä, ö, ü, ß und in Eigennamen:) ae, oe, ue, sz; 2. bb, dd, ff, ..., ss, ck, tz, dt, aa, ee, oo, ah, äh, eh, ih, ..., th, gh, dh, ...; 3. äu, ei, eu, chs, dsch, (nur in Eigennamen:) zsch, (nur am Stammanfang:) sp und st, (nur im Wortinnern vor Vokal:) ti, (nur am unbetonten Wortende:) ig
- I-Kiribati
- ng
- Kroatisch, Serbisch (lateinische Schrift)
- dž;, lj, nj
- Kurdisch
- xw
- Niederländisch
- ij
- Polnisch
- ch, cz, sz, rz, dz, dż, dź
- Schwedisch
- 1. sj, tj, sch, ng, (nur am Stammanfang:) dj, gj, hj, kj, lj, skj, stj, (nur am Stammanfang vor e, i, y, ä, ö:) sk, (nur im Wortinnern vor Vokal, außer i:) ti, si, ssi; 2. bb, dd, ff, ..., ck, rd, rl, rn, rs, rt; 3. (nur zwischen Vokalen und am Wortende:) gn
- Spanisch
- ch, ll
- Tschechisch
- ch
- Ungarisch
- 1. gy, ly, ny, ty, sz, zs, (nur in Eigennamen:) eö; 2. bb, cc, dd, ff, ..., ggy, ssz, ..., (nur in Eigennamen:) cz; 3. cs
[Bearbeiten] Zeichenkodierung
Unicode hat aus Kompatibilitätsgründen einigen wenigen lateinischen Digraphen eigene Codes zugewiesen:
U+01C6 | U+01C9 | U+01CC | U+01F3 | Position |
---|---|---|---|---|
dž | lj | nj | dz | Darstellung als Digraph |
dž | lj | nj | dz | Einzelbuchstaben |