SAMPA
aus Wikipedia, der freien Enzyklopädie
SAMPA oder SAM-PA [ˈsæmpə] (Abk. für Speech Assessment Methods Phonetic Alphabet [spiːtʃ əˈsɛsmənt ˌmɛθədz fəʊˈnɛtɪk ˈælfəbɛt]) ist die Kurzbezeichnung für ein ASCII-basiertes phonetisches Alphabet.
SAMPA wurde ursprünglich 1987–1989 im Rahmen des europäischen ESPRIT-Projekts 1541 SAM (Speech Assessment Methods) entwickelt, um die elektronische Übermittlung und Verarbeitung phonemischer Transkriptionen der offiziellen Sprachen der damaligen Europäischen Gemeinschaft (1989: Dänisch, Englisch, Französisch, Deutsch, Italienisch und Niederländisch) zu ermöglichen. Später kamen norwegisch und schwedisch (1992) sowie griechisch, portugiesisch und spanisch (1993) hinzu. Die Entwicklung von SAMPA wurde vom britischen Phonetiker John C. Wells in Abstimmung mit führenden Phonetikern und Ingenieuren der beteiligten Länder entwickelt. In der Phonetik und in der Entwicklung sprachtechnologischer Systeme ist SAMPA seitdem weit verbreitet.
SAMPA ist kein eigenständiges phonetisches Alphabet sondern stellt eine maschinenlesbare und tastaturfreundliche ASCII-Kodierung einer Teilmenge des IPA dar. Diese Teilmenge besteht aus den Symbolen für Phoneme der oben genannten Sprachen, wie sie in Lexika benötigt werden, umfasst aber im Gegensatz zum IPA nicht Symbole für weitere Aussprachedetails. Die Grundlage von SAMPA besteht in einer Zuordnung von 7-Bit-ASCII-Codes zu entsprechenden Symbolen des IPA. Es wurde weitgehend auf Ähnlichkeit mit IPA-Symbolen geachtet, um neben machinenlesbarkeit auch menschliche Lesbarkeit zu unterstützen. Die SAMPA-Transkribierungscodes sind international für die oben genannten Sprachen standardisiert.
Im Gegensatz zu SAMPA, das zu wissenschaftlichen und technologischen Entwicklungszwecken in Phonetik und Sprachtechnologie vereinbart wurde, fokussiert die Unicode-Kodierung des IPA die Reproduktion in Druckerzeugnissen. Problematisch bei der derzeitigen praktischen Verwendung der Unicode-IPA-Kodierung in wissenschaftlichen und sprachtechnologischen Kontexten ist die Unvollständigkeit der Unicode-Tabellen, die Streuung der IPA-Symbole über mehrere Tabellen, sowie das Fehlen von ergonomisch handhabbaren Eingabehilfen.
Um das IPA vollständig zu kodieren, entwickelte Wells 1995 X-SAMPA, eXtended SAMPA.
[Bearbeiten] Literatur
Vollständige Definitionen und Anwendungsbeispiele von SAMPA bzw. X-SAMPA sind in folgenden Handbüchern zu finden:
- Gibbon, Dafydd, Roger Moore und Richard Winski, Hrsgg. (1997). Handbook of Standards and Resources for Spoken Language Systems. Berlin: Mouton de Gruyter.
- Gibbon, Dafydd, Inge Mertins und Roger Moore, Hrsgg. (2000). Handbook of Multimodal and Spoken Language Systems: Resources, Terminology and Product Evaluation. Boston usw.: Kluwer Academic Publishers.
[Bearbeiten] Weblinks
[Bearbeiten] Siehe auch
- Kyrillisches Alphabet (Tabelle der SAMPA-Werte der kyrillischen Buchstaben)
- Thaana (Tabelle der SAMPA-Werte der Buchstaben der Thaana-Schrift)
- IPA (in Wörterbüchern verwendete Lautschrift für alle Sprachen der Welt)