Diskussion:GB18030
aus Wikipedia, der freien Enzyklopädie
Notizen (für mich sebst und alle, die hier weiterschrauben wollen)
- Die Anzahl der Zeichen scheint mir zu klein.
- Der Unterschied Zeichenvorrat/Zeichenkodierung müsste gerade in diesem Artikel herausgearbeitet werden
- Die erwähnten Fonts sind m.E. alles Unicode-Fonts (die die SIP [teilweise] enthalten), die Unterstützung von in GB18030 kodierten Texten erfolgt durch das Betriebssystem
- http://www.info.gov.hk/digital21/eng/hkscs/download.html
- http://www.info.gov.hk/digital21/eng/structure/ide_iso.html
Pjacobi 16:28, 15. Sep 2005 (CEST)
Laut Chinesische Zeichenkodierung sind nicht 27.484, sondern 110000 Zeichen kodiert.
GB18030 kann alle Unicode-Codepoints darstellen, d.h. 17 * 256 * 256 - ein paar zerquetschte. Die meisten dieser Codepoints sind noch nicht zugeordnet. Ca, 98.000 Zeichen (ohne Steuerzeicchen, Private Use und Seltsames) sind Unicode 4.1 -und damit auch in GB18030- definiert. Davon sind 64.000 CJK-Ideogramme (24.000 in der BMP und 40.000 in der SIP), Platz für weitere 24.000 CJK-Ideogramme ist quasi reserviert. --Pjacobi 20:50, 29. Okt 2005 (CEST)
Sind Mappings für die definierten Unicode-Zeichen (etwa 90000) festgelegt, oder gibt es Mappings für alle potentiellen Unicode-Codepoints (1,1 Mill.)? Das sollte im Artikel klar herausgearbeitet werden.
Alle Codepoints, die Zuordnung ist algorithmisch (bis auf gewisse Legacy-Bereiche). --Pjacobi 14:12, 11. Nov 2005 (CET)