Pengkodean karakter
Dari Wikipedia Indonesia, ensiklopedia bebas berbahasa Indonesia.
Pengkodean karakter (Bahasa Inggris: character encoding), kadang disebut penyandian karakter atau set karakter, terdiri sandi atau kode yang memasangkan serangkaian karakter berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan natural, oktet atau denyut elektrik, untuk memfasilitasi penyimpanan teks pada komputer dan transmisi teks melalui jaringan telekomunikasi. Contoh umum adalah sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf, serta ASCII, yang menyandikan huruf, numeral, dan simbol-simbol lain, sebagai integer dan versi biner 7-bit dari integer tersebut, umumnya ditambahkan nol-bit untuk memfasilitasi penyimpanan dalam bita 8-bit (oktet).
Pada masa-masa awal komputer, pengenalan set karakter seperti ASCII (1963) dan EBCDIC (1964) mengawali proses standardisasi. Keterbatasan kumpulan tersebut mulai tampak, dan beberapa metode ad-hoc dikembangkan untuk memperluas mereka. Kebutuhan untuk mendukung berbagai sistem tulisan, termasuk keluarga CJK dari skrip Asia Timur, membutuhkan dukungan untuk jauh lebih banyak karakter dan menuntut pendekatan sistematik untuk penyandian karakter, dan bukan pendekatan ad-hoc seperti sebelumnya.
[sunting] Pranala luar
- (en) Character sets registered by Internet Assigned Numbers Authority
- (en) Unicode Technical Report #17: Character Encoding Model
- (en) ICU Converter Explorer
- (en) The Cyrillic Charset soup
- (en) Early history of character set standardization
- (en) A complete introduction to Japanese character encodings
- (en) A tutorial on character code issues
- (en) Online Char (ASCII), HEX, Binary, Base64, etc... Encoder/Decoder with MD2, MD4, MD5, SHA1+2, etc. hashing algorithms
![]() |
Artikel mengenai perangkat lunak ini adalah suatu tulisan rintisan. Anda dapat membantu Wikipedia mengembangkannya. |