ອິນເຕີເນັດ
From Wikipedia
[ດັດແກ້] ຄວາມຫມາຍຂອງ ອິນເຕີເນັດ
ອິນເຕີເນັດ ຫມາຍເຖິງ ເຄືອຂ່າຍຄອມພີວເຕີນານາຊາດ ທີ່ມີການເຊື່ອມຕໍ່ໄປຍັງສະຖາບັນ ຫຼື ຫນ່ວຍງານຕ່າງໆ ທົ່ວທຸກມຸມໂລກ ເພື່ອອຳນວຍຄວາມສະດວກໃຫ້ແກ່ຜູ້ໃຊ້ທົ່ວໂລກ ເພື່ອຄົ້ນຫາຂໍ້ມູນ ແລະ ດາວໂຫຼດໂປຼແກຼມຕ່າງໆມາໃຊ້ໄດ້ ແລະ ບໍລິການອື່ນໆ ເຊັ່ນ:ຈົດຫມາຍອີເລັກໂຕຼນິກ ຫຼື ທີ່ເອີ້ນກັນທົ່ວໄປວ່າອີເມລ໌(e-mail),ສົນທະນາອອນໄລ ...
[ດັດແກ້] ການແຍກພະຍາງໃນເວັບໄຊພາສາລາວ
ໝາຍເຫດ: ຍົກເວັ້ນແຖວນີ້, ຂໍ້ຄວາມທັງໝົດຂອງບົດຄວາມນີ້ ມີການໃຊ້ໂຄດແຍກພະຍາງ.
ພະຍາງ ແມ່ນສ່ວນໜຶ່ງຂອງຄໍາ. ຄໍາ ແມ່ນພາກສ່ວນຂອງຂໍ້ຄວາມ ທີ່ລົງທ້າຍ ຫຼືຂັ້ນດ້ວຍຍະຫວ່າງ (ຕົວຢ່າງ "ການຂຽນ ການເວົ້າ ແລະອື່ນໆ" ແມ່ນເປັນຂໍ້ຄວາມໜຶ່ງ; ຂໍ້ຄວາມນີ້ ມີ 2 ຄໍາ ຄຶ: "ການຂຽນ", "ການເວົ້າ" ແລະ "ແລະອື່ນໆ"). ພະຍາງ ແມ່ນກຸ່ມຂອງຕົວອັກສອນຕ່າງໆທີ່ປະກອບກັນເຂົ້າ ແລ້ວສາມາດອ່ານອອກສຽງໄດ້ສຽງໜຶ່ງ (ສຽງທີ່ຊໍ້າກັນ ຖືວ່າເປັນສຽງໜຶ່ງ ທີ່ມີການອອກສຽງຫຼາຍກ່ວາໜຶ່ງຄັ້ງ) (ຕົວຢ່າງ "ແລະອື່ນໆ" ເປັນຄໍາໆໜຶ່ງ; ຄໍານີ້ ມີ 2 ພະຍາງ ຄື: "ແລະ" ແລະ "ອື່ນໆ").
ເວັບໄຊພາສາລາວຈໍານວນໜຶ່ງ ມີການໃຊ້ໂຄດແຍກພະຍາງຢູ່ໃນໜ້າເວັບຕ່າງໆຂອງຕົນ. ໂຄດແຍກພະຍາງ ທີ່ມີການນໍາໃຊ້ຢູ່ໃນຟອນຢູນີໂຄດພາສາລາວ ມີໂຄດແມ່ນ 200B (ໂຄດຖານ 16) ແລະມີຊື່ເອີ້ນວ່າ zero-space width (ຍະຫວ່າງທີ່ຄວາມກ້ວາງເທົ່າສູນ). ການໃຊ້ໂຄດແຍກພະຍາງໃນພາສາລາວ ປຽບເໝືອນການແຊກຍະຫວ່າງ ທີ່ມີຜົນການສະແດງ ທີ່ບໍ່ເປັນຍະຫວ່າງຂັ້ນແຕ່ລະພະຍາງ ຊຶ່ງເຮັດໃຫ້ຕົວທ່ອງເວັບຖືວ່າ ພະຍາງໜຶ່ງ ເປັນຄໍາໆໜຶ່ງ. ດັ່ງນັ້ນ, ການສະແດງຜົນຂອງໜ້າເວັບພາສາລາວທີ່ມີການແຍກພະຍາງໄດ້ດີ ຈະບໍ່ມີບັນຫາ ໃນການປະໃຫ້ເກີດມີຊ່ອງຫວ່າງທ້າຍແຖວ ທີ່ກ້ວາງເກີນໄປ: ຖ້າຊ່ອງຫວ່າງທ້າຍແຖວ ບໍ່ພຽງພໍທີ່ຈະບັນຈຸພະຍາງໃດໜຶ່ງ, ພະຍາງນັ້ນໆ ກໍ່ຈະລົງໄປຢູ່ຕົ້ນແຖວຕໍ່ໄປ.
ຕົວທ່ອງເວັບ Internet Explorer (IE) ຂອງ Windows, ບໍ່ສາມາດຈັດການກັບໂຄດແຍກພະຍາງ 200B ຢ່າງມີປະສິທິພາບ ເພາະມັນຈະສະແດງໂຄດແຍກພະຍາງ ໃຫ້ເຫັນເປັນຕາສີຫຼ່ຽມນ້ອຍ ຖ້າວ່າ ໃນການສ້າງໜ້າເວັບນັ້ນໆ ບໍ່ໄດ້ເລືອກຂໍ້ຄວາມພາສາລາວ ໃຫ້ເປັນຟອນຢູນີໂຄດລາວ ຫຼືເຄື່ອງຂອງຜູ້ຊົມທີ່ໃຊ້ເບີ່ງໜ້າເວັບນັ້ນໆ ບໍ່ມີຟອນຢູນີໂຄດລາວ ທີ່ກໍານົດໃນໜ້າເວັບນັ້ນໆ (ຖ້າມີຟອນຢູນີໂຄດລາວມາຕາຖານຕົວອື່ນໆ, ຈະສາມາດເຫັນອັກສອນລາວ ເປັນຕົວລາວຢູ່ ແຕ່ຈະເຫັນໂຄດແຍກພະຍາງ ເປັນຕາສີ່ຫຼ່ຽມນ້ອຍ). ສ່ວນຕົວທ່ອງເວັບຂອງບໍລິສັດອື່ນໆ ຈະບໍ່ມີຈຸດອ່ອນທີ່ວ່າມານີ້.
[ດັດແກ້] ການກຳນົດກຸ່ມອັກສອນ (Charset) ຂອງໜ້າເວັບພາສາລາວ
ໝາຍເຫດ: ຍົກເວັ້ນແຖວນີ້, ຂໍ້ຄວາມທັງໝົດຂອງບົດຄວາມນີ້ ມີການໃຊ້ໂຄດແຍກພະຍາງ.
ກຸ່ມອັກສອນ (Charset) ແມ່ນສ່ວນໜຶ່ງຂອງໂຄດຄໍາສັ່ງໃນການຂຽນໜ້າເວັບ ທີ່ສັ່ງໃຫ້ຕົວທ່ອງເວັບ ໃຊ້ Encoding (ລະຫັດສະແດງຜົນ) ໃດໜຶ່ງ ໃນການສະແດງຜົນສໍາລັບໜ້າເວັບນັ້ນໆ. Charset ທີ່ໃຊ້ໃນໜ້າເວັບພາສາລາວຕ່າງໆ ສາມາດຈັດອອກເປັນ 3 ກຸ່ມຄື:
- ການກໍານົດ charset ທີ່ບໍ່ແມ່ນ unicode ຫຼື utf
ແມ່ນ charset ພື້ນຖານທົ່ວໆໄປ. ຕົວຢ່າງເຊັ່ນ: charset=windows-1252, charset=ISO-8859-1 ແລະອື່ນໆທີ່ບໍ່ແມ່ນ unicode ຫຼື utf ບໍ່ວ່າຈະເປັນ utf-8, utf-16 ຫຼື utf-32.
ການກໍານົດ charset ແບບນີ້, ເມື່ອໂປຣແກຣມທີ່ໃຊ້ສ້າງ HTML ຕ່າງໆ (ຮວມທັງໂປຣແກຣມ Text Editor ທໍາມະດາໆ ເຊັ່ນ Notepad) ເຊັບເປັນໄຟລ໌ HTML, ໄຟລ໌ທີ່ໄດ້ຮັບ ຈະເປັນໄຟລ໌ປະເພດຂໍ້ຄວາມທໍາມະດາ (Plain Text). ໜຶ່ງຕົວອັກສອນໃນໄຟລ໌ ຫຼືໜຶ່ງໂຄດຂອງຄໍາສັ່ງ ຈະກິນເນື້ອທີ່ໃນໄຟລ໌ ພຽງແຕ່ 1 byte. ສໍາລັບອັກສອນລາວຢູນີໂຄດ (U0E81 ຫາ U0EFF), ຈະຖືກເກັບຮັກສາໄວ້ໃນຮູບແບບຂອງຊຸດຕົວອັກສອນທໍາມະດາ ກ ຫາ ໿. ດັ່ງນັ້ນ, ອັກສອນລາວ 1 ຕົວ, ຈະກິນເນື້ອທີ່ເຖີງ 7 bytes (ຕັ້ງແຕ່ &...;).
ຖ້າເຮົາໃຊ້ Notepad ທີ່ມານໍາ Windows 98, Me ເປີດເບີ່ງໄຟລ໌ HTML ພາສາລາວ ທີ່ມີການກໍານົດ charset ແບບນີ້, ອັກສອນລາວແຕ່ລະຕົວ ຈະເປັນຊຸດຕົວອັກສອນທໍາມະດາ ກ ຫາ ໿. ຖ້າເບີ່ງດ້ວຍ Notepad ຂອງ Windows XP ທີ່ສະໜັບສະໜູນຢູນີໂຄດ ແລະປັບ Notepad ໃຫ້ໃຊ້ຟອນຢູນີໂຄດລາວ, ໂຄດອັກສອນລາວ ທີ່ເປັນຂໍ້ຄວາມ ຈະຖືກສະແດງໃຫ້ເຫັນເປັນອັກສອນລາວເລີຍ ແຕ່ໂຄດອັກສອນລາວ ທີ່ຢູ່ໃນໂຄດຄໍາສັ່ງຂອງ HTML ຈະຖືກສະແດງໃຫ້ເຫັນເປັນຊຸດຕົວອັກສອນ ແຕ່ ກ ຫາ ໿ (ແຕ່ຄ່າຂອງອັກສອນລາວໃນໄຟລ໌ ຍັງເປັນ ກ ຫາ ໿ ຄືເກົ່າ).
ການກໍານົດ charset ແບບນີ້, ໜ້າເວັບພາສາລາວທີ່ສ້າງຂື້ນ ຈະກິນເນື້ອທີ່ຫຼາຍກ່ວາໝູ່ ແຕ່ມີຈຸດດີຢູ່ບ່ອນວ່າ, ເມື່ອເບີ່ງດ້ວຍໂປຣແກຣມທ່ອງເວັບ, ບໍ່ວ່າຈະປັບລະຫັດສະແດງຜົນ (Encoding) ໄປເປັນຄ່າໃດກໍ່ຕາມ (ຍົກເວັ້ນ Unicode UTF-16 ແລະ Unicode UTF-32), ຜົນການສະແດງອັກສອນລາວ ກໍ່ຍັງຄົງຕົວໃຫ້ເຫັນເປັນອັກສອນລາວ.
- ການກໍານົດ charset=unicode
ໜ້າເວັບພາສາລາວທີ່ກໍານົດ charset ແບບນີ້, ຈະມີຂະໜາດນ້ອຍກ່ວາໝູ່ ເຖີງວ່າ ຕົວອັກສອນໜຶ່ງຕົວ (ຮວມທັງອັກສອນລາວ) ຈະໃຊ້ເນື້ອທີ່ 2 bytes ແລະເມື່ອເບີ່ງດ້ວຍ Notepad ທີ່ບໍ່ສະໜັບສະໜູນຢູນີໂຄດ (Notepad ຂອງ Windows 98 ຫຼື Me), ອັກສອນລາວ ຈະຖືກສະແດງໃຫ້ເຫັນເປັນ ຊຸດຕົວອັກສອນ ແຕ່ ກ ຫາ ໿ (ໝາຍຄວາມວ່າ Notepad ຈະສະແດງໂຄດຂອງອັກສອນລາວ 0E81 - 0EFF ໃຫ້ເຫັນເປັນ ກ - ໿ ແຕ່ຄ່າຂອງອັກສອນລາວໃນໄຟລ໌ ຍັງເປັນ 0E81 - 0EFF ຄືເກົ່າ). ຖ້າເບີ່ງດ້ວຍ Notepad ຂອງ Windows XP ທີ່ສະໜັບສະໜູນຢູນີໂຄດ ແລະປັບ Notepad ໃຫ້ໃຊ້ຟອນຢູນີໂຄດລາວ, ໂຄດອັກສອນລາວ ທີ່ເປັນຂໍ້ຄວາມ ຈະຖືກສະແດງໃຫ້ເຫັນເປັນອັກສອນລາວເລີຍ ແຕ່ໂຄດອັກສອນລາວ ທີ່ຢູ່ໃນໂຄດຄໍາສັ່ງຂອງ HTML ຈະຖືກສະແດງໃຫ້ເຫັນເປັນຊຸດຕົວອັກສອນ ແຕ່ ກ ຫາ ໿ (ແຕ່ຄ່າຂອງອັກສອນລາວໃນໄຟລ໌ ຍັງເປັນ 0E81 - 0EFF ຄືເກົ່າ).
ຄຸນນະສົມບັດໃນການກໍານົດ charset ແບບນີ້, ໜ້າເວັບພາສາລາວ ຈະຍັງຄົງຕົວໃຫ້ເຫັນເປັນອັກສອນລາວ ບໍ່ວ່າຈະປັບລະຫັດສະແດງຜົນ (Encoding) ໄປເປັນຄ່າໃດກໍ່ຕາມ (ຍົກເວັ້ນ Unicode UTF-16 ແລະ Unicode UTF-32).
- ການກໍານົດ charset=utf-8
ໜ້າເວັບພາສາລາວ ທີ່ມີການກໍານົດ charset ແບບນີ້, ຂະໜາດຂອງໄຟລ໌ ຈະຢູ່ໃນລະດັບກາງ, ໝາຍຄວາມວ່າ ໃຫຍ່ກ່ວາແບບ unicode ແຕ່ນ້ອຍກ່ວາແບບ ທີ່ບໍ່ແມ່ນ unicode ຫຼື utf. ຕົວອັກສອນລາແຕັງໃນໜ້າເວັບທີ່ກໍານົດແບບນີ້, ຈະກິນເນື້ອທີ່ 1 byte ແຕ່ອັກສອນລາວ ຈະກິນເນື້ອທີ່ 3 bytes (E0BA81 ຫາ E0BAFF - ຄ້າຍຄືກໍລະນີຢູນີໂຄດ ແຕ່ມີໂຄດ BA ຂັ້ນທາງກາງ). ການໃຊ້ Notepad ຂອງ Windows 98 ຫຼື Me ເປີດເບີ່ງໜ້າເວັບທີ່ກໍານົດ charset ແບບນີ້, ຈະເຫັນອັກສອນລາວເປັນຊຸດຕົວອັກສອນ 2 ຫຼື 3 ໂຕ ທີ່ຂື້ນຕົ້ນດ້ວຍ ຠແລະລົງທ້າຍດ້ວຍຜົນຂອງການສະແດງຜົນໃນໜ້າຈໍຂອງໂຄດ 81 ຫາ FF (ບາງໂຄດກໍ່ບໍ່ສາມາດສະແດງໃຫ້ເຫັນໃນໜ້າຈໍ). ຖ້າເບີ່ງດ້ວຍ Notepad ຂອງ Windows XP ແລະໃຫ້ມັນປ່ຽນໄປໃຊ້ຟອນຢູນີໂຄດລາວ, ໂຄດອັກສອນລາວ ທີ່ເປັນຂໍ້ຄວາມ ຈະຖືກສະແດງໃຫ້ເຫັນເປັນອັກສອນລາວເລີຍ ແຕ່ໂຄດອັກສອນລາວ ທີ່ຢູ່ໃນໂຄດຄໍາສັ່ງຂອງ HTML ຈະຖືກສະແດງໃຫ້ເຫັນເປັນຊຸດຕົວອັກສອນ ແຕ່ ກ ຫາ ໿ (ແຕ່ຄ່າຂອງອັກສອນລາວໃນໄຟລ໌ ຍັງເປັນ 0EBA81 - 0EBAFF ຄືເກົ່າ).
ການກໍານົດ charset ແບບນີ້, ມີຈຸດອ່ອນຢູ່ບ່ອນວ່າ ເມື່ອເປີດໜ້າເວັບດ້ວຍໂປຣແກຣມທ່ອງເວັບ, ຖ້າເຮົາປ່ຽນ Encoding ໄປເປັນຢ່າງອື່ນ ທີ່ຕ່າງຈາກ utf-8, ອັກສອນລາວກໍ່ຈະບໍ່ເປັນຕົວລາວ.