Diskuto:Ideogramo

El Vikipedio

ZHU Xin diris al mi ke li volas skribi artikolojn pri ĉinaj literoj, sed la vikio ne akceptas la karakterojn de lia klavaro (li loĝas en Ĉinio). Kiel li povas enmeti ilin? --Chuck SMITH

Nu, kelkaj demandoj:

- Unue, Xin, kiun foliumilon vi uzas? Netscape 4.x, ekz, estas fifama por fuŝoj pri Unikodo.
- Ĉu eblas kopii karakterojn el alia programo anstataŭ rekte entajpi?
- Ĉu la karakterojn eniras ĝuste, sed fuŝas/malaperas kiam vi alklakas "Antaŭrigardo"? Aŭ ĉu ili miseniras (ekz, kiel skatoloj anstataŭ karakteroj, aŭ simple neniel?)
- Ĉu iuj karakteroj fuŝas, sed aliaj ĝustas? Aŭ ĉu ĉiu fuŝas? (Estas ia problemo kun la viki-programo kiu mem fuŝas iujn karakterojn post ĝusta eniro)

Mia propra proveto: 世界语 (kopiitaj, ĉar mi ne havas ĉinan enir-metodon je mia komputilo...) --Brion VIBBER

Alia proveto mia montras certan fuŝadon en la vikio. La malsupraj signoj ŝance funkcias, sed inter aliaj ;耳 (er3 - orelo) kaj 聋 (long2 - surdeco) fuŝiĝas post antaŭrigardo kiam mi enmetas ilin en la teksto. Mi sendos riparaĵon al la Bomisuloj kiu espereble helpos...

(Fakte estas du problemoj: kelkaj literoj kiam koditaj laŭ UTF-8 havas bitokojn inter 0x80 kaj 0x9f, kiujn pro stulteco la programo mistraktas kvazaŭ memstaraj literoj. Tiu problemo estas facile riparebla, kaj mi sendis la solvon al la Bomisuloj. La alia problemo estas, ke la bitoko 0xb3 havas al la vikiprogramo speciala signifo kiel dosierdivilo -- do kiam la UTF-8aĵo de iu litero enhavas la bitokon 0xb3, ĝi estas tranĉita por ke la dosiero ne fariĝos tute fuŝita pro misdividilo. La solvo por tio estas ŝanĝi la dividilo... sed ne estas facile fari tion post ni havas milojn de paĝojn kun la jam fiksita dividilo! Bedaŭrinde, do, ĉi tiu fuŝo daŭros. Inter la tiel fuŝatoj estas 耳 kaj ó.

Malbedaŭrinde, ĝi malaperos kiam ni konvertos al la nova programo... Nuntempe la konvertado estas en testado kun la pola versio; ni estos testata sekve, kaj baldaŭ, la konvertado por ambaŭ! Hura!)

Intertempe, ja eblas uzi tiujn karakterojn per HTML signoriferenciloj kun la Unikodnombro de la karaktero: ekz 耳 = 耳. Espereble estas ia reta konvertilo por tio. Mi enmetas la signojn en tekstdosieron kodita laŭ UTF-8, kaj ruligas sur tio la jenan programeton Perl-a:

#!/usr/bin/perl -p
# disassemble non-ASCII codes from UTF-8 stream

# borrowed from http://czyborra.com/utf/

#$format=$ENV{"UCFORMAT"}||'<U%04X>';
$format='&#%d;';
s/([\xC0-\xDF])([\x80-\xBF])/sprintf($format,
unpack("c",$1)<<6&0x07C0|unpack("c",$2)&0x003F)/ge;
s/([\xE0-\xEF])([\x80-\xBF])([\x80-\xBF])/sprintf($format,
unpack("c",$1)<<12&0xF000|unpack("c",$2)<<6&0x0FC0|unpack("c",$3)&0x003F)/ge;
s/([\xF0-\xF7])([\x80-\xBF])([\x80-\xBF])([\x80-\xBF])/sprintf($format,
unpack("c",$1)<<18&0x1C0000|unpack("c",$2)<<12&0x3F000|
unpack("c",$3)<<6&0x0FC0|unpack("c",$4)&0x003F)/ge;

Sed, estas iom "uzanto-malamika" maniero fari la aferon!

Iom pli simple, vi povas serĉi la literon en la listo ĉi tie, kaj uzi la Unikodnumeron tie (en la dua kolumo). (Estas tie deksesumaj numeroj, do ekz orelo estas 耳 = &amp#x8033;, kun ikso post la # por indiki la deksesumecon.) --Brion VIBBER

Jason instalis la riparaĵon... Ĉu ĝi funkcias ĝuste?

龙 long2 e9 be 99 (bone!)
� er3 e8 80 b3 (fuŝiĝos pro 0xb3)
聋 long2 e8 81 8b (bone!)
ě e< c4 9b (bone!)
� o' c3 b3 (fuŝiĝos pro 0xb3)

Jes, sufiĉe bone. Por tiuj literoj, kiuj ankoraŭ fuŝiĝas, uzu la HTML-riferencojn (kiel supre). --Brion VIBBER

Elŝutita el "http://eo.wikipedia.org../../../i/d/e/Diskuto%7EIdeogramo_79ca.html"

Diskuto:Ideogramo

El Vikipedio

Views

Navigado

Serĉu