עברית באינטרנט
מתוך ויקיפדיה, האנציקלופדיה החופשית
העברית, כשפה הנכתבת מימין לשמאל, הייתה חריגה בשנים הראשונות לקיומו של האינטרנט, שהתפתח בשפות הנכתבות משמאל לימין, ובפרט אנגלית. כתוצאה מכך ניתנו שני פתרונות להצגתם של טקסטים עבריים בדפדפן, עברית ויזואלית (או "עברית חזותית") ועברית לוגית (או "עברית משתמעת").
תוכן עניינים |
[עריכה] עברית ויזואלית
הפתרון הראשון שניתן היה עברית ויזואלית. פתרון זה היה אלתור שבא לתת מענה לבעית השפה העברית בדפדפן בלי להעסיק בכך את מפתחי הדפדפנים הראשונים. בפתרון זה נכתב הטקסט העברי שנועד להצגה בדפדפן משמאל לימין, והצגתו באמצעות גופן מיוחד שפותח למטרה זו. אף שמבחינת מערכת ההפעלה אופיין גופן זה כגופן לטיני (כזה הנכתב משמאל לימין), אותיותיו היו עבריות, והטקסט העברי הוצג כמקובל מימין לשמאל. משתמשי הדפדפנים באותה עת התבקשו להתקין גופן זה במערכת ההפעלה שלהם.
פתרון זה פותח באוניברסיטה העברית, ולאחר מכן פותחו שני גופנים עבריים נוספים למטרה זו. אתרים עבריים שנבנו עד סוף שנות התשעים השתמשו כולם בפתרון זה, ובאתרים עבריים רבים הוא נמצא עד היום. כפתרון מאולתר, יש בפתרון זה בעיות אחדות:
- גודל שורה קבוע וחוסר האפשרות של גלישת שורות. בשינוי גודל המסך הטקסט לא ידע להסתדר מחדש.
- הדפדפן מתייחס לטקסט העברי כאל טקסט לטיני, ולכן כשהוא מחליט שיש לפצל שורה לשתי שורות, סדר השורות מתהפך.
- פיתוח יישומי דפדפן (להבדיל מהצגת דפים סטטיים) אינו נוח.
- לא ניתן להשתמש בכל הגופנים העבריים של מערכת ההפעלה, אלא רק בגופן אחד, אותו גופן שהמשתמש התקין במחשבו.
- הצורך בהתקנה מיוחדת של גופן יצר בעיה למשתמשים מתחילים.
- העתקת טקסט עברי ממעבד תמלילים לדפדפן ולהפך הצריכה היפוך של הטקסט באמצעות תוכנה מיוחדת.
- חוסר תמיכה בניקוד.
[עריכה] עברית לוגית
כאשר חברת מיקרוסופט הצטרפה לשוק יצרני הדפדפנים, היא נתנה פתרון יסודי וטבעי לשפה העברית (ולכל יתר השפות הנכתבות מימין לשמאל), פתרון הקרוי עברית לוגית והוא הפך להיות תקן ב-HTML 4. במסגרת גיור תוכנה זה הותאם הדפדפן להכרה בשפות הנכתבות מימין לשמאל, וכתיבת דף HTML המכיל טקסט עברי נעשית, כמקובל בעברית, מימין לשמאל. פתרון זה פתר את כל הבעיות שבעברית הויזואלית, והפך את העברית לשפה סטנדרטית באינטרנט.
חרף יתרונותיה הרבים של העברית הלוגית, כניסתה לאינטרנט העברי הייתה איטית, הן משום שאתרים מובילים כבר היו כתובים בעברית ויזואלית, והן משום שעברית לוגית נתמכה רק על-ידי הדפדפן של מיקרוסופט, אינטרנט אקספלורר. השתלטותו של הדפדפן "אינטרנט אקספלורר" על שוק הדפדפנים בעולם ובישראל הביאה למעבר הדרגתי של אתרים לעברית לוגית, ומתחילת שנות האלפיים מפותחים אתרים עבריים חדשים רק בעברית לוגית. מעבר של אתרים ותיקים מעברית ויזואלית לעברית לוגית נעשה באיטיות, עקב מאמץ ההסבה הכרוך בכך. האתר של עיתון "הארץ", למשל, עבר לעברית לוגית רק בתחילת 2004. אחד האתרים הבולטים המשתמשים עדיין בעברית ויזואלית הוא אתר "סנונית" (שבמסגרת הקמתו נוצרה העברית הויזואלית).
העברית לפי תקן יוניקוד היא לוגית בלבד. לפיכך, דף אינטרנט עברי בקידוד UTF-8 (כמו כל הוויקיפדיה העברית) יהיה בעברית לוגית. קידוד windows-1255, עברית של חלונות, גם הוא מתייחס לעברית לוגית, וכך גם iso-8859-8-i. רק iso-8859-8 (בלי i בסוף) הוא הדרך לציין שהעברית בדף היא ויזואלית.
גרסה 6.1 של הדפדפן "נטסקייפ נויגייטור" היא הגרסה הראשונה של דפדפן זה שתומכת בעברית לוגית, ובכך נפתחה גישה לאתרים הבנויים בשיטה זו גם למשתמשים במערכות הפעלה שבהן "אינטרנט אקספלורר" אינו פועל. וכן דפדפנים חדשים כגון מוזילה ואופרה תומכים בעברית לוגית מן היסוד. לצורך תאימות לאחור תומכים כל הדפדפנים גם בעברית ויזואלית (על שרת האינטרנט או דף האינטרנט עצמו לציין את הקידוד הנכון. כמו כן קורא הדף יכול לשנות בעצמו את הקידוד בו משתמש הדפדפן להצגת הדף במידת הצורך).
[עריכה] הבעיה בתקופה שלפני האינטרנט
הסוגיה של עברית חזותית לעומת עברית לוגית, אף על פי שהיא מוצאת את ביטויה הבולט ביותר באינטרנט, אינה מוגבלת לאינטרנט גרידא, אלא כל ההיסטוריה של המחשוב העברי הושפעה ממנה. בתחילת ימי המחשוב העברי משלה העברית החזותית בכיפה. בימי DOS שימשו העברית החזותית והמשתמעת בערבוביה (למשל, מעבד התמלילים QText השתמש בעברית חזותית בעוד שאיינשטיין השתמש בעברית משתמעת), ובמעבר לחלונות כולם עברו לעברית משתמעת בשימוש היומיומי.
[עריכה] לטיניזציה (ליטון) של עברית
ערך מורחב – ליטון של עברית
עקב הבעיות הצצות לפעמים בכתיבת או קריאת עברית בקידוד בלתי מתואם בין משתמשים, משתמשים רבים החלו להשתמש באלפבית הלטיני לשם התכתבות בעברית באינטרנט. שימוש זה נפוץ בעיקר בהתכתבויות דואר אלקטרוני ובתוכנות מסרים מידיים כגון ICQ. כתיבת העברית בלטיניזציה מתרחשת באינטרנט בדרך-כלל לא על-פי תקן כלשהו אלא מוגדרת בצורה דינמית אד-הוק בין זוג משתמשים. קיימים תקנים רשמיים, אך אף אחד מהם אינו מוכר לכלל הציבור. כתיבת אתרי אינטרנט בלטיניזציה אינה פופולרית, עקב חוסר הסטנדרטיזציה ועקב ההתיחסות ללטיניזציה כתחליף צולע לכתב העברי.
[עריכה] ראו גם
[עריכה] שמות דומיין בעברית
כיום ניתן לרשום דומיינים גם בשפה העברית, שייראו בצורה של com.השם-שלך או net.השם-שלך, ללא צורך בהקשה של http://www. אפשרות זו פותרת בעיות תעתיק לאנגלית, כגון במקרה של מילה עברית שבה למשל האותיות ח', כ' או ק'.
שמות דומיין בכתב עברי, לדוגמה com.החלפות, אפשרית כחלק מתקן "IDN". תקן זה מאפשר שמות בעברית תחת הסיומות .com .net והחל משנת 2005 גם .org. נכון לדצמבר 2006, סיומות לאומיות רבות מאפשרות שמות בעברית.
הדפדפנים אינטרנט אקספלורר 7 ו- פיירפוקס תומכים בשימוש בדומיין בעברית באופן מלא. בדפדפנים ישנים התמיכה היא חלקית, ולעתים יש צורך בהתקנת תוסף [1].
[עריכה] קישורים חיצוניים
- מידע על העברית באינטרנט באתר של יונתן רוזן.
- יונתן רוזן, למה כל כך קשה לכתוב בעברית?
- דודו רשתי, סקירת הבעיות בשימושים בעברית ברשת, באתר טכנולוגיות המידע הממשלתי.
- דודו רשתי ואיציק ירחי, דגשים בנוגע לשילוב עברית במסמכי HTML, באתר טכנולוגיות המידע הממשלתי.
- גופן לעברית ויזואלית, באתר "סנונית".
[עריכה] כלים להמרות
- כלים לטקסט באינטרנט, שירות המאפשר לבצע מגוון פעולות תיקוניות לטקסט שניתן למצוא בעיקר באינטרנט. האתר מציע תיקוני ג'יבריש, הפיכת עברית מוויזואלית ללוגית ולהפך וגם היפוך מעברית "אנגלית" לעברית רגילה
- הופך העברית של קורקי.נט, אתר להיפוך מעברית לוגית לעברית ויזואלית, ולהפך.
- הופך העברית של שהם מעברית לוגית לעברית ויזואלית, ולהפך, אתר האוניברסיטה הפתוחה