שיחת ויקיפדיה:נתונים סטטיסטיים
מתוך ויקיפדיה, האנציקלופדיה החופשית
[עריכה] קובץ הסטטיסטיקות
מעניין לראות את הסטטיסטיקות של האתר שלנו כ-CHARTS
ברור כי:
- מספר התורמים (וויקיפדים) הוא קטן, ולא תפס תנופה החל מתחילת הפרויקט, סה"כ יש 23 פעילים ממש והתחלנו ב-20.
- יש בסה"כ 2 תורמים "כבדים" (עם יותר מ-100 לחודש)
- סופרים שם מאמרים עם לינק אחד לפחות ו/או יותר מ-200 תווים
- הגידול בנפח ה-DB קצת נעצר. (אם כי אין עדיין קו מגמה, אחרי 3 חודשים)
מסקנה יש לשאוף ולפרסם יותר את וויקי שלנו - כדי שיווספו עוד תורמים משמעותיים למאמרים. ^^ דוד1 04:04, 16 אוק' 2003 (UTC)
אם יורשה לי לעודד-
אצל בני דודנו שהתחילו עימנו המצב יותר גרוע: רק 4 מתוך מאות מליונים.
והנורא מכל אצל היוונים, 2 במשך שנה תמימה. אימפריה שקרסה באופן מושלם.
לעומת זאת, החב'רה מאספרנטו עושים עבודה נפלאה. מעולם לא היו חסידי זמנהוף כה פעילים. השפה הזו לא מתה אלא צומחת ומתחדשת.
בן הטבע.
- אז אם הם חלשים, זה צריך לתת לנו מנוחה? למה אתה לא מסתכל "למעלה"? תראה מה עשו באנגלית, תבדוק את הקצב המדהים של הצמיחה שלהם - פשוט לא יאומן. ואפילו באספרנטו כפי שציינת יש תנופה.
וזה לא אומר שיש לי טענות על קצב או רמת הכניסה לעבודה בוויקי שלנו. אבל צריך לעודד ו"לגייס" עוד כוחות.
^^ דוד1 21:14, 17 אוק' 2003 (UTC)
[עריכה] איך סופרים מאמרים בוויקי
או מה נחשב בוויקי כמאמר
- הועבר מויקיפדיה:מזנון/ארכיון 4
כתשובה להרבה שאלות שהופיעו כאן בדקתי ו"גיליתי" כי
מאמר הוא דף שאינו הפנייה (REDIRECT) או דף משתמש, או דף שיחה, ושיש לו לפחות קישור (LINK) אחד
בקישור הבא הסבר מלא ומפורט: http://meta.wikipedia.org/wiki/Article_count_reform ^^ דוד1 21:00, 18 אוק' 2003 (UTC)
- חששתי שזו תהיה התשובה. מאמר כדבריך הוא בפועל כמעט כל ערך שנפתח.
[עריכה] רשימת הוויקי עם קצב הגידול הגדול ביותר
[http://en.wikipedia.org/wiki/Wikipedia:Multilingual_statistics#Fastest_Growing_Wikipedias בערך הסטטיסטי של וויקי בשפות שונות בפרק: Fastest Growing Wikipedias], אנו מופיעים במקום ה-6 בקצב הגידול (נראה לי שסופרים מספר מאמרים) בחודש אוקטובר 2003 - 48%.
אז נכון שחלק מזה נובע מהגודל הקטן יחסית שלנו, אך מאידך מצביע על עבודה ניכרת ומשמעותית, שנעשתה כאן.
הקרדיטים ו"הידד" לתורמים ה"כבדים" של מאמרים חדשים.
הערה: שימו לב שאנחנו בסטט. "ליד" הצ'כים (מבחינת מספר הערכים), שהתחילו הרבה לפנינו בנוב. 2002 (ה-DB שלנו 3MB גדול כמעט פי 3 משלהם)
^^ דוד1 08:35, 21 אוק' 2003 (UTC)
-
- יש לי כרגע כמה עשרות מאמרים עם למעלה מעשר שורות. אם אתם מתעקשים, אני אוכל להעלות אותם היום ולהביא אותנו לאלף. אם כי אין לי חשק שמישהו בטעות יתחיל לשחק לי איתם. לדעתי, המטרה היא לא האלף (עד כמה שסמלי הדבר) אלא 2000 ונראה לי שנגיע לשם עד ראשית 2004. בן הטבע.
-
-
- שאלה: לגבי 'הזרמת מאמרים' יש דרך אוטומטית להכניס למערכת, כלומר ללא שימוש ב USER INTERFACE פה (ישירות ל DB)?
- שאלה נוספת: האם נבדקה האפשרות לשיתוף פעולה מצד אתרים חופשיים אחרים בעברית? למשל האנצ' של מט"ח, או דעת, או אחרים, הרי יש ברשת המון חומר כתוב עברית ובעצם צריך רק לרכז ולקטלג אותו ? זהר אביטל 09:34, 21 אוק' 2003 (UTC)
-
-
-
-
- כל המקורות לגיטימיים ובתנאי שאתה משכתב אותם, כלומר גורע או מוסיף מן הכתוב ומעניק את הסגנון שלך. אי אפשר לדעת הכל בדייקנות הכל ומבחינתי זה מקובל. אם אתה מדביק קטע מסויים ממקור אחר ואתה בדיוק עובד עליו, אז רשום הערה בנושא: נלקח מ... ועובר עיבוד על ידי. הערך יושלם לא יאוחר מ...
- אתה חייב לזכור שלא פעם תיתקל במקור שהוא בעצמו העתיק אותו מילה במילה ממקום אחר. נאמר שלגבי זכויות יוצרים, קטע כתוב שנמצא חופשי לכל דורש ואפילו העתקת אותו, הוא הבעיה הכי זעירה בנושא זה ברשת: ראה MP3 בקאזאה, הורדות סרטים. אם מישהו מעלה לרשת ספר של מישהו, זה כמובן אסור בהחלט. אולם אם לקחת שורה או שתיים ממט"ח, אז אם בא להם שפשוט יכנסו וימחקו את זה. הרי הם יכולים. בעיקרון, אני ממליץ כפי שאני עושה לחבר ערכים בכוחות עצמך ולבטח שלא לתרגם. אנו רוצים אנציקלופדיה מקורית ולא מתורגמת. לגבי שכתוב קטע מסויים, די בכמה שינויים כמו שימוש במילים נרדפות וכדומה, כדי שזה יהיה שלך מעתה. זה אולי מגוחך אבל כך זה עובד. יצירה מקורית, יש מאין באנציקלופדיה היא נדירה למדי בימינו. מי שטוען כך בפשטות כנה אותו: מתחסד. בן הטבע.
- כל המקורות לגיטימיים ובתנאי שאתה משכתב אותם, כלומר גורע או מוסיף מן הכתוב ומעניק את הסגנון שלך. אי אפשר לדעת הכל בדייקנות הכל ומבחינתי זה מקובל. אם אתה מדביק קטע מסויים ממקור אחר ואתה בדיוק עובד עליו, אז רשום הערה בנושא: נלקח מ... ועובר עיבוד על ידי. הערך יושלם לא יאוחר מ...
-
-
-
-
-
-
- לגבי הזרמה ישירה של מאמרים, פנה ישירות לבן הטבע. נדמה לי שהוא יודע / מצא דרך כזו לטעינה של כל הערכים, שהוא בונה לעצמו "בצד". בכל אופן, לדעתי קיים אם כי אני לא יודע איך עושים זאת. נ.ב. אולי אלעד יודע, נדמה לי שהוא רצה לטעון את הנתונים של כח ישובי ישראל "במכה" אחת מנתוני הלמ"ס.
לגבי שת"פ - היו כאן ניסיונות בהתחלה. זה לא הלך (בלשון המעטה). ראה ויקיפדיה:מזנון/ארכיון 2 ואולי גם בארכיון 3. זה לא אומר, שצריך להרים ידיים אבל. ובכלל העיקרון שלי אומר מה שיש זמין, באינטרנט אל תעתיק לכאן, רק הפנה לשם
^^ קוראים לי להסיע 80.179.193.235 11:43, 21 אוק' 2003 (UTC)
- לגבי הזרמה ישירה של מאמרים, פנה ישירות לבן הטבע. נדמה לי שהוא יודע / מצא דרך כזו לטעינה של כל הערכים, שהוא בונה לעצמו "בצד". בכל אופן, לדעתי קיים אם כי אני לא יודע איך עושים זאת. נ.ב. אולי אלעד יודע, נדמה לי שהוא רצה לטעון את הנתונים של כח ישובי ישראל "במכה" אחת מנתוני הלמ"ס.
-
-
-
[עריכה] סטטיסטיקת המילים למאמר
בויקיפדיה האנגלית יש את סטטיסטיקת המילים למאמר. אולי אפשר לעשות את אותו הדבר גם אצלנו? גילגמש 15:33, 23 מאי 2004 (UTC)
- זה אמור להיות קיים בטבלאות או בגרפים המפורטים.
- מאיר מ 18:15, 23 מאי 2004 (UTC)
היה מאוד מעניין לראות גרף של גודל ויקיפדיות ביחס למס' דוברי השפה. אולי זה קיים?
[עריכה] קצת סטטיסטיקה שעשיתי
הרצתי 74 פעם "בחר מאמר אקראי" וזה מה שיצא:
40 מאמרים סבירים (54%) 20 קצרמרים (27%) 4 מאמרי תאריכים 3 מאמרי רשימות 3 מאמרים המכילים נתונים טכניים על ערים 2 מאמרים שהם לא קצרמרים, אבל הם בלתי סבירים בעליל (אחד מהם היה מלחמת העצמאות של ארצות הברית) 1 מאמר המכיל נתונים טכניים על יסוד כימי 1 מאמר שהוא בעצם שורת סיווג של בן הטבע (להערכתי מאמרי בן הטבע הם יותר מאחוז ורבע מהמאמרים, אבל לא מצאתי יותר מאחד ב-74 החיפושים האקראיים)
אם זה מייצג, סימן שיש כרגע יותר מ-5,000 מאמרים של ממש בויקיפדיה. טוב משחשבתי. שן שש זעם
- אני רואה שמשעמם לך :-) אגב, אני לא בטוח שזה מייצג כ"כ, אבל אני לא סמכות. גם לי שעמם קצת, אז חזרתי על הניסוי, והתוצאות זהות כמעט לחלוטין:
56 מאמרים סבירים
30 קצרמרים
6 דפי יום/שנה
6 רשימות
3 ערכי נתונים טכניים על ערים
5 מאמרי בן-הטבע
סה"כ 106, ככה שמבחינת אחוזים שתי התוצאות כמעט זהות...
לא קיבלתי יסודות, ודברים בלתי סבירים. הייתה לי רק בעיה אחת, והיא שאלת הסיווג: האם יש להסווג את מכבי בזק בינלאומי תל אביב כקצרמר או רשימה? סיווגתי כרשימה, למרות שזו לא רשימה באופן מובהק כמו רשימת החלקיקים. תורת היחסות הכללית אינה מסווגת עם הודעת קצרמר, אבל היא לא מכילה כמעט שום מידע. בערכים קצרים מאוד אבל בלי הערת קצרמר התלבטי, ובסוף סיווגתי גם אם זה לא כתוב, לכן לדעתי יצאו לי כ"כ קצרמרים. להפתעתי, לא קיבלתי מונחונים וכיו"ב. המצב באמת טוב--[[משתמש:Roybb95|רועי | (שיחה) |]] 08:54, 22 אוג' 2004 (UTC)
ככל שויקיפדיה תגדל, כך יצטמצם מספרם היחסי של דפי היום/שנה ונתוני הערים. נשאלת השאלה מה אנו רוצים לעשות עם הרשימות. האם הן עדיין הכרחיות, עכשיו משהקטגוריות הנהדרות הוכנסו לשימוש? גדי אלכסנדרוביץ' 10:14, 22 אוג' 2004 (UTC)
- אני מאמין שכן. קטגוריה מציגה רק את השם, ואילו ברשימה ניתן להכליל הסברים, ואולי אפילו סידורים שונים מאשר סדר אלפבתי. ראה לדוגמא את ההבדל האדיר בין רשימת החלקיקים לcategory:פיסיקת חלקיקים. הבדל של שמיים וארץ - כל אחד משמש למטרה אחרת, וכל אחד טוב בדיוק בשבילה.--[[משתמש:Roybb95|רועי | (שיחה) |]] 10:20, 22 אוג' 2004 (UTC)
- קצת סטטיסטיקה שעשתה התוכנה: מספר המאמרים המופיע בעמוד הראשי (כרגע, 9,439) אינו כולל קצרמרים, הפניות, דפי שיחה וכו'. כלומר, הבדיקה האקראית שלכם כנראה שאינה מייצגת, ומספר המאמרים ה"אמיתיים" גדול בהרבה מ-5,000. Tal Cohen 04:52, 23 אוג' 2004 (UTC)
-
- טל, אני לא בטוח שהמשפט הזה נכון. לפי מה שהבנתי מדף הסטטיסטיקות, הרשימה מונה כל ערך שיש בו לפחות קישור פנימי אחד. אני לא חושב שהמנגנון בנוי להשמיט קצרמרים. ישנה רשימה נוספת שמשמיטה גם ערכים בלי 200 אותיות ולפיה יש 8000+ ערכים כרגע בויקיפידה. שן שש זעם
[עריכה] רשימות ודומיהן
רשימות, כידוע אינן ערכים אנציקלופדיים. אך לצערינו הויקיפדיה מחשיבה אותם ככאלה, הרי הן לא סומנו כקצרמרים או פירושונים. מה יש לעשות עם מפתח רשימות וכל נגזרותיה? ומה עם נגזרות נגזרותיה? הרי אין ערך של ממש בתוך אנשי צבא ומדינה, אלא עוד רשימות. הרי מדובר במאות "מאמרים", אולי החבר שן שש זעם צודק בערכתו לכך שאנו שואפים ל5000 מאמרים? הדוקטור המשוגע (שיחה) 17:58, 27 ספט' 2004 (UTC)
- הערכים נספרים ללא קשר אם סווגו בקצרמרים או לא. הספירה היא אוטומטית. כל ערך בעל יותר מ-200 תוים נראים ולפחות קישור פנימי אחד נספר. לכן אין טעם לפתוח במבצע הוספת קצרמרים לכל רשימה ורשימה. גילגמש 18:10, 27 ספט' 2004 (UTC)
- שן שש צודק, ואני לא חושב שיש מישהו שמטיל בכך ספק. הרשימות הללו מנפחות את הסטטיסטיקה באופן ברור. גם אתה צודק בקביעתך שאין טעם ברשימות אלו, אך אין מה לעשות - בן הטבע החליט לצאת במשימתו המוזרה ליצור את כל הרשימות האומללות הללו, שחלקן מכילות בסך הכל קישור אדום מסכן אחד, וזה כמובן סותם את הגולל על כל דיון אפשרי. כיום, בעידן הקטגוריות והפורטלים, אין שום טעם ברשימות: גם הטיעון לפיו הרשימות יכולות להוות "מחזיקי-מקום" לערכים עתידיים הנו חסר בסיס, כיוון שבפורטלים יש אזור מיוחד לערכים מבוקשים. אך אין טעם בפתיחת דיון שלם בנידון, כי עם בן הטבע אי אפשר להתווכח. מקסימום אפשר לכתוב דפי שיחה באורך הגלות, ובזה הרי אין טעם.
- עצה ידידותית - רד מהעניין. דיונים על כל הדברים האלו כבר נערכו מפה ועד להודעה החדשה, ועוד דיון שכזה לא יקדם את העניין במאומה.--[[משתמש:Roybb95|רועי | (שיחה) |]] 18:12, 27 ספט' 2004 (UTC)
- אני מוותר על העניין רק נקודה לגילגמש לפי מיוחד:Statistics ישנם למעשה כ22 אלף אך לאחר ניקוי ניפוי וזריקת הזבל הקצרמרי והפירושוני נשארם כ10.5 אלף. --הדוקטור המשוגע (שיחה) 18:24, 27 ספט' 2004 (UTC)
קצת סטטיסטיקה: מדי פעם אני עובר על מאמרים אקראיים בכדי למצוא כאלו הדורשים עבודה. ספרתי באילו מאמרים נתקלתי ב-60 המאמרים האקראיים האחרונים שהגעתי אליהם. אז מתוך 60 מאמרים יש:
- 19 קצרמרים (32%)
- 14 מאמרים קצרים, כלומר מאמרים שהם ארוכים מספיק בכדי לא להחשב קצרמרים, אבל עדיין קצרים למדי ודורשים הרחבה (23%)
- 19 מאמרים ראויים מבחינת היקפם (32%)
- 6 מאמרים הם רשימות יום ושנה (10%)
- 2 רשימות שהיו יכולות להפוך לקטגוריה (3%)
אם 60 מאמרים מספיקים בכדי ללמוד משהו על התפלגות הערכים בויקיפדיה, 55% מהערכים הם באמת מאמרים "אמיתייים". אני גם חושב שערכי רשימות הם מיותרים וצריך להחליף אותם לקטגוריות - אבל מבחינה סטטיסטית לא מדובר בתופעה משמעותית. --סלע 21:07, 27 ספט' 2004 (UTC)
- הרשימות הן לא בעיה, הקצרמרים הם בעיה קטנה וערכי הקשקוש והעלגות הן הבעיה הגדולה.
- לגבי הנושא של האם קצרמרים נמנים, אולי יעשה איתנו אחד ממפעילי המערכת חסד סוף סוף וימחק את הטענה הלא נכונה שמופיעה בדף שאליו הפנה הדוקטור המשוגע (תודה על העבודה במוזיאון!). כל ערך (לא דף שיחה) שיש בו קישור חיצוני אחד נמנה. בנוסף, קיימת רשימה של ערכים שיש בהם קישור חיצוני ולפחות מאתיים תווים והיא מונה בערך 9,000 ערכים. זו אינה הרשימה הרשמית שעליה אנו מבססים את טקסינו וחגיגותינו.
[עריכה] האנציקלופדיה העדכנית בעולם
האם לא הגיע כבר הזמן לעדכן את גרף הגידול במספר הערכים?
[עריכה] סטטיסטיקה: השחתות פר כניסות
האם קיימת סטטיסטיקה לגבי מספר ההשחתות ביחס למספר הכניסות לאתר? האם קיימת השוואה לויקיפדיה האנגלית? או הגרמנית? עלומים 17:39, 9 מרץ 2006 (UTC)
[עריכה] הפרכת המיתוס על אורך הערכים בויקיפדיה העברית
גיליתי עובדה מעניינת (יותר נכון מדכאת). כתבתי את הדף משתמש:Harel/ניסיון ראשון שהכיל את המחרוזת "אחת שתיים שלוש" ואת הדף משתמש:Harel/ניסיון שני שהכיל את המחרוזת "one two three". כמה אותיות יש בכל אחד מהם? בראשון 12 + 2 רווחים - סה"כ 14 תווים. בשני 11 + 2 רווחים - סה"כ 13 תווים. אלא שבגלל נפלאות unicode, תו עברי תופס שני בתים (בייטים), ואילו תו אנגלי, וכן רווח תופסים רק בית (בייט) אחד. לכן בבתים גודליהם יהיו 26 ו-13 בתים בהתאמה (כפי שדף מיוחד:Newpages למרחב שם "משתמש" שמח לאשר). ובאופן כללי, ערך בעברית יהיה ארוך, בבתים, פי שניים מאחיו האנגלי. הסטטיסטיקה המפורסמת שמוכיחה שהערכים שלנו הכי ארוכים משתמשת בנתון של "אורך בבתים", והרי לכם סיבה ללכת לישון עצובים הערב. ערב טוב שיהיה. Harel - שיחה 21:10, 3 מאי 2006 (IDT)
-
-
-
- חחחח. אין לשכוח שבאופן כללי הכתיבה העברית קצרה יותר מהכתיבה האנגלית. לדוגמה:
- "I went to the Kindergarten"
- "הלכתי לגן"
- Yonidebest Ω Talk 21:20, 3 מאי 2006 (IDT)
-
-
-
-
-
-
- תשומת לבכם לנאמר בתחתית דף סטטיסטיקות ויקיפדיה:
- "הויקיפדיות מסודרות לפי מספר הקישורים הפנימיים שבהן (למעט דפי הפניה). נראה שזהו בסיס הוגן יותר להשוואת המאמץ הכולל שהושקע בהן, מאשר מספר המאמרים או גודל מסד הנתונים; מספר המאמרים אינו משמעותי כל כך מכיון שויקיפדיות מסוימות מכילות בעיקר מאמרים קצרים, או ערכים רבים שנוצרו באופן אוטומטי, ואילו ויקיפדיות אחרות מכילות מאמרים מעטים אבל ארוכים יותר, שנכתבו כולם ידנית. גם גודל מסד הנתונים עשוי להטעות, כיון שהוא תלוי בקידוד (תוי Unicode עשויים לתפוס מספר בייטים) ובמידת המשמעות שמכיל כל תו (למשל, תוים בסינית הם מילים שלמות)."
- מלח השמים • שיחה 21:29, 3 מאי 2006 (IDT)
-
-
-
ליתר דיוק, לא יוניקוד, אלא UTF-8. ישנן גם שיטות קידוד אחרות (ראו את הרשימה מימין ב-w:en:Unicode). אולי מתישהו יטרחו לתת סטטיסטיקות של פסקות, שורות, מילים ותוים. בינתיים אפשר להעתיק כל מאמר אופן אופיס, ולקבל את הנתונים שם. conio.h • שיחה 21:48, 3 מאי 2006 (IDT)
- אני חושב שהנקודה שהעלה יוני גם היא נכונה. באופן כללי משתמשים בעברית בפחות תווים מאשר בשפות אחרות. עכשיו תראו בבקשה כמה מילים וכמה תווים נדרשים באנגלית עבור המילה העברית היחידה הבאה "וכשבהתנפליותכם", ואם כבר אני שם אני חיב להזכיר את העובדה המשעשעת שניתן בעברית לכתוב מילה בת 4 אותיות כולן זהות. אביהו 22:13, 3 מאי 2006 (IDT)
- יש לציין שדף הסטטיסטיקה פשוט לא מעודכן, לפני כחצי שנה עברו כל הוויקיפדיות ל-UTF-8 (למעט אלו במזרח הרחוק שמשתמשות ב-UTF-16), כך שאין לכך משמעות בהשוואה מול מרבית הוויקיפדיות.
- בכל מקרה, אני תמיד התלהבתי מהמילה וווו (=וגם הוו שלו) למרות שאינני יודע האם אביהו התכוון דווקא אליה. טרול רפאים 22:18, 3 מאי 2006 (IDT)
- או זה או חחחח ⌠צהוב עולה⌡ 22:20, 3 מאי 2006 (IDT)
אמרו את זה כבר קודם... ויקיפדיה:מזנון/לא תעשה לך קצרמר#סימון כקצרמרים שימו לב לשאלה :"האם כתיבה בעברית תופסת מקום זהה לכתיבה באנגלית?" (שלא נענתה) --איש המרק 22:34, 3 מאי 2006 (IDT)
-
- הראל -- לפי בדיקותי אתה ככל הנראה צודק וגם קצת טועה. ביצעתי חלוקה של מספר המלים בכל המאמרים במספר המאמרים, וויקיפדיה העברית נמצאת בצמרת הגבוהה עד גבוהה מאוד, עם כ-363 מלים למאמר.
'כולל | אנגלית | גרמנית | צרפתית | יפנית | הולנדית | איטלקית | ספרדית | עברית |
299 | 363 | 348 | 326 | 361 | 252 | 231 | 350 | 363 |
-
- בהשוואה לאנגלית, שלה מספר זהה של מלים למאמר, מצבה של העברית טוב, שכן מלל בעברית קצר בממוצע בכ-30 אחוז ממלל באנגלית (הנתון הזה מסתמך על כעשר שנות עבודה כמתרגם, כך שהוא פחות-או-יותר מדויק).
- הנתון היותר מעניין (לדעתי) הוא מספר העורכים הפעילים מאוד בויקי העברית (52 נכון לדצמבר 2005). המספר הזה הוא, פחות או יותר, בקו אחד עם הנתונים של ויקיפדיות אחרות (ביחס אוכלוסיה/עורכים): באנגלית יש כאלפיים, בגרמנית כשש מאות, וכן הלאה, מה שמצביע על כך שזה מאפיין כללי של ויקיפדיה (משהו כמו עורך אחד ל-150 אלף דוברי השפה). נתון מעניין אחר הוא מספר התורמים הכללי (כל האנשים שתרמו לפחות עשר פעמים) שהוא בערך ביחס של 1:20 למספר העורכים הפעילים מאוד. כלומר, אחד מעשרים אנשים שטעמו "נתפס" לעניין באופן רציני יותר. רלף פון שוונץ 00:40, 4 מאי 2006 (IDT)
-
-
- אפרופו וווו, יש לי הרגשה שבדיוק מה שאתה מתכוון כותבים כך: ווו. חוץ מזה... באנגלית גם כותבים XXX (גם מילה... אם מסתכלים על זה מכיוון מסויים..) שזה קרוב למה שיש לנו (איזה מילה מוזרה זו: ממממנו... מהמממן שלו....) אם כן, עם ישראל הצליח לגייר את הוויקיפדיה ולשתול בה סמים ממריצים... אבל זה באמת משתווה כשחושבים כמה מילים צריך בשביל להביע משהו אחד... או כשחושבים שיש להם לא רק את ארה"ב אלא גם את קנדה ואוסטרליה ובריטניה (מה הם עושים עם אנגלית של אירים?) וכל שאר המדינות דוברות האנגלית... וגם זה בעייה שלהם שהם והנוצרים המיסיונריים שלהם גייסו לשורותיהם אנשים שיצר הוויקיפדיזציה (זה תופס יותר תווים באנגלית........) אינו טבוע בדמם.. שילמדו לא לכפות על ילידים טבילה לנצרות. הספרדים האלה.. והפורטוגלים.. והצרפתים והאנגלים... וכל האנטישמים.. (איך הגענו לזה?!?)D_N_A 00:55, 4 מאי 2006 (IDT)
-
-
- אכן, 89 (המספר הנקוב ל-26 בנובמבר) הוא נתון מרשים. צריך רק לקוות שהשפע הזה (שקשור, ניתן לשער, לוולהפדיה) יחזיק מעמד. רלף פון שוונץ 16:23, 4 מאי 2006 (IDT)
[עריכה] לראשונה מאז התחלנו לרדת...
הנתונים הסטטיסטים בויקי האנגלית כבר מזמן לא מעודכנים, ובכל זאת, נראה שויקי שלנו ירדה לראשונה מאז דצמבר 2003 אל המקום ה-18 בדירוג (הסלובקית חלפה על פנינו אתמול...). למרות זאת, בקצב הנוכחי אנחנו אמורים לעבור את הדנית והאספרנטו תוך כמה חודשים (נדמה לי שהן השפות היחידות המדורגות מעלינו כרגע שמספר הדוברים אותן קטן ממספר דוברי העברית). נריה 08:58, 23 מאי 2006 (IDT)
-
- ומהצצה ב"ערך אקראי" שם תוכל גם להבין מדוע. קל מאוד לטפס בסולם כשמקדישים, נאמר, 8,000 ערכים לכל גרם שמים מתועד. צריך רק סקריפט מתאים. רלף פון שוונץ 12:25, 23 מאי 2006 (IDT)
[עריכה] למה לא מעדכנים עמוד זה?
מאיפה אפשר לעדכן את זה? ואם גם אני הפשוט יכול לעשות זאת? • עידו ••• שיחה 00:13, 11 יולי 2006 (IDT)
[עריכה] סטטיסטיקה
הצצתי היום בדף m:List of Wikipedias, שבו יש השוואה בין ויקיפדיות בשפות שונות, וגיליתי שני נתונים מעודדים:
- הטבלה כוללת מדד בשם Depth, שמלמד, באופן גס, עד כמה הערכים בוויקיפדיה מסוימת מושקעים. מבין 52 הוויקיפדיות הגדולות (מעל 10,000 ערכים), העברית נמצאת במקום השלישי לפי מדד זה (אחרי האנגלית והווייטנאמית).
- ויקיפדיה העברית עשירה מאוד בתמונות. אף שהיא במקום ה-19 מבחינת מספר הערכים, היא במקום ה-8 מבחינת מספר התמונות. מבחינת היחס בין מספר התמונות למספר הערכים, ויקיפדיה העברית נמצאת במקום הראשון (מעט לפני האנגלית, והרבה לפני כל ויקיפדיה גדולה אחרת). דוד שי 22:26, 12 בדצמבר 2006 (IST)
- מה שאני מרוצה ממנו הוא שהגענו למצב שאתה אומר "הרבה לפני כל ויקיפדיה גדולה אחרת", ואני לא יודע אם ה"אחרת" מתייחס לוויקיפדיה באנגלית או לוויקיפדיה העברית. בוויקיפדיה העברית נעשו כמעט 2.5 מיליון עריכות, מספר הדומה למספר העריכות בוויקיפדיה הרוסית (עם 121 אלף ערכים). זו הוויקיפדיה היחידה שיש בה פחות מ-100,000 ערכים ויותר מ-2.1 מיליון עריכות, ועוד אין לנו 50,000 ערכים! בקצב הזה, בערך ה-100,000 יהיו לנו 5 מיליון עריכות, נתון שיש היום רק לוויקיפדיות בעלות מעל 222,000 ערכים! לעומת זאת יש לנו רק 34 מפעילים - בוויקיפדיה הסינית לדוגמה יש רק פי שניים יותר ערכים מאיתנו, פי 1.5 יותר עריכות מפה אבל 84 מפעילים. צהוב עולה 22:36, 12 בדצמבר 2006 (IST)
- ביחס למספר המפעילים הסטטיסטיקה איננה חד משמעית, ולכן לא הבאתי אותה. בוויקיפדיה היפנית, למשל, יש פי שישה ערכים מבעברית, פי ארבעה עריכות, אבל רק פי שניים מפעילים. דוד שי 22:47, 12 בדצמבר 2006 (IST)
- אני לא מתרגש כל כך מכמות התמונות שיש לנו. הרי כמות נכבדה מהן היא תמונות בשימוש הוגן. לאחרונה מחקנו שלוש רשימות פרקים, בעקבותיהן נמחקו כמה עשרות תמונות (מאות במקרה של הסימפסונס). האם זה אומר שהערך שלנו ירד? זהר דרוקמן - אהמ 23:16, 12 בדצמבר 2006 (IST)
- התמונות הם מדד להשתתפות ועשיה ולא רכוש שנצבר. מעבר לכך נראה שבכל הויקיות יש תמונות רבות בשימוש הוגן, במיוחד באנגלית שם נתקלתי בלא מעט שכאלו.--אפי ב. • שיחה • 10:15, 13 בדצמבר 2006 (IST)
- נתון התמונות הוא נתון בעל חשיבות - הוא מעיד על כך שבכל ערך (כמעט) יש תמונה. אני חסיד גדול של תמונות ותרשימים בערכים (תמונה שווה אלף מילים), ואין כל בושה בשימוש בתמונות שימוש הוגן (עדיף כמובן שימוש חופשי), אבל כל עוד אין תמונות המפרות זכויות יוצרים מצבנו טוב.
- נתון יותר חשוב בעיני הוא אורך הערכים - 31% מהערכים שלנו הם מעל 2K [1]. אנחנו במקום שביעי בין כל הויקיפדיות בעניין זה (אחרי האנגלית, הגרמנית, הצרפתית, ההולנדית, הספרדית והויטנאמית). לעניין אחוז הערכים מעל 0.5K אנחנו עם 72% [2] - הרבה מעל ויקיפדיות גדולות מאיתנו כמו היפנית, הנורווגית, והשוודית (הסינית לא נחשבת כי שם כל אות מסמנת מילה). נתונים אלה הם תוצאה של מחיקת אולטרא קצרמרים ומניעת יצירתם. דרור 10:43, 13 בדצמבר 2006 (IST)
- זה ארטיפקט הנובע מהעובדה שתויים בעברית מקודדים בשני בתים ביוניקוד ואילו תווים לטינים מקודדים בבית אחד. הסברתי את זה פעם בדיון במזנון. הסיפור על כך שהערכים שלנו ארוכים במיוחד הוא די מיתוס (אם כי האפקט שתיארתי מקוזז במידת מה על ידי כך שהעברית היא שפה מאוד קומפקטית במספר האותיות). Harel • שיחה 10:49, 13 בדצמבר 2006 (IST)
- התמונות הם מדד להשתתפות ועשיה ולא רכוש שנצבר. מעבר לכך נראה שבכל הויקיות יש תמונות רבות בשימוש הוגן, במיוחד באנגלית שם נתקלתי בלא מעט שכאלו.--אפי ב. • שיחה • 10:15, 13 בדצמבר 2006 (IST)
- מספר התמונות הוא אינדקס בעייתי, שכן ויקיפדיות יכולות היום להשתמש בתמונות מקומונס, אשר לא יספרו לזכותן, אבל יכללו בערכים המופיעים בהן. באותו אופן יכול להיות שיש ויקיפדיות שבהן המשתמשים "ממושמעים" יותר ומקפידים להעלות תמונות לקומונס ובאחרות פחות. ערןב 12:50, 13 בדצמבר 2006 (IST)
- בתוספת לדבריו של ערן, שהבהיר יפה את הנקודה שלי, אבקש לחדדה שוב: האם ירדה קרנה של ויקי העברית בעקבות המחיקות הרבות של התמונות מרשימות הפרקים? הרי ירדנו בלפחות 300 תמונות - האם זה הופך אותנו לויקיפדיה פחות טובה? מדד התמונות איננו משמעותי כלל וכלל, כיוון שאיננו משקף באמת כמה תמונות ויקיפדיה כלשהי שמה בערכים אלא כמה תמונות העלו אליה. אכן, טוב מאוד שרבים מהערכים שלנו מלאים באמצעים ויז'ואלים להמחשת הטקסט היבש, אבל ספירה עיוורת של אותן תמונות איננה כלי מהימן לקביעת איכות מדורגת. זהר דרוקמן - אהמ 21:53, 13 בדצמבר 2006 (IST)
- לא מדוייק. ומחיקת התמונה זניחה ביחס למספרן. דרור 23:14, 13 בדצמבר 2006 (IST)
- בתוספת לדבריו של ערן, שהבהיר יפה את הנקודה שלי, אבקש לחדדה שוב: האם ירדה קרנה של ויקי העברית בעקבות המחיקות הרבות של התמונות מרשימות הפרקים? הרי ירדנו בלפחות 300 תמונות - האם זה הופך אותנו לויקיפדיה פחות טובה? מדד התמונות איננו משמעותי כלל וכלל, כיוון שאיננו משקף באמת כמה תמונות ויקיפדיה כלשהי שמה בערכים אלא כמה תמונות העלו אליה. אכן, טוב מאוד שרבים מהערכים שלנו מלאים באמצעים ויז'ואלים להמחשת הטקסט היבש, אבל ספירה עיוורת של אותן תמונות איננה כלי מהימן לקביעת איכות מדורגת. זהר דרוקמן - אהמ 21:53, 13 בדצמבר 2006 (IST)
[עריכה] מאה אלף
מישהו יכול לחשב מהסטטיסטיקות תוך כמה זמן יהיו 100 אלף ערכים? קקון 02:27, 25 בדצמבר 2006 (IST)
- כיוון שזה יותר מעניין מלפתור תרגילים בתרמודינמיקה, הכנסתי כמה נקודות ציון לתוכנה וביצעתי התאמה אקספוננציאלית, ברמת דיוק טובה (R2=0.99982). לפיה, הערך ה-100,000 יכתב בערך ביום ה-1,860 לקיומה של ויקיפדיה, או בשנה השישית לקיומה, ביום ה-34. כלומר, בערך ב-12 באוגוסט, שנת 2008. הניתוח מתבסס על 7 נק' ציון, החל מהערך ה-1,000, ועד הערך ה-50,000 (שנכתב בערך ביום ה-1,260 להיווסדה של ויקי העברית). עופר קדם 09:35, 25 בדצמבר 2006 (IST)
- תודה לך. אני מהמחשבים ככה שאקספוננציאלי לא נשמע לי טוב. קקון 09:39, 25 בדצמבר 2006 (IST)
- מה רע באקספוננציאלי? זה נראה לי מתאים למקרה שלנו, ויש אחלה התאמה. עופר קדם 12:20, 25 בדצמבר 2006 (IST)
- אקספוננציאלי לא מתאים, גם אם אפשר ל"אנוס" אותו להתאים על סט הנתונים הנוכחי. קצב כתיבת הערכים לא יכול להיות אקספוננציאלי. משיקולי אנרגיה, לא ייכתבו פה מיליוני ערכים ביום על ידי בני אדם בעוד זמן סביר כלשהו, למעשה בשום זמן שהוא. קצב כתיבת הערכים הוא פולינומיאלי, להערכתי מסדר שני. Harel • שיחה 20:39, 25 בדצמבר 2006 (IST)
- בוודאי שמספר הערכים לא יגיע לאינסוף, וקצב כתיבתם לא יגדל לאינסוף, אבל אין לנו מידע אודות אותו זמן עלום, בו ישתנה אופי הפונקציה. על פי הנתונים שבידינו, ניתן לקרב את הפונקציה בטווח זה לאקספוננט. אין זו שגיאה, כל עוד מודעים לכך שמדובר בקירוב. בדומה, פונ' פולינומית כלשהי יכולה להתנהג כפונ' לינארית סביב האפס, וכולי.
- הקירוב לאקספוננט מוגבל - לא ניתן להפעילו על כל מספר. השאלה "מתי יכתב הערך ה-200 מיליון?" מן הסתם לא תענה על ידי הקירוב הנ"ל. אך תחזית לטווח הקרוב, הערך המאה אלף, נראית סבירה יותר, במיוחד כשלוקחים בחשבון שתוצאת הקירוב נותנת פרק זמן שגדול רק במחצית מזמן חייה של הויקיפדיה, כך שאין אנו מסתכלים לעתיד הרחוק. בנוסף, מאה אלף ערכים נראה מספר סביר, בהתחשב במספר הערכים הגדול שחסר לנו, כך שקשה לחשוב שנגיע לרוויה או לשינוי דרסטי בקצב הגידול לפני מספר זה.
- לסיכום - מדובר בקירוב טוב בהתחשב בנתונים העומדים לרשותנו, והוא תקף רק לטווח מסוים, אך זה הקירוב הכי טוב אליו נוכל להגיע, בהעדר ידע נוסף (ידע נוסף, אגב, יכול להיות בחינה מדוקדקת של הויקיפדיה האנגלית, או ויקיפדיות אחרות גדולות מאיתנו). עופר קדם 22:42, 26 בדצמבר 2006 (IST)
- אקספוננציאלי לא מתאים, גם אם אפשר ל"אנוס" אותו להתאים על סט הנתונים הנוכחי. קצב כתיבת הערכים לא יכול להיות אקספוננציאלי. משיקולי אנרגיה, לא ייכתבו פה מיליוני ערכים ביום על ידי בני אדם בעוד זמן סביר כלשהו, למעשה בשום זמן שהוא. קצב כתיבת הערכים הוא פולינומיאלי, להערכתי מסדר שני. Harel • שיחה 20:39, 25 בדצמבר 2006 (IST)
- מה רע באקספוננציאלי? זה נראה לי מתאים למקרה שלנו, ויש אחלה התאמה. עופר קדם 12:20, 25 בדצמבר 2006 (IST)
- ולי R^2=0.99982 נשמע בלתי אפשרי. (אפשר להציץ בנתונים שלך?) עוזי ו. 10:20, 25 בדצמבר 2006 (IST)
- זה מה ש-Origin אומרת לי... הנתונים בטבלה הבאה:
- תודה לך. אני מהמחשבים ככה שאקספוננציאלי לא נשמע לי טוב. קקון 09:39, 25 בדצמבר 2006 (IST)
-
-
-
ימים ערכים 105 1000 160 1500 365 7850 750 23000 1090 40000 1177 45000 1261 50000
-
-
-
-
- (יש לציין שאני לא מבין כלום בסטטיסטיקה. הידע שלי מסתכם בלהזין נתונים לתוכנות כמו אוריג'ין ואקסל, ולקוות לטוב). עופר קדם 10:38, 25 בדצמבר 2006 (IST)
- אפשרי כאשר התוכנה בוחרת פונק' שתתאים ככל האפשר. לי יצאה תוצאה דומה עם מאקרו באקסל. לא מדובר כאן בהתאמה אקראית אחרי הכל. קרני • שיחה • זה הזמן ל... 12:21, 25 בדצמבר 2006 (IST)
- כמובן, לזה התכוונתי - לא התאמה לנוסחא שרירותית, אלא לפונ' מיטבית, כמו רגרסיה לינארית. עופר קדם 13:05, 25 בדצמבר 2006 (IST)
- אפשרי כאשר התוכנה בוחרת פונק' שתתאים ככל האפשר. לי יצאה תוצאה דומה עם מאקרו באקסל. לא מדובר כאן בהתאמה אקראית אחרי הכל. קרני • שיחה • זה הזמן ל... 12:21, 25 בדצמבר 2006 (IST)
- (יש לציין שאני לא מבין כלום בסטטיסטיקה. הידע שלי מסתכם בלהזין נתונים לתוכנות כמו אוריג'ין ואקסל, ולקוות לטוב). עופר קדם 10:38, 25 בדצמבר 2006 (IST)
-
משמאל מוצג גרף של מספר הערכים (לפי הטבלה לעיל), יחד עם קו הרגרסיה המתאים. מקדם המתאם הוא , וזה בעיקר לקח למי שמשתמש במקדם המתאם כדי להצדיק אקסטרפולציה. לפי הקו הזה, הערך ה-100000 יכתב ביום ה-2929, כלומר בעוד כ-4.5 שנים. לפי קו רגרסיה שמתחשב רק בשלושת הנתונים האחרונים, הנס הזה יתרחש עשרה חודשים מוקדם יותר, ביום ה-2627. עוזי ו. 18:00, 25 בדצמבר 2006 (IST)
-
- מה זה בדיוק קו רגרסיה? ***מתבייש*** אביעד המקורי 18:05, 25 בדצמבר 2006 (IST)
- כן, נתקלתי במספיק מקרים ש-R נראה מבטיח, אבל הרגרסיה גרועה (למרות ש-R^2=0.9900 זה לא טוב במיוחד). אבל בתחזית שלי הפונ' האקספוננציאלית יצאה מותאמת (ויזואלית, לפחות) באופן נפלא לכל הנקודות שלקחתי, אז אני מאמין שהמצב יותר טוב. הרגרסיה ששמת סוטה באופן ברור מערכי האמת, מכיוון שתוצאות האמת פשוט אינן לינאריות. עופר קדם 19:57, 25 בדצמבר 2006 (IST)
- ההסבר פשוט, הפונקציה אינה לינארית, ואינה מעריכית (עברי דבר עברית) ואינה פולינום. אלא מורכבת יותר. יש כאן 2 תהליכים לפחות ששולטים בפונקציה. האחד הוא משוב חיובי מערכי- ככל שיש יותר כותבים וערכים יותר אנשים שומעים על ויקיפדיה ואחוז מסויים מתוכם מתחיל לכתוב. היות והתהליך הוא שערכים באופן ממוצע לא הופכים להיות גרועים יותר התהליך מושך אנשים במנגנון של משוב מחזק. (כך שפונקציה לינארית לא מתאימה וגם לא פולינום). אבל כפי שעופר אמר, יש מספר מוגבל של אנשים בעלי הדרישות המתאימות (בעלי זמן פנוי, נכונות ויכולת לתרום וכו', יודעי עברית) ולכן הפונקציה המעריכית אינה ממשיכה לגדול אלא משלב מסויים מתחילה לדעוך ובסך הכל מתקבלת פונקציה דמויית S.
- פונקציה דומה מתקבלת לדוגמה לכניסה של מוצר בעל טכנולוגיה חדשה - בתחילה קונים אותו רק גיקים , אחר כך (בהנחה שהוא מוצר טוב) קונה אותו אוכלוסיה גדולה בהרבה כאשר הגידול הוא מעריכי בגלל אפקט פרסום רשת, ולבסוף חוזרים לגידול איטי היות ומעטים הם הצרכנים הפוטנציאלים שאין להם את המכשיר החדש. לפי הגרף ששורטט אנחנו אי שם בשלב המעריכי של הפונקציה, ובהמשך יבוא שלב האטה בקצב (הקצב של גידול מספר המשתמשים החדשים התורמים, לאו דווקא קצב התרומות). (עוד שלב או תהליך הוא שלב של של דעיכה שבו ויקיפידה כבר תהיה מקום בו רוב הערכים ה"חשובים" כבר יהיו כתובים, והמוטיבציה להשתתף בה תרד - אבל שלב זה יקרא בעתיד הלא נודע).האזרח דרור 12:35, 26 בדצמבר 2006 (IST)
- בלי להיכנס לנכונות הניתוח שלך, שהוא ספקולטיבי לגמרי, מדוע אתה חושב שפונקציה דמוית S אינה פולינום? שמעת על טור טיילור? odedee • שיחה 12:41, 26 בדצמבר 2006 (IST)
- שמעתי , וגם על קירובים אחרים. אבל אלו קירובים. ובוודאי שלא מדובר על פולינום מסדר שני. האזרח דרור 16:37, 26 בדצמבר 2006 (IST)
- יש לציין, שאני לא אמרתי דבר אודות "מספר מוגבל של אנשים בעלי הדרישות המתאימות" וכו'. אולי הראל?
- ואולי "עברי דבר עברית", אך "מדען דבר אנגלית". עופר קדם 22:50, 26 בדצמבר 2006 (IST)
לי דווקא נראה שעקומה מעריכית מתאימה בינתיים, ולפי זה יהיו מאה אלף ערך ביום ה-1991, 131 ימים אחרי ההערכה של עופר קדם. והרבה לפני ההערכה של עוזי ו.. בברכה, אבינעם 18:22, 28 בדצמבר 2006 (IST)
[עריכה] שבירה - מדד אחר
אני חושב שהמדד של ערכים חדשים אינו נכון למדידת התקדמות והייתי מציע את המדד של מספר ערכים בעלי אורך של לפחות 4K שאינם מסומנים לעריכה ולשכתוב. על פי מדד זה יש בויקיפדיה קרוב ל-7000 ערכים. מתי נגיע לעשרת אלפים? יעקב בויקי 18:41, 25 בדצמבר 2006 (IST)
- מהיכן הנתון? --איש המרק 23:38, 25 בדצמבר 2006 (IST)
- מסכים בהחלט. ראו את הערך המביש 1904 בארכיאולוגיה. ~ קובי • שיחה 13:55, 26 בדצמבר 2006 (IST)
- זוועת עולם. לדעתי יש לאחד את הערכים האלה לעשורים, ממילא מחקר ארכאולוגי אינו עניין של חודשיים, זה לא סרט קולנוע. odedee • שיחה 14:26, 26 בדצמבר 2006 (IST)
- כדאי לאחד את קטגוריית שנים בארכיאולוגיה עם קט' שנים במדע. לא ברור מה גרם להבחנה בינהם מלכתחילה. כרגע שמתי תבנית חשיבות על הקטגוריה. לדעתי אפשר פשוט לאחד, אבל נדמה לי שצריך מפעיל בשביל זה. ~ קובי • שיחה 15:13, 26 בדצמבר 2006 (IST)
- כפי שנאמר כאן לא מזמן בנושא קרוב, כיוון שעברית משתמש בשני בתים עבור כל תו - גם מדד זה מעט מעוות. זהר דרוקמן - אהמ 21:40, 26 בדצמבר 2006 (IST)
- זהר, אתה בטוח שהגבת במקום?... קובי - לא צריך מפעיל אלא אם כן יש צורך למחוק ערך ואינני חושב כך. odedee • שיחה 21:46, 26 בדצמבר 2006 (IST)
- התגובה במקום הנכון, ההזחה לא. קורה :/. בכל מקרה, תגובתי הייתה להודעתו המקורית של יעקב בויקי. זהר דרוקמן - אהמ 21:49, 26 בדצמבר 2006 (IST)
- זהר, אתה בטוח שהגבת במקום?... קובי - לא צריך מפעיל אלא אם כן יש צורך למחוק ערך ואינני חושב כך. odedee • שיחה 21:46, 26 בדצמבר 2006 (IST)
- כפי שנאמר כאן לא מזמן בנושא קרוב, כיוון שעברית משתמש בשני בתים עבור כל תו - גם מדד זה מעט מעוות. זהר דרוקמן - אהמ 21:40, 26 בדצמבר 2006 (IST)
- כדאי לאחד את קטגוריית שנים בארכיאולוגיה עם קט' שנים במדע. לא ברור מה גרם להבחנה בינהם מלכתחילה. כרגע שמתי תבנית חשיבות על הקטגוריה. לדעתי אפשר פשוט לאחד, אבל נדמה לי שצריך מפעיל בשביל זה. ~ קובי • שיחה 15:13, 26 בדצמבר 2006 (IST)
- זוועת עולם. לדעתי יש לאחד את הערכים האלה לעשורים, ממילא מחקר ארכאולוגי אינו עניין של חודשיים, זה לא סרט קולנוע. odedee • שיחה 14:26, 26 בדצמבר 2006 (IST)
- מסכים בהחלט. ראו את הערך המביש 1904 בארכיאולוגיה. ~ קובי • שיחה 13:55, 26 בדצמבר 2006 (IST)
ראשית תודה שאתה מגיב. בחרתי ב 4K כי זה מופיע בדף הסטטיסטיקות וזה מספיק גדול כדי שיהיה אפשר לקרוא לזה ערך. לא מדובר כאן על השוואה לשפות אחרות (שבעייתית במקצת) אלא מדד פנימי של העברית. אני חושב שבמקום לרוץ אחרי עוד ועוד ערכים אנו צריכים להרחיב את הערכים שכבר יש. מדד של 4K יכול אולי לתת תמריץ לכיוון הזה. יעקב בויקי 23:56, 26 בדצמבר 2006 (IST)
[עריכה] הנתונים לא עודכנו זה כשנה וחצי
מישהו מוכן להרים את הכפפה ולעדכן את הגרפים? חגי אדלר 04:17, 7 בינואר 2007 (IST)