שונות
מתוך ויקיפדיה, האנציקלופדיה החופשית
שוֹנוּת היא מדד לפיזור הסטטיסטי של משתנה מקרי. הפיזור נמדד סביב התוחלת של המשתנה המקרי הנדון. לשורש השונות קוראים "סטיית התקן" של המשתנה.
מושג זה הוצג לראשונה על ידי רונלד פישר בשנת 1918.
תוכן עניינים |
[עריכה] הגדרה פורמלית
נסמן ב- את התוחלת של המשתנה המקרי , השונות (או גם: ) תוגדר כ- . השונות שווה גם ל- .
מבחינה אינטואיטיבית, השונות היא הממוצע של ריבוע המרחק של כל ערך מהממוצע.
ההגדרה לעיל מתאימה גם עבור משתנה מקרי בדיד וגם עבור משתנה מקרי רציף.
לא לכל התפלגות קיימת שונות. לדוגמה, השונות איננה קיימת עבור התפלגות קושי.
[עריכה] תכונות השונות
- השונות תמיד אי שלילית
- השונות של קבוע היא 0. - קבוע ממשי.
- השונות של טרנספורמציה לינארית על המשתנה המקרי מחושבת באופן הבא:
- קבועים ממשיים.
[עריכה] שונות האוכלוסייה ושונות המדגם
עבור אוכלוסייה סופית (שהתפלגותה אינה ידועה) ניתן לחשב את השונות בעזרת הנוסחה:
- ממוצע האוכלוסייה.
- מספר האיברים באוכלוסייה.
נוסחה שימושית לחישוב שונות האוכלוסייה:
כאשר נתון מדגם מקרי ניתן לאמוד את השונות על ידי הנוסחה ; בתנאים רגילים, זהו אומד בלתי מוטה. אם הנתונים מעוגלים בזמן המדידה, יש להפעיל את תיקון שפרד.
לפי ההגדרה, אמד לפרמטר הוא בלתי מוטה אם מתקיים: .
לפיכך צריך להראות ש- . מ.ש.ל. |
נוסחה שימושית אחרת לחישוב האומד לשונות: .