Docstoc

ANOVA ‫סטטיסטיקה לסוציולוגים

Document Sample
ANOVA ‫סטטיסטיקה לסוציולוגים Powered By Docstoc
					                     ‫סטטיסטיקה לסוציולוגים א'‬

                           ‫‪ – ANOVA‬ניתוח שונות‬




‫סטטיסטיקה לסוציולוגים א'‬
                                 ‫סוגים של מדדי קשר‬

                                        ‫סולם משתנה א'‬
             ‫רווח ומנה‬                           ‫סדר‬                                 ‫שמי‬
          ‫מקדם אטה (‪ )h‬בניתוח שונות‬
                             ‫מתאם בי-סיריאלי סדור (‪)ANOVA‬‬                 ‫מבחן 2‪ + c‬מקדם פי (‪)f‬‬
                                                                                                   ‫שמי‬
‫מתאם בי-סיריאלי‬
 ‫מתאם בי-סיריאלי‬                      ‫(‪)rank bi-serial correlation‬‬   ‫ומקדם ‪ V‬של קרמר (‪,)Cramer’s V‬‬




                                                                                                                 ‫סולם משתנה ב'‬
‫(‪)(point bi-serial correlation‬‬
  ‫(‪point bi-serial correlation‬‬


           ‫מתאם ספירמן‬                     ‫מתאם ספירמן‬                    ‫מתאם בי-סיריאלי סדור‬            ‫סדר‬
      ‫(‪)Spearman’s correlation‬‬        ‫(‪)Spearman’s correlation‬‬            ‫(‪)rank bi-serial correlation‬‬

                                                                              ‫מקדם אטה (‪ )h‬בניתוח שונות‬
           ‫מתאם פירסון‬                     ‫מתאם ספירמן‬                                          ‫(‪)ANOVA‬‬   ‫רווח‬
       ‫(‪)Pearson’s correlation‬‬        ‫(‪)Spearman’s correlation‬‬       ‫מתאם בי-סיריאלי‬
                                                                     ‫מתאם בי-סיריאלי‬                      ‫ומנה‬
                                                                     ‫(‪)point bi-serial correlation‬‬
                                                                     ‫(‪(point bi-serial correlation‬‬




  ‫סטטיסטיקה לסוציולוגים א'‬
                                 ‫סוגים של מדדי קשר‬
                                       ‫• משתנה שמי עם משתנה רצף ומנה‬
                                        ‫סולם משתנה א'‬
             ‫רווח ומנה‬                           ‫סדר‬                                 ‫שמי‬
          ‫מקדם אטה (‪ )h‬בניתוח שונות‬
                             ‫מתאם בי-סיריאלי סדור (‪)ANOVA‬‬                 ‫מבחן 2‪ + c‬מקדם פי (‪)f‬‬
                                                                                                   ‫שמי‬
‫מתאם בי-סיריאלי‬
 ‫מתאם בי-סיריאלי‬                      ‫(‪)rank bi-serial correlation‬‬   ‫ומקדם ‪ V‬של קרמר (‪,)Cramer’s V‬‬




                                                                                                                 ‫סולם משתנה ב'‬
‫(‪)(point bi-serial correlation‬‬
  ‫(‪point bi-serial correlation‬‬


           ‫מתאם ספירמן‬                     ‫מתאם ספירמן‬                    ‫מתאם בי-סיריאלי סדור‬            ‫סדר‬
      ‫(‪)Spearman’s correlation‬‬        ‫(‪)Spearman’s correlation‬‬            ‫(‪)rank bi-serial correlation‬‬

                                                                              ‫מקדם אטה (‪ )h‬בניתוח שונות‬
           ‫מתאם פירסון‬                     ‫מתאם ספירמן‬                                          ‫(‪)ANOVA‬‬   ‫רווח‬
       ‫(‪)Pearson’s correlation‬‬        ‫(‪)Spearman’s correlation‬‬       ‫מתאם בי-סיריאלי‬
                                                                     ‫מתאם בי-סיריאלי‬                      ‫ומנה‬
                                                                     ‫(‪)point bi-serial correlation‬‬
                                                                     ‫(‪(point bi-serial correlation‬‬




  ‫סטטיסטיקה לסוציולוגים א'‬
   ‫קשר בין משתנה שמי ומשתנה רציף‬

          ‫• למשל, האם יש קשר בין תחום הלימוד של אדם‬
          ‫באוניברסיטה לבין ההכנסה הממוצעת שלו חמש‬
                            ‫שנים לאחר סיום התואר?‬
‫• כאמור, כאשר אחד מן המשתנים לגביו מחפשים קשר‬
      ‫הוא שמי, קשר בין משתנים משמעו הבדל בין‬
           ‫הקבוצות השונות של המשתנה הנומינלי‬



‫סטטיסטיקה לסוציולוגים א'‬
        ‫קשר בין משתנים שמיים - דוגמא‬
                ‫• דגמנו 051 סטודנטים, 05 מכל אחד משלושת‬
                                      ‫התחומים הבאים.‬
                              ‫הכנסה ממוצעת על פי תחום הלימוד‬
                           ‫ספרות אנגלית‬   ‫סוציולוגיה‬   ‫מנהל עסקים‬

                             ‫000,6 ₪‬      ‫000,9 ₪‬      ‫000,51 ₪‬




          ‫• אם כל מה שהיה מעניין אותנו הוא הקשר הקיים‬
         ‫במדגם, ניתן היה לקבוע מיד אם יש או אין קשר.‬
          ‫בדוגמא לעיל, יש קשר מכיוון שממוצעי הקבוצות‬
                                        ‫השונות שונים.‬
‫סטטיסטיקה לסוציולוגים א'‬
                                   ‫ניסוח השערות‬
   ‫• מכיוון שהעניין הוא במצב באוכלוסיה, ננסח השערות‬
            ‫לגבי ההבדלים בין הקבוצות באוכלוסיה.‬

    ‫(אין הבדל בין הקבוצות)‬          ‫• השערת האפס (0‪ :)H‬לא קיים קשר‬
                                   ‫תחום 3‪  ‬תחום 2‪  ‬תחום1‪‬‬
                             ‫(ההכנסה הממוצעת של עובדים שלמדו תחומים שונים היא זהה).‬

         ‫(יש הבדל בין הקבוצות)‬         ‫• השערת המחקר (1‪ :)H‬קיים קשר‬
‫תחום 3‪  ‬תחום 2‪‬‬                ‫או‬    ‫תחום 2‪  ‬תחום1‪ ‬או תחום 3‪  ‬תחום1‪‬‬
                            ‫(קיימים לפחות שני תחומים אשר שונים בהכנסה הממוצעת שלהם)‬

 ‫סטטיסטיקה לסוציולוגים א'‬
              ‫מבחנים להשוואה בין קבוצות‬

   ‫• הבדל בין קבוצות בודקים באמצעות מבחן ‪ANOVA‬‬
                                ‫(ניתוח שונות)‬
                           ‫• ‪ANOVA – ANalysis Of VAriance‬‬
     ‫• (אם משווים בין שתי קבוצות בלבד, ניתן להשתמש‬
       ‫במבחן ‪ ,t‬שהוא מקרה פרטי של ‪ ANOVA‬עבור‬
                         ‫השוואה בין שתי קבוצות).‬
       ‫• ‪ ANOVA‬מאפשר לבדוק הבדל בין שתיים או יותר‬
                                           ‫קבוצות.‬
‫סטטיסטיקה לסוציולוגים א'‬
                  ‫שיטת הבדיקה ב-‪ANOVA‬‬
      ‫• כל אחת מן הקבוצות מורכבת מאינדווידואלים שגם‬
       ‫הם שונים אלה מאלה במשתנה התלוי (זה שאותו‬
                                      ‫מנסים לנבא).‬
 ‫• המשמעות של האמירה כי יש הבדל בין קבוצות היא‬
     ‫שההבדלים בין אנשים בתוך כל קבוצה קטנים מן‬
                   ‫ההבדלים שקיימים בין הקבוצות:‬




‫סטטיסטיקה לסוציולוגים א'‬
                      ‫ניתוח שונות – המשך דוגמא‬
                                                                         ‫הכנסה‬
                                                                                                ‫מספר‬
                           ‫• נאמר שדגמנו חמישה‬                           ‫(באלפי‬
                                                                          ‫ש "ח )‬
                                                                                     ‫תחום‬
                                                                                                ‫נבדק‬

                            ‫אנשים מכל קבוצה:‬                                 ‫6‬
                                                                             ‫4‬
                                                                                    ‫אנגלית‬
                                                                                    ‫אנגלית‬
                                                                                                  ‫1‬
                                                                                                  ‫2‬
                                                                             ‫5‬      ‫אנגלית‬        ‫3‬
                                                                             ‫8‬      ‫אנגלית‬        ‫4‬
                                   ‫סה"כ‪X‬‬                                     ‫7‬      ‫אנגלית‬        ‫5‬
                                                     ‫מנה"ע‪X‬‬                 ‫21‬     ‫סוציולוגיה‬     ‫6‬
            ‫אנגלית‪x‬‬        ‫סוציולוגיה‪x‬‬                                       ‫9‬     ‫סוציולוגיה‬     ‫7‬
                                                                             ‫6‬     ‫סוציולוגיה‬     ‫8‬
                                                                             ‫5‬     ‫סוציולוגיה‬     ‫9‬
                                                                            ‫31‬     ‫סוציולוגיה‬    ‫01‬
                                                                            ‫51‬      ‫מנה"ע‬        ‫11‬
                                                                            ‫21‬      ‫מנה"ע‬        ‫21‬
                                                                            ‫41‬      ‫מנה"ע‬        ‫31‬
                                                                            ‫61‬      ‫מנה"ע‬        ‫41‬
                                                                            ‫81‬      ‫מנה"ע‬        ‫51‬

   ‫4‬         ‫6‬         ‫8‬            ‫01‬     ‫21‬   ‫41‬        ‫61‬   ‫81‬   ‫02‬
‫סטטיסטיקה לסוציולוגים א'‬
                ‫ניתוח שונות – מרכיבי השונות‬
    ‫• כאמור, שונות מורכבת מממוצע הסטיות המרובעות‬
                         ‫של האיברים מן הממוצע.‬
                  ‫1‬
               ‫)‪   ( xi  x‬‬
                               ‫2‬
                    ‫2‬

                  ‫‪n i‬‬
                                                      ‫כללי‪X‬‬
                               ‫אנגלית‪x‬‬       ‫סוציולוגיה‪x‬‬                ‫מנה"ע‪X‬‬




                ‫2‬          ‫4‬    ‫6‬        ‫8‬            ‫01‬      ‫21‬   ‫41‬        ‫61‬   ‫81‬   ‫02‬

‫סטטיסטיקה לסוציולוגים א'‬
         ‫(‪)SSW‬‬             ‫ניתוח שונות – מרכיבי השונות‬
   ‫1‬
‫)‪   ( xi  x)  Sum of Squares (SS‬‬
               ‫2‬
  ‫2‬

   ‫‪n i‬‬

‫סכום ריבועי הסטיות בתוך כל קבוצה = )‪• SSWithin (SSW‬‬
                ‫) מנה" ע ‪ )   ( xi  x‬סוציולוגיה ‪ )   ( xi  x‬אנגלית ‪  ( xi  x‬‬
                                         ‫2‬                                ‫2‬                       ‫2‬



                     ‫‪i‬‬                              ‫‪i‬‬                               ‫‪i‬‬

                                                        ‫כללי‪X‬‬
                               ‫אנגלית‪x‬‬       ‫סוציולוגיה‪x‬‬                  ‫מנה"ע‪X‬‬




                ‫2‬          ‫4‬    ‫6‬        ‫8‬              ‫01‬      ‫21‬   ‫41‬        ‫61‬       ‫81‬   ‫02‬

‫סטטיסטיקה לסוציולוגים א'‬
         ‫(‪)SSB‬‬             ‫ניתוח שונות – מרכיבי השונות‬

‫= )‪• SSBetween (SSB‬‬                                     ‫סכום ריבועי ההפרש בין ממוצעי‬
                                                               ‫הקבוצות לממוצע הכללי‬

      ‫‪ (x‬‬                ‫‪ ) ‬כללי ‪ x‬‬     ‫‪ (x‬‬                 ‫‪ ) ‬כללי ‪ x‬‬         ‫‪ (x‬‬              ‫) כללי ‪ x‬‬
                                  ‫2‬                                     ‫2‬                                           ‫2‬
                    ‫אנג‬                                  ‫סוצ‬                                  ‫מנה" ע‬
         ‫‪i‬‬                                     ‫‪i‬‬                                          ‫‪i‬‬

                                                        ‫כללי‪X‬‬
                                 ‫אנגלית‪x‬‬       ‫סוציולוגיה‪x‬‬                       ‫מנה"ע‪X‬‬




                ‫2‬          ‫4‬      ‫6‬        ‫8‬            ‫01‬        ‫21‬        ‫41‬        ‫61‬      ‫81‬        ‫02‬

‫סטטיסטיקה לסוציולוגים א'‬
          ‫(‪)SST‬‬        ‫ניתוח שונות – מרכיבי השונות‬
‫סכום ריבועי הסטיות של האיברים = )‪• SSTotal (SST‬‬
                                                                            ‫מן הממוצע הכללי‬
                      ‫) כללי ‪  ( xi  x‬‬
                                                   ‫2‬



                               ‫‪i‬‬


‫‪• SST = SSW + SSB‬‬
                                                          ‫כללי‪X‬‬
                                   ‫אנגלית‪x‬‬       ‫סוציולוגיה‪x‬‬                ‫מנה"ע‪X‬‬




                ‫2‬          ‫4‬        ‫6‬        ‫8‬            ‫01‬      ‫21‬   ‫41‬        ‫61‬   ‫81‬   ‫02‬

‫סטטיסטיקה לסוציולוגים א'‬
                           ‫ניתוח שונות – דרגות חופש‬
     ‫• כאמור, נוסחת השונות לוקחת בחשבון גם את גודל‬
                                        ‫הקבוצה:‬
                          ‫1‬
                     ‫)‪   ( xi  x‬‬
                                     ‫2‬
                       ‫2‬

                          ‫‪n i‬‬
      ‫• בניתוח שונות במקום לחלק ב-‪ ,n‬מחלקים בדרגות‬
                           ‫החופש (‪ )df‬המתאימות.‬

‫)‪ (k‬מספר הקבוצות – )‪ (n‬סך התצפיות = ‪• dfWithin‬‬
‫1 – )‪ (k‬מספר הקבוצות = ‪• dfBetween‬‬
‫1 – )‪ (n‬סך התצפיות = ‪• dfTotal‬‬
‫סטטיסטיקה לסוציולוגים א'‬
                           ‫ניתוח שונות – חישוב ‪F‬‬
 ‫• באמצעות סכום ריבועי הסטיות (‪ )SS‬ודרגות החופש‬
        ‫(‪ )df‬מחשבים את מרכיבי השונות בתוך ובין‬
                                      ‫הקבוצות:‬
‫‪• MSW = SSW / dfW‬‬
‫‪• MSB = SSB / dfB‬‬
        ‫‪MSB‬‬
     ‫‪F‬‬     ‫אמדן למידת ההבדל בין הקבוצות ‪‬‬
        ‫‪MSW‬‬
           ‫• ככל ש-‪ F‬גדול יותר, כך סביר יותר כי ההבדל בין‬
                ‫הקבוצות במדגם משקף הבדל בין הקבוצות‬
‫סטטיסטיקה לסוציולוגים א'‬
                                              ‫באוכלוסיה‬
                           ‫התפלגות ‪F‬‬
            ‫• גם עבור ציוני ‪ F‬ידועה צורת התפלגות הדגימה,‬
              ‫כפונקציה של שתי דרגות החופש, (‪)dfB , dfW‬‬




         ‫• שימו לב שגם להתפלגות ‪ F‬גבול תחתון של 0 (ולא ‪.)- ‬‬
                                                    ‫למה?‬
‫סטטיסטיקה לסוציולוגים א'‬
                           ‫טבלת ‪F‬‬
            ‫)‪(dfW‬‬                   ‫)‪(dfB‬‬




‫סטטיסטיקה לסוציולוגים א'‬
                  ‫חזרה לדוגמא - חישוב ‪MSW‬‬
 ‫‪ ) ‬סוציולוגיה ‪ )   ( xi  x‬אנגלית ‪SSW   ( xi  x‬‬
                               ‫2‬                   ‫2‬
                                                                         ‫01 ‪ ‬כללי ‪x‬‬
                 ‫‪i‬‬                 ‫‪i‬‬
       ‫08 ‪ )  10  50  20 ‬מנה" ע ‪  ( xi  x‬‬
                           ‫2‬                                          ‫הכנסה‬
                                                                                            ‫מספר‬
                                                                      ‫(באלפי‬     ‫תחום‬
                                                                                            ‫נבדק‬
                                                                       ‫ש"ח)‬
            ‫‪i‬‬
                                                                       ‫6‬        ‫אנגלית‬       ‫1‬
                                                                       ‫4‬        ‫אנגלית‬       ‫2‬

     ‫21 ‪dfW  n  k  15  3 ‬‬                         ‫6 ‪ ‬אנגלית ‪x‬‬    ‫5‬        ‫אנגלית‬       ‫3‬
                                                                       ‫8‬        ‫אנגלית‬       ‫4‬
                                                                       ‫7‬        ‫אנגלית‬       ‫5‬
          ‫08 ‪SSW‬‬                                                       ‫21‬      ‫סוציולוגיה‬    ‫6‬
    ‫‪MSW ‬‬      ‫‪‬‬   ‫76.6 ‪‬‬                                              ‫9‬       ‫סוציולוגיה‬    ‫7‬
           ‫21 ‪df w‬‬                                      ‫9 ‪ ‬סוצ ‪x‬‬      ‫6‬       ‫סוציולוגיה‬    ‫8‬
                                                                       ‫5‬       ‫סוציולוגיה‬    ‫9‬
                                                                       ‫31‬      ‫סוציולוגיה‬    ‫01‬
                                                                       ‫51‬       ‫מנה"ע‬        ‫11‬
                                                                       ‫21‬       ‫מנה"ע‬        ‫21‬
                                                   ‫51 ‪ ‬מנה" ע ‪x‬‬       ‫41‬       ‫מנה"ע‬        ‫31‬
                                                                       ‫61‬       ‫מנה"ע‬        ‫41‬
                                                                       ‫81‬       ‫מנה"ע‬        ‫51‬
‫סטטיסטיקה לסוציולוגים א'‬
                   ‫חזרה לדוגמא - חישוב ‪MSB‬‬
‫‪ ) ‬כללי ‪  x‬אנגלית ‪SSB   ( x‬‬         ‫‪ (x‬‬                ‫‪ ) ‬כללי ‪ x‬‬
                                 ‫2‬                                   ‫2‬

                                               ‫סוציולוגיה‬                         ‫01 ‪ ‬כללי ‪x‬‬
              ‫‪i‬‬                          ‫‪i‬‬

‫)5 ‪ )  (16  5)  (1 5)  (25 ‬כללי ‪  x‬מנה" ע ‪  ( x‬‬
                           ‫2‬                                                   ‫הכנסה‬
                                                                                                     ‫מספר‬
                                                                               ‫(באלפי‬     ‫תחום‬
                                                                                                     ‫נבדק‬
                                                                                ‫ש"ח)‬
      ‫‪i‬‬
                               ‫012 ‪ 80  5  125 ‬‬                             ‫6‬
                                                                                ‫4‬
                                                                                         ‫אנגלית‬
                                                                                         ‫אנגלית‬
                                                                                                      ‫1‬
                                                                                                      ‫2‬
                                                               ‫6 ‪ ‬אנגלית ‪x‬‬     ‫5‬        ‫אנגלית‬       ‫3‬
                                                                                ‫8‬        ‫אנגלית‬       ‫4‬
          ‫2 ‪df B  k  1  3 1 ‬‬                                               ‫7‬        ‫אנגלית‬       ‫5‬
                                                                                ‫21‬      ‫סוציולוגיה‬    ‫6‬
                                                                                ‫9‬       ‫סוציולוגיה‬    ‫7‬
          ‫012 ‪SSB‬‬
    ‫‪MSB ‬‬      ‫‪‬‬   ‫501 ‪‬‬                                        ‫9 ‪ ‬סוצ ‪x‬‬       ‫6‬       ‫סוציולוגיה‬    ‫8‬
          ‫‪df B‬‬   ‫2‬                                                              ‫5‬       ‫סוציולוגיה‬    ‫9‬
                                                                                ‫31‬      ‫סוציולוגיה‬    ‫01‬
                                                                                ‫51‬       ‫מנה"ע‬        ‫11‬
                                                                                ‫21‬       ‫מנה"ע‬        ‫21‬
                                                               ‫51 ‪ ‬מנה" ע ‪x‬‬    ‫41‬       ‫מנה"ע‬        ‫31‬
                                                                                ‫61‬       ‫מנה"ע‬        ‫41‬
‫סטטיסטיקה לסוציולוגים א'‬                                                        ‫81‬       ‫מנה"ע‬        ‫51‬
                           ‫חזרה לדוגמא - חישוב ‪F‬‬

         ‫501 ‪MSB‬‬
      ‫‪F‬‬    ‫‪‬‬     ‫47.51 ‪‬‬
         ‫76.6 ‪MSW‬‬

‫• הערך בטבלא עבור (21=‪ ,)dfB =2, dfW‬ו-50.0<‪ ,p‬הוא: 98.3‬

            ‫• על כן, לפחות שתיים מן הקבוצות שונות זו מזו באופן‬
             ‫מובהק ‪ ‬קיים קשר בין תחום הלימוד לבין ההכנסה‬
                                                   ‫העתידית.‬
  ‫• כעת נרצה לדעת בין אלו שתי קבוצות ההבדל מובהק. כמו‬
                   ‫כן נרצה אמדן כלשהו לעצמת הקשר.‬
‫סטטיסטיקה לסוציולוגים א'‬
                 ‫מבחני פוסט-הוק (‪)post-hoc‬‬
‫• במידה ומבחן ה-‪ F‬יצא מובהק, נרצה לדעת בין אלו קבוצות‬
     ‫קיים הבדל. לשם כך קיימים מספר מבחנים בהם ניתן‬
                                      ‫לעשות שימוש.‬
           ‫• אחד המבחנים המקובלים הוא מבחן ‪( Scheffe‬שפה)‬
‫• מבחן שפה מבצע את כל ההשוואות האפשריות בין כל שתי‬
                                          ‫קבוצות.‬
                           ‫• בדוגמא שלנו, מבחן שפה יבצע את ההשוואות:‬
                                                ‫– בין אנגלית ‪ x‬לבין סוציולוגיה ‪x‬‬
                                                ‫– בין אנגלית ‪ x‬לבין מנה" ע ‪x‬‬
                                                ‫– בין מנה" ע ‪ x‬לבין סוציולוגיה ‪x‬‬
‫סטטיסטיקה לסוציולוגים א'‬
  ‫אמדן לעצמת הקשר – 2‪( h‬אטה בריבוע)‬
      ‫2‪ h‬מהווה אמדן למידה שבה הבדלים במשתנה‬           ‫‪‬‬
        ‫התלוי (בדוגמא שלנו, הכנסה) ניתנים להסבר‬
     ‫באמצעות שינויים במשתנה הבלתי תלוי (בדוגמא‬
                             ‫שלנו, תחום הלימוד)‬
                 ‫• במילים אחרות, 2‪ h‬מבטא את אחוז השונות‬
                    ‫המוסברת (אחוז השונות במשתנה התלוי‬
                 ‫המוסברת באמצעות המשתנה הבלתי תלוי)‬
                                              ‫‪SSB‬‬
                           ‫נע בין 0 ל-1‬   ‫‪h ‬‬
                                           ‫2‬
                                                      ‫•‬
                                              ‫‪SST‬‬
‫סטטיסטיקה לסוציולוגים א'‬
                           ‫2‪ h‬חזרה לדוגמא‬

‫012 = ‪• SSB‬‬
‫08 = ‪• SSW‬‬
‫092 = 012 + 08 = ‪• SST = SSW + SSB‬‬
        ‫012 ‪SSB‬‬
    ‫‪h ‬‬  ‫2‬
           ‫‪‬‬    ‫27.0 ‪‬‬
        ‫092 ‪SST‬‬
             ‫כלומר, 27 אחוז מן השונות בהכנסה מוסברת‬   ‫‪‬‬
                   ‫באמצעות המשתנה של תחום הלימוד‬
‫סטטיסטיקה לסוציולוגים א'‬
                           ‫טבלת ‪F‬‬
                                    ‫)‪(dfB‬‬
       ‫)‪(dfW‬‬




‫סטטיסטיקה לסוציולוגים א'‬

				
DOCUMENT INFO