הדמוגרפיה של לוחמי צה"ל
אלוף אלעזר שטרן - ראש אגף משאבי אנוש בצה"ל - טען בחודש שעבר כי השכול במלחמת לבנון לא התחלק בצורה שווה באוכלוסיה, וכי "אין שכול בתל אביב".
האמירה זכתה לביקורת ציבורית כה נוקבת, עד שהאלוף נאלץ לחשוף לראשונה מעט מנתוני הגיוס הרשמיים של צה"ל, אך ורק כדי לגבות את טענתו. הנתונים פורסמו במוסף השבת של ידיעות אחרונות (1/9/2006), ועולה מהם כי אכן בתל אביב הן שיעור הגיוס לצה"ל והן שיעור הגיוס לשירות קרבי מקרב כלל המתגייסים נמוכים במעט מהממוצע הארצי (בהתאמה: 70.5% לעומת 73.3%; 36.9% לעומת 39.8%).
אך גם אם מקבלים את אמינות הנתונים כעובדה, קשה מאוד להשתכנע כי האלוף צדק בדבריו: ההבדל אמנם קיים, אך הוא אינו נראה משמעותי במיוחד. בפרט, מהנתונים עולה כי תל אביב אינה דוקא יוצאת דופן לרעה למול ערים אחרות בארץ.
אך מתברר שללוחמי צה"ל אכן יש מאפיינים דמוגרפיים מובהקים, כפי שניתן להוכיח בעזרת בדיקה סטטיסטית פשוטה.
באירועים האחרונים בלבנון נהרגו 118 לוחמי צה"ל. נורא ככל שיהיה, מדובר לכאורה במדגם מקרי של לוחמי צה"ל בלבנון, ולמעשה - במדגם משוקלל שבו ניתן משקל רב יותר ללוחמים הנמצאים בסכנה פיסית. מרשימת ההרוגים שהתפרסמה ב-ynet ניתן ללמוד מספר נתונים יבשים על כל אחד: גיל, דרגה ומקום מגורים.
כיוון שאנו מעוניינים לבדוק טענות לגבי השנים האחרונות, הגיוני לסנן את המדגם כך שיכיל רק חיילים שנהרגו במהלך שירות החובה. כך אנו גם מבטיחים שהמדגם לא יהיה מוטה לטובת אוכלוסיות שנוטות יותר לשירות בקבע או לשירות במילואים. לאחר הסינון, אנו נשארים עם מדגם בגודל 54, מספר גדול במושגים סטטיסטיים (ואולי בלתי נתפס במושגים אנושיים).
כעת, ניתן להצליב את המידע עם נתוני הלשכה המרכזית לסטטיסטיקה לגבי היישובים בישראל (שנת 2004). משם, ניתן להוציא את רשימת היישובים המלאה, גודל כל יישוב וחלוקה ליישובים עירוניים וכפריים. הגרף הבא מציג את השורה התחתונה:
ובפשטות: למרות שפחות מעשירית מאוכלוסיית ישראל מתגוררת ביישובים כפריים, יותר משליש מחיילי החובה שנהרגו בלבנון הגיעו מיישובים אלה. מבחן חי בריבוע לטיב התאמה מאשר שההבדל אינו מקרי, אלא מובהק סטטיסטית ברמת בטחון קרובה לודאית (p < 10-13).
כעת ניתן להפעיל את חוק בייס, ולהגיע למסקנה המזעזעת הבאה: לצעיר בגיל שירות חובה המתגורר ביישוב כפרי היה (אפריורית) סיכוי גבוה פי 6 לההרג בלבנון מאשר לצעיר עירוני באותו גיל. למרות זאת, בשל השוני המשמעותי במספרי הבסיס, בסופו של דבר נהרגו חיילים רבים יותר המתגוררים ביישובים עירוניים.
נקודה מתודולוגית חשובה לגבי התהליך והמסקנות: כפי שכתבתי, השתמשתי בנתונים לגבי מספר התושבים בכל יישוב, בעוד שנתון רלוונטי יותר הוא מספר התושבים בגיל הרלוונטי (18-21) בכל יישוב. בתיאוריה, יתכן שביישובים הכפריים מספר גדול משמעותית של צעירים בגיל שירות חובה לעומת ביישובים העירוניים, ולכן השוני בשיעורי ההרוגים אינו משמעותי כפי שהוא נראה במבט ראשון. בפועל, אני בספק רב שזה אכן המצב, ובפרט שהוא קיצוני עד כדי כך שיצליח לחפות על הפער האדיר שעולה מהנתונים. בכל מקרה, לא הצלחתי למצוא את הנתונים המבוקשים באתר הלשכה המרכזית לסטטיסטיקה.
ולבסוף, נקודה קריטית לגבי כל האמור לעיל: הניתוח הסטטיסטי שלמעלה אמנם מספק תיאור מדויק של המציאות, אך אינו מצביע בהכרח על קשר סיבתי (ובאופן כללי, מתאם אינו מצביע על סיבתיות). סביר שבמקרה המתואר קיימים גורמים נוספים שמתפקדים כמשתנים מתווכים, ולכן נוצר מה שמכונה מתאם מזויף. במילים פשוטות, אין סיבה להניח שעצם המגורים ביישוב עירוני הוא שהקטין את הסיכוי לההרג בלבנון.
גורמים מתווכים כאלה עשויים להיות מצב כלכלי, נטיה דתית, רקע עדתי, נטיה פוליטית ורבים אחרים (אם כי לפחות מנתוני הגיוס שפרסם צה"ל, נראה שעל פניו המצב הכלכלי דוקא אינו מסביר את התופעה) - הכרעה לגבי כל אחד מהם דורשת גישה לנתונים רבים שאינם פומביים, אך בודאי נגישים לאגף משאבי אנוש בצה"ל. אני מקווה שלאלוף שטרן יהיה את האומץ להתניע בצה"ל מחקר רציני שירד לעומק הנושא, ולפרסם את מסקנותיו.
עדכון: נכתב פוסט המשך.
שישי, 15 בספטמבר 2006 בשעה 15:22
ברוח פריקונומיקס, אני פשוט טוען שתל-אביבים הם לוחמים טובים יותר, ולכן הם נהרגים פחות :)
שבת, 16 בספטמבר 2006 בשעה 12:32
יופי של פוסט ושל עבודת מחקר - כדי לתת תמונת מצב שלמה, כל שנותר הוא לבצע הצלבה דומה לגבי פיגועי טרור, נניח מאז אינתיפאדת אל-אקצה, או מאז התגובה לטבח במערת המכפלה.
אני חושב ששם טמונה הסיבתיות - העירוניים, שנהרגים בבית, לא באמת זקוקים למדים ולציוד הכבד כדי לחוש את מחיר הלחימה, בעוד שהכפריים יודעים מה זה פיגוע רק מצפייה בטלוויזיה.
ראשון, 17 בספטמבר 2006 בשעה 15:49
דבר ראשון אני מסכים לגמרי עם אוריאל אבל אני לא אובייקטיבי..
לדעתי חוסר הנתונים עלול להטות במידה מסויימת מכיוון שבערים מתרכזת אוכלוסייה מבוגרת, שכבות סוציו-אקונומיות חלשות וכו.
אולי אותו גרף עם הפרדה לישובים כפריים , ערים גדולות ועיירות פיתוח היה נותן תמונה שונה מעט על נתונים..
ושוב אין ספק שתל אביבי שכל חייו נזהר שלא להדרס נהיה לוחם טוב יותר
ראשון, 17 בספטמבר 2006 בשעה 17:05
[…] דיסוננס קוגניטיבי על המתמטיקה והפסיכולוגיה של היום-יום « הדמוגרפיה של לוחמי צה“ל […]
שני, 18 בספטמבר 2006 בשעה 21:16
פוסט מאלף, אבל גם אני נשארתי אחריו עם קצת שאלות ותהיות:
הבעיה הראשונה היא אכן לגבי נתוני הגיוס. מאחר והטבלה מתייחסת לשיעור תושבים מול שיעור הרוגים, היא עושה עוול לישובים בהם ממוצע הגילאים גבוה יותר וישנם פחות צעירים (גבעתיים משום מה עולה לי בראש, ואל תשכחו גם את אחוזי ההצבעה הגבוהים לגמלאים בערים מסוימות). מדד יותר מדויק היה אפשר לקבל אם היינו יודעים כמה צעירים יש בכל עיר בקבוצות הגיל 18-21 (ואז היינו צריכים גם להוציא את נתוני המילואימניקים מספירת ההרוגים). ייתכן (אבל כלל לא בטוח) כי אז היו מתקבלות תוצאות שונות.
הבעיה השניה מדברת על הנתונים היבשים. השיטה בה חישבו את הנתונים באומדיה למשל (ואלו כמובן הנתונים אשר העביר צה"ל), מחושבים מספר המתגייסים לקרבי מתוך כל מספר המתגייסים ולא מתוך כלל הצעירים - כנראה במטרה להציג את תל אביב במקום נמוך יותר בטבלה. אם היו מציגים את מספר המתגייסים לקרבי מתוך כלל הצעירים בגיל גיוס(מכפלה פשוטה באקסל) - היו מגלים שהיא במקום ה-14 מתוך 21 עם 26.1% מתגייסים (עדיין לא בראש, אבל גם לא בתחתית - ולפני חולון, לוד, רמלה, אשדוד, ירושלים, בת ים ובני ברק). עוד דבר מאד מעניין שמתגלה מהנתונים הללו אותם דווקא לא העלה שטרן, הוא שישובים כמו כפר סבא ורעננה נמצאים בראש הרשימה - שני ישובי לווין של הבועה התל אביבית. גם "השמנת" ההרצלינית נמצאת במקום מכובד.
התהיה השלישית היא לגבי ה"למה" - כמו שציינו פה כבר לפני אנשי "פריקונומיקס", נניח כי בתל אביב נהרגים פחות חיילים קרביים ונניח גם כי נהרגים בערים הגדולות פחות חיילים מבישובים כפריים (ביחס לגודל האוכלוסיה). עכשיו השאלה היא למה זה קורה? האם זה בגלל שהם חיילים יותר אמיצים, או שמא בגלל שהם חיילים פחות טובים?
מה שנותר להראות הוא בעצם מהו יחס ההרוגים לעומת יחס המתגייסים מישובים גדולים וישובים כפריים (ולא מהו יחס ההרוגים לעומת יחס התושבים). אם היינו רואים כי יחס ההרוגים פרופורציונלי ליחס המתגייסים לשירות קרבי - הרי שהנקודה המעניינת שצריך לחקור היא ההבדל באחוזי הגיוס. אבל אם גם אז היה הבדל מובהק בין יחס התמותה-לגיוס לקרבי, אז באמת צרך לבדוק את תאורית ה"חיילים יותר טובים".
שני, 18 בספטמבר 2006 בשעה 21:49
גיא:
הבעיה הראשונה שאתה מצביע עליה היא בדיוק מה שציינתי בפוסט בפסקה על "הבעיה המתודולוגית", וכאמור לא הצלחתי למצוא את הנתון המבוקש באתר הלשכה המרכזית לסטטיסטיקה. אם אצליח להשיג אותו בעתיד, אעדכן את הפוסט.
על הנקודה השניה קשה לי להגיב. אני מניח שצה"ל העביר נתונים מדוייקים (אם כי אולי מטעים קצת, כפי שאתה מציין), אבל אין לי דרך לאמת אותם בעזרת השיטה שתיארתי בפוסט. הסיבה היא סטטיסטית: החלק היחסי של תושבי תל אביב מכלל אזרחי המדינה פשוט קטן מדי בשביל לבדוק השערות ספציפית לגביהם, ברמת מובהקות גבוהה מספיק (על המדגם האמור).
לגבי הנקודה השלישית: אני מניח ששיעור הרוגים קטן יותר מצביע על שיעור גיוס קרבי קטן יותר, או על גיוס ליחידות קרביות הנמצאות בסיכון נמוך יותר. ההערה של אוריאל נכונה תיאורטית, אבל לדעתי היא לא סבירה בעליל.