ארכיון פוסטים ששייכים לנושא 'אינטרנט'

רימזו: מה החברים שלך חושבים עליך?

שני, 25 ביוני 2007

אזהרה: פוסט זה עשוי לשנות את חייך. מי שקצר בזמן, מוזמן לדלג על ההקדמה המעט ארוכה ולעבור ישירות לתכל'ס, שמתחיל מיד לפני התמונה הראשונה.

תמונה עצמית היא מושג המתאר את האופן שבו כל אחד מאיתנו תופס את התכונות הקבועות שלו: בין אם תכונות חיצוניות שניתנות לבחינה אוביקטיבית ("יש לי שיער בלונדיני", "אני זכר") ובין אם תכונות פנימיות שנחוות רק בעקיפין ("אני חרוץ", "אני אוהב מוסיקה אלקטרונית"). התמונה העצמית מתגבשת לאורך החיים, ונוטה לשמור על יציבות יחסית.

לכאורה, הגיוני לצפות שהתמונה העצמית של כל אחד מאיתנו תהיה די מדויקת (או בפסיכולוגית מדוברת: תהיה "מכוילת"). אחרי הכל, מי מכיר אותי טוב יותר מאשר אני עצמי?

אבל בפועל, מתברר, התמונה העצמית אינה בהכרח מדויקת. מי לא מכיר את האדיוט שמשוכנע שהוא גאון הדור? את המניאק מהעבודה שבטוח שכולם אוהבים אותו? ולחילופין, את הבחורה המדהימה שחושבת שהיא לא נראית משהו בכלל? לעיתים קרובות מתברר כי הדרך שבה אנשים תופסים את עצמם שונה מאוד מהדרך שבה הם נתפסים ע"י אחרים, ומחקרים רבים (למשל [1998]) מוכיחים כי רוב האנשים תופסים את עצמם כחכמים יותר, מצחיקים יותר ונחמדים יותר מאיך שהם במציאות. למעשה, סביר להניח שגם התמונה העצמית שלכם מוטה.

תמונה עצמית מוטה היא בעייתית, כיוון שסופה של כל אשליה להתנפץ. לדוגמא, במחקר ארוך טווח בקרב סטודנטים [2001] נמצא כי תמונה עצמית מוגזמת ניבאה (לאורך זמן) ירידה בהערכה העצמית, בהתעניינות בלימודים ובאופן כללי באיכות החיים (well being). ההטיה לא הביאה לשיפור במדדים אובייקטיביים (הצלחה בלימודים, למשל), כפי שאולי ניתן היה לחשוב בטעות.

גם אם האשליה לא תתנפץ לעולם, לתמונה עצמית מוטה לפחות היבט שלילי אחד נוסף: חוסר היכולת להשתפר. אדם אכפתי שמגלה שהוא נתפס כקר ומנוכר, סביר להניח שיעשה מאמץ לשנות זאת. כל עוד הוא חי באשליה שהכל בסדר, אין סיבה שהמצב ישתנה.

איך אפשר לדעת האם התמונה העצמית שלך מוטה? במילים אחרות: איך אפשר לדעת האם הדרך שבה אתה תופס את עצמך אכן מבטאת את המציאות? כדי לעשות זאת יש למצוא מדד כלשהו שאינו מבוסס על דיווח עצמי.

עבור תכונות מסויימות, קיימים מבחנים אוביקטיבים שעשויים לתת תשובה מספקת. לדוגמא, אינטליגנציה ניתן למדוד בעזרת מבחן IQ כזה או אחר, ומראה חיצוני ניתן להעריך בעזרת אתרים כמו HOT or NOT (באופן אישי, אני חושב שאדם צריך להיות בעל אישיות קיצונית - חזקה או מעורערת באופן יוצא דופן - כדי שיכניס את התמונה שלו לאתר כזה, אבל לפחות בתיאוריה האפשרות קיימת).

מה לגבי תכונות אחרות? איך אפשר לדעת עד כמה אני מצחיק, או עד כמה אפשר לסמוך עלי? לרוב התכונות אין מבחנים סטנדרטיים שאינם מבוססים על דיווח עצמי, וגם אם היו כאלה - עבור תכונות רבות השאלה המעניינת היא לא איך אני באמת במציאות (אם יש לכך בכלל משמעות), אלא איך אני נתפס ע"י אחרים. למשל, הרבה פחות מעניין אותי לדעת עד כמה אני באמת אדם אכפתי - איך בכלל אפשר למדוד את זה? - מאשר עד כמה אני נתפס כאדם אכפתי, וספציפית עד כמה אני נתפס כאדם אכפתי ע"י אנשים שדעתם חשובה לי.

למעשה, השאלה המעניינת באמת היא מה החברים שלך חושבים עליך.

אז איך בעצם אפשר לדעת? לשאול אותם ישירות (סטייל קל"ע שעושים בקורס קצינים) לא עומד על הפרק, כי סביר להניח שלא תקבלו תשובה אמיתית - בטוח לא לגבי סוגיות רגישות באמת. לכאורה אפשר להעביר מבחן סוציומטרי בחבר'ה, אבל בפועל ברור שגם זה בלתי אפשרי: מעבר לזה שסוציומטרי הוא מבחן ארוך ומייגע, הוא דורש ניתוח מקצועי ע"י גורמים מוסמכים.

רימזו (rimzu) היא הפתרון לבעיה, שפיתחנו במשך כמה ימים מרוכזים בקיץ האחרון - אי שם בין המבחנים, המילואים והכנסים. המטרה העיקרית מבחינתנו היתה להרים ביחד פרויקט צד מגניב (ולאו דוקא להרוויח ממנו כסף), ולכן רימזו אינה מערכת מסחרית. לפחות בעתיד הנראה לעין, זה גם לא הולך להשתנות.

rimzu.gif

רימזו היא מעין מבחן אישיות (או מבחן סוציומטרי משוכלל, אם תרצו), רק אמין יותר והרבה יותר כיף. במקום לשאול אותך שאלות על עצמך, רימזו שואלת אותך שאלות על החברים שלך. כל שאלה היא השוואה פשוטה בין שני חברים, על בסיס תכונה מסויימת (למשל, "מי יותר אינטליגנטי: אמיר או בועז?"). המערכת מנתחת את התשובות של החברים שלך, מחשבת את הדירוגים האישיים שלך ומציגה אותם (לעיניך בלבד!) בגרפים מגניבים.

question.gif

כדי לשאול אותך את השאלות הנכונות, רימזו צריכה לדעת מי החברים שלך. מהבחינה הזו, רימזו דומה מאוד ל-LinkedIn, ל-Friendster, ל-Orkut ולשאר הרשתות החברתיות: אפשר לצרף חברים, לראות את החברים שלהם וכו'. המידע הזה משמש את המערכת פעמיים: מצד אחד לדעת על מי רלוונטי לשאול אותך, ומצד שני לדעת בדעתו של מי להתחשב בחישוב הדירוגים שלך.

הייחוד של רימזו (מעבר לכך שהיא עונה על אחת השאלות המעניינות ביותר שאפשר לשאול), הוא הדיוק המדהים של התשובות שהיא נותנת. ה"מוח" מאחורי המערכת הוא מודל סטטיסטי מתוחכם למדי, שלמעשה מתחייב שהדירוגים שלך אכן מייצגים בדיוק את מה שהחברים שלך חושבים עליך: בהתחלה, רימזו מספקת דירוגים כלליים יחסית (למשל, אומרת שהחברים שלך חושבים שאתה נמצא "ב-50% הגבוהים במדד היצירתיות"). בהמשך - ככל שהחברים שלך עונים על יותר שאלות לגביך - המערכת מרשה לעצמה יותר ויותר להתחייב על הדירוג האמיתי שלך, ובסופו של דבר כל תכונה שלך מכומתת לטווח מצומצם ומדויק מאוד.

rankings.gif

בהקשר הזה, חשוב לציין שרימזו מקדישה תשומת לב מיוחדת לשמירה על המידע האישי של המשתמשים: ברמה הראשונה - הדירוגים האישיים הם באמת אישיים, ונגישים אך ורק למשתמש עצמו. זה מבטא את הגישה שלנו שרואה ברימזו כלי לשיפור עצמי, ולא תחרות פופולריות באינטרנט (כמובן, שום דבר לא מונע ממך להראות לאחרים את הדירוגים שקיבלת - אבל זו כבר הבחירה שלך). ברמה השניה - אף אחד, כולל אתה עצמך, לא יכול לראות כיצד דירגת את חבריך בעבר. המטרה היא להבטיח את האנונימיות המוחלטת של הדירוגים, כך שאפילו אם מישהו פרץ לכם לחשבון, הוא לעולם לא ידע מה אתם ספציפית חושבים עליו (או על כל אחד אחר). מאותה סיבה, לא ניתן לראות את הדירוגים שלך כל עוד לא דורגת ע"י לפחות חמישה אנשים שונים (שוב, כדי להבטיח שלעולם לא תדע מה אדם ספציפי חושב עליך).

נכון לרגע זה רשומים ברימזו למעלה ממאתיים אנשים, ועד כה קיבלנו תגובות חיוביות מאוד. כדי להבטיח שהמערכת תמשיך לתפקד בצורה הטובה ביותר, בחרנו לעבוד בשיטת ההזמנות, ז"א משתמשים קיימים יכולים להזמין משתמשים נוספים להצטרף לרימזו. מי שלא מכיר משתמש קיים, יכול למלא כתובת אימייל בעמוד הראשי ולבקש הזמנה (הזמנות נשלחות בדרך כלל תוך יום-יומיים).

אז אם מעניין אתכם לדעת מה באמת החברים שלכם חושבים עליכם, אם אתם מחפשים מנגנון מדויק שיאפשר לכם לזהות ולשפר את החלקים הפחות טובים באישיות שלכם, או אם אתם משוכנעים שאתם הכי אחלה שבעולם ורק רוצים טפיחה על השכם - רימזו מחכה לכם. אהה, וזה אפילו כשר.

בלי קשר, בעתיד הקרוב אני מתכנן לכתוב פוסט נוסף על הטכנולוגיה שמאחורי רימזו. כטיזר אומר רק שפיתחנו את רימזו במתודולוגיה שונה לחלוטין (ולדעתי טובה יותר) מזו שמקובלת בפיתוח אתרים. בין היתר, אנחנו מאפשרים למפתחים חיצוניים להתממשק לרימזו בקלות ובעוצמה שטרם נראו. מי שלא יכול לחכות מוזמן לקרוא בינתיים על ה-API שאנחנו מספקים, ואת הביקורת שקיבלנו (אני לא מסכים עם רוב מה שנאמר שם - ארחיב על כך בעתיד).

אנחנו ניצחנו, מכבי הפסידה

שלישי, 22 במאי 2007

"קבוצות" הוא אחד מהנושאים הבודדים שזוכים להתייחסות גם במתמטיקה וגם בפסיכולוגיה: במתמטיקה תחת המטריה הרחבה של תורת הקבוצות (שהיא אולי הבסיס למתמטיקה כולה), ובפסיכולוגיה תחת המטריה הרחבה לא פחות של הפסיכולוגיה החברתית.

את העיסוק המתמטי בקבוצות אשאיר להזדמנות אחרת (למעשה כבר נגעתי בו מעט כשכתבתי על קבוצות אינסופיות), והפעם אתמקד בפן הפסיכולוגי בלבד: אתאר בקצרה תיאוריה פסיכולוגית שעוסקת בקבוצות חברתיות וההשתייכות אליהן, ואראה כיצד היא באה לידי ביטוי בטוקבקים של אוהדי מכבי תל אביב בכדורסל.

ההגדרה המדוייקת של קבוצה חברתית עמומה למדי (בדומה להגדרות של מושגים פסיכולוגיים רבים אחרים), אבל היא כמעט ברורה מאליה בצורה אינטואיטיבית. קבוצות חברתיות לדוגמא הן קבוצת כדורסל, קבוצת האוהדים שלה, קבוצת הפסיכולוגים, קבוצת הנשים, קבוצת הישראלים וכו'.

קל לראות שכל אחד מאיתנו חבר במספר רב של קבוצות חברתיות שונות. השאלה המתבקשת, אם כן, היא איזה צורך מספקת החברות בקבוצה?

אחת התיאוריות שמנסה לענות על השאלה היא תיאורית הזהות החברתית של Tajfel ו-Turner, שטוענת כי הזדהות עם קבוצות נועדה לשפר את ההערכה העצמית של הפרט.

כנגזרת מכך, השערה מרכזית של התיאוריה היא שקיים קשר חיובי בין היוקרה (סטטוס) של קבוצה לבין מידת ההזדהות איתה, ובמילים אחרות: ככל שקבוצה תחשב כ"מוצלחת יותר", אנשים ייטו יותר להזדהות איתה.

הנקודה האחרונה נראית, על פניו, כמעט טריוויאלית. בכל זאת, התיאוריה צופה גם את קיומן של תופעות מורכבות יותר, למשל שאנשים שיחוו ירידה זמנית בהערכה העצמית ייטו יותר להזדהות עם קבוצות, וכתוצאה מכך ההערכה העצמית שלהם באמת תעלה.

ואכן, שתי הטענות הנ"ל אומתו במספר ניסויי מעבדה קלאסיים, מה שהביא לביסוס משמעותי של התיאוריה. אבל התיאוריה אינה מסבירה רק תופעות שמתרחשות במעבדה:

במאמר קלאסי [1976] בדק רוברט סיאלדיני שבע אוניברסיטאות גדולות בארה"ב, והראה שבבוקר שלאחר נצחון של קבוצת הפוטבול של האוניברסיטה נראים בקמפוס יותר סטודנטים לבושים בחולצת האוניברסיטה, לעומת בבוקר שלאחר הפסד של קבוצת הפוטבול. בנוסף, סטודנטים נטו להשתמש בביטוי We (גוף ראשון) כשתיארו נצחון של קבוצת הפוטבול, ובביטוי They (גוף שלישי) כשתיארו הפסד. סיאלדיני תיאר זאת כ-"basking in reflected glory" - התחממות מהתהילה המשתקפת עליך בעקבות הצלחה של קבוצה שאתה חלק ממנה. כמובן, כל זה מסתדר מצוין עם ההשערה המרכזית של תיאורית הזהות החברתית.

מתברר שהתופעה אינה מוגבלת רק לאוניברסיטאות בארה"ב, והיא מתקיימת גם במחוזותינו:

בשבועיים הראשונים של חודש אפריל 2007, התמודדה קבוצת הכדורסל מכבי תל אביב מול אלופת אירופה צסק"א מוסקבה, בשלב ההצלבה של אליפות אירופה בכדורסל (יורוליג). ההתמודדות היתה בשיטת הטוב משלוש, כשהמשחק הראשון והשלישי נערכים במוסקבה, והמשחק השני בישראל.

בסופו של דבר, כל קבוצה ניצחה את משחקי הבית שלה (צסק"א – את המשחקים הראשון והשלישי; מכבי – את המשחק השני), כך שבסיום ההתמודדות צסק"א העפילה לשלב הפיינל-פור ומכבי הודחה מהתחרות. שלושת המשחקים הסתיימו בהפרשים משמעותיים (80:58, 56:68, 92:71).

לאחר כל משחק, מתפרסמת ב-ynet כתבת סיכום במדור הספורט, ובעקבותיה מספר רב של טוקבקים. הטוקבקים אנונימיים לחלוטין, ועוסקים בקשת רחבה של נושאים: מניתוחי ספורט מעמיקים, ועד קללות נמוכות כנגד שחקנים, מאמנים, פרשני הערוץ הראשון, כותב המאמר וטוקבקיסטים אחרים.

כאמור, השערה מרכזית של תיאוריית הזהות החברתית היא שקיים קשר חיובי בין היוקרה (סטטוס) של קבוצה לבין מידת ההזדהות איתה. ספציפית, ניתן לשער כי לאחר ניצחון של מכבי תל אביב מידת ההזדהות איתה תהיה גדולה יותר מאשר לאחר הפסד, והדבר יבוא לידי ביטוי בטוקבקים.

כדי לבדוק האם ההשערה אכן מתקיימת, ערכתי את הבדיקה הבאה: בשלב הראשון, סיננתי מתוך 535 הטוקבקים שנלוו לכתבות (משחק 1, משחק 2, משחק 3) את אלה שנכתבו ע"י אוהדי מכבי מוצהרים - מי שהזדהה כ"צהוב", "אוהד מכבי" או "מכביסט", וטוקבקים נוספים שמתוכנם היה ברור שהכותב הוא אוהד מכבי. בשלב השני, סיננתי טוקבקים בהם התייחסו האוהדים למכבי תל אביב עצמה (בניגוד לתגובות כלליות בסגנון "איזה משחק!"). כעת נשארתי עם 58 טוקבקים בלבד, אותם חילקתי לשתי קטגוריות: אלה בהם ההתייחסות למכבי היתה בגוף ראשון ("ניצחנו בפוקס"), ואלה בהם ההתייחסות למכבי היתה בגוף שני או שלישי ("מכבי ניצחו בפוקס"). את המקרים הבודדים בהם היו התייחסויות משני הסוגים ספרתי בקטגוריה הראשונה. להלן מספרי הטוקבקים שנכנסו לניתוח, בחלוקה לפי הקטגוריות:

משחק 1, "אנחנו": 18 79 123 137 155 172 180
משחק 1, "הם": 21 33  35  36  80  92  97 104 112 133 150 154 167
משחק 2, "אנחנו": 18 40 48 54 57 73  82  90 102 150
משחק 2, "הם": 26 34 68 88 94 96 115 151
משחק 3, "אנחנו": 5  35  58  93 156 191
משחק 3, "הם": 1 110 121 123 135 138 150 167 171 179 180 182 183 185

הגרף הבא מציג את הנתונים בצורה ברורה יותר:

maccabi-comments1.gif

והגרף הבא מאחד את המשחק הראשון והשלישי לקטגוריה בודדת של "הפסד":

maccabi-comments2.gif

כפי שניתן לראות, הנתונים עומדים בקנה אחד עם ההשערה ועם התיאוריה: אחוז גדול יותר של אוהדי מכבי תל אביב התייחסו לקבוצה בגוף ראשון לאחר ניצחון מאשר לאחר הפסד.

האם מדובר בהבדל מקרי? נראה שלא. ניתוח שונות חד-גורמי בין נבדקים (שתי קטגוריות, לפי המנצח במשחק; השערה חד-צדדית) מצביע על כך שמדובר באפקט מובהק סטטיסטית, ברמת בטחון קרובה ל-95% (F(1, 56)=2.795; p=.05006).

בשורה התחתונה, הניבוי המרכזי ביותר של תיאורית הזהות החברתית מתקיים גם עבור אוהדי מכבי. בכל מקרה, אני מעדיף את ההסבר הזה מאשר את ההסבר של "סטיב קפלן ראש העיר האדום", שכתב כי "אוהדי הצלחות מכבי = האוהדים הגרועים בעולם! " (משחק 1, תגובה 161).

הערת צד: בדרך כלל מקובל להתייחס לאפקט כמובהק אם p<.05. בניתוח הסטטיסטי האחרון התקבל p שקרוב באופן מחשיד לערך הקריטי, ובכל זאת גדול ממנו במעט. חוקרים מסויימים עלולים לטעון שבמקרה כזה אסור לומר שהאפקט מובהק סטטיסטית. באופן אישי, אני מאמין שנכון יותר לציין את ערך ה-p המדויק שהתקבל ולהשאיר לקוראים את ההחלטה כיצד להתייחס לתוצאות, מאשר להתייחס לאפקט בצורה דיכוטומית כמובהק או לא.

סיכום שנה

שישי, 27 באפריל 2007

בדיוק לפני שנה כתבתי פה את הפוסט הראשון, וחשבתי שזו הזדמנות טובה לסכם את השנה הראשונה של הבלוג. אז מה היה לנו פה?

פוסטים
בסה"כ כתבתי השנה 30 פוסטים.

ניתחתי את הקמת הקואליציה החדשה בעזרת עקרונות של תורת המשחקים. המלצתי למלצרים על מספר טכניקות פשוטות להגדלת הטיפ. הסברתי מדוע הסקרים שנעשו לפני הבחירות נכשלו בחיזוי החלשות קדימה והתחזקות הגימלאים. המצאתי שיטה לייצור שמות לאתרי אינטרנט שנשמעים טוב ובכל זאת עדיין פנויים. רטנתי על ההתעלמות של בלו סקיוריטי מתגובה שכתבתי להם. חלמתי בהקיץ על סוף עידן הסלולר ועל רשתות תקשורת שיתופיות. הפרכתי כתבה שהתפרסמה בעמוד הראשי של מעריב ודיווחה על תופעה מדהימה שקשורה לגירושין בישראל. סיפרתי על הקשר בין סדר הלידה במשפחה לבין הסיכוי להיות הומוסקסואל. תיארתי רמאות אינטרנט מעניינת שמסבירה מדוע קרנות נאמנות שהצליחו בשנה שעברה לאו דוקא יצליחו בשנה הבאה. טענתי שמופע הזיקוקים של שגרירות צרפת איכזב בגלל כלל השיא-סוף. התלהבתי משימוש בנתוני טלפונים סלולריים כדי ללמוד על התנהגות האוכלוסיה בזמן אמת, ומאתר שמציג סטטיסטיקות על הפער העולמי בצורה ייחודית. ניסיתי לכמת את יציבות הממשל בישראל, והצעתי פתרון לא אינטואיטיבי להגדלת היציבות. הרהרתי על היעילות של מבחנים אמריקאיים וסיפרתי על מבחן אמריקאי מוזר במיוחד, ובכל זאת טוב יותר. ברוח המונדיאל הראיתי שהכדור לא עגול, וכתבתי על הקשר בין כדורי רגל לפצצות אטום. התפלספתי כי תורות האישיות לא יאבדו מערכן גם בעולם של מחקרי מוח. קיוויתי לגמר מונדיאל ללא פנדלים למען השוערים, הבועטים ובעיקר הצופים בבית. טענתי כי אנו לוקים בטעות הייחוס הבסיסית כשאנחנו משווים את מניעי ישראל למניעי חזבאללה. סיפרתי על עיצוב כסאות בעזרת אקראיות, שראיתי בתערוכת הבוגרים של בצלאל. הסברתי את ההגיון מאחורי שיטה מוזרה לחלק את החשבון במסעדה, ובמקביל ניסיתי להבין איך קרה שהתשובה צצה בראשי פתאום, אחרי למעלה מחודש ללא התעסקות בבעיה. התעמקתי בדקויות החוק לגבי מכירת המניות של הרמטכ"ל ביומה הראשון של מלחמת לבנון השניה. נהניתי מהקשר בין משחק פשוט לבין השקעות ספקולטיביות בבורסה. בדקתי את טענת האלוף שטרן לגבי הדמוגרפיה של לוחמי צה"ל, והראיתי שגודל היישוב משחק תפקיד משמעותי בהחלטה להתגייס לקרבי. הצעתי שיטה לסימון תגובות איכותיות באופן אוטומטי, בעזרת שילוב בין captcha לסוג מסויים של מבחן אינטלגנציה. כתבתי על תאונת דרכים שראיתי, ואיך תגובות האנשים בעקבותיה קשורות לכך שזוכי מדליות הארד מאושרים יותר מזוכי מדליות הכסף. הוכחתי כי על כדור הארץ קיימות בהכרח שתי נקודות מנוגדות עם טמפרטורה זהה, אבל לאו דוקא שתי נקודות מנוגדות בהן יורד גשם. הזמנתי אתכם לתחרות מחשבים מדליקה. עקצתי את הקצרנית של ועדת וינוגרד ואת ההכרות שלה עם מושגים מתורת המשחקים. התבדחתי ברצינות שתיבת המייל האינסופית של Yahoo לא גדולה מספיק.

מה לגבי תדירות הפוסטים? בממוצע בין פוסט לפוסט שאחריו עברו מעט יותר מ-12 יום, עם סטיית תקן של מעט פחות מ-16. אבל הסיפור האמיתי נמצא בגרף הבא:

post-frequency.gif

נראה שתדירות הפוסטים היתה במגמת ירידה לאורך השנה. הסיבה, אגב, היא לא מחסור ברעיונות, אלא פשוט תעדוף הזמן שלי לדברים אחרים. פרטים נוספים בעתיד :)

איזה פוסטים היו פופולריים במיוחד? הטבלה הבאה מציגה את חמשת הפוסטים הנצפים ביותר (לפי גוגל אנליטיקס) ואת חמשת הפוסטים המועדפים עלי. מתברר שיש ביניהם חפיפה די גדולה:

הנצפים ביותר
1. סימון אוטומטי של טוקבקיסטים אינטליגנטים
2. טעות הייחוס הבסיסית
3. הדמוגרפיה של לוחמי צה“ל (המשך)
4. איך לבחור שם לאתר אינטרנט?
5. משקיעים חכמים ומשקיעים צודקים

המועדפים שלי
1. הדמוגרפיה של לוחמי צה“ל (המשך)
2. סימון אוטומטי של טוקבקיסטים אינטליגנטים
3. טעות הייחוס הבסיסית
4. חלוקת החשבון ואפקט זייגרניק
5. על יציבות הממשל בישראל

תגובות
בסה"כ כתבנו השנה 268 תגובות.

אני מפריד בין תגובות "ערכיות" לתגובות "לא ערכיות", כשמבחינתי תגובה ערכית היא כל תגובה שמוסיפה מידע על הפוסט או תורמת לדיון סביבו. תגובות שרק מספרות לי כמה הקורא נהנה מהפוסט הן לא ערכיות לפי ההגדרה הזו (למרות שאני כמובן נהנה מאוד לקרוא אותן!). לדעתי, התגובות הערכיות הן הסיבה העיקרית לכך שקוראים חוזרים למאמר גם לאחר הקריאה הראשונה. 

מי כתב יותר תגובות ערכיות - אני או אתם? 

comments-breakdown.gif         

מתברר שבערך אותו הדבר: 72% מהתגובות שלכם ו-70% מהתגובות שלי היו ערכיות. הטבלה הבאה מציגה את חמשת הפוסטים שזכו לתגובות הרבות ביותר, ללא התייחסות לערכיות:

המוגבים ביותר
1. סימון אוטומטי של טוקבקיסטים אינטליגנטים
2. מעבר לאינסוף
3. טעות הייחוס הבסיסית
4. חלוקת החשבון ואפקט זייגרניק
5. על יציבות הממשל בישראל

ולסיכום
כשהתחלתי לכתוב את הבלוג, חשבתי שאנסה את זה למשך שנה ואז אחליט אם להמשיך. השנה האחרונה בבלוג היתה מצוינת, ומבחינתי הניסוי הוכתר בהצלחה. תודה לכל הקוראים והמגיבים!

מעבר לאינסוף

חמישי, 29 במרץ 2007

שלשום התפרסם ש-Yahoo Mail תציע החל מהחודש הבא תיבות דואר אינסופיות בחינם (כרגע שטח האיחסון של Yahoo עומד עדיין על 2Gb, למול 2.75Gb של GMail ו-1Gb של Hotmail).

נניח לרגע שב-Yahoo באמת מתכוונים לשטח איחסון אינסופי, ולא סתם לשטח איחסון גדול מאוד. השאלה היא מה זה אומר בכלל? מה המשמעות של משהו "אינסופי"?

באנליזה ממשית (חדו"א) לאינסוף יש משמעות רק כחלק מביטוי גבול. פורמאלית, אומרים שגבול של סדרה הוא אינסופי (סימון: ∞) אם לכל מספר נתון אפשר למצוא איבר בסדרה כך שממנו והלאה כל האיברים בסדרה גדולים מהמספר הנתון. לדוגמא: סדרת המספרים שהאיבר ה-N שלה מוגדר ע"י 2N-1,000,000 היא כזו, ולמשל עבור המספר 74,000 אפשר לבחור את האיבר ה-1,000,000 בסדרה (קצת בזבני, אבל עובד).

אינטואיציה למשמעות ההגדרה אפשר למצוא אצל דיוויד לודג'. ב-The Picturegoers הוא כותב כך: "חשבו על כדור ברזל בגודל כדור הארץ, וזבוב שנוגע בו פעם במליון שנה. כשהכדור יתפורר כולו מהחיכוך, האינסוף אפילו לא התחיל".

במובן הזה, המשמעות של תיבת דואר אינסופית היא שהיא יכולה להכיל כמות מידע גדולה כרצונכם. רוצים לשמור את ספריית הקונגרס האמריקאי כ-attachment? אין שום בעיה. שטח האיחסון הרי גדול מ-20Tb. רוצים לשמור יותר מיילים ממספר החלקיקים ביקום? Yahoo אפילו לא ימצמצו. מספר החלקיקים מוערך בכ-80^10 (1 ואחריו 80 אפסים), וכמובן שהתיבה גדולה גם ממנו.

נראה, אם כן, שתיבת דואר אינסופית מספקת את כל צרכי האיחסון שיכולים להיות לנו. האמנם?

לא בהכרח. נניח שאני רוצה לפתוח שירות מתחרה ל-Yahoo Mail, ובדומה להם להציע תיבות דואר אינסופיות. כיוון שנפח הדיסק שלי מוגבל, אני מרמה: אני פותח תיבת דואר אישית (יחידה!) ב-Yahoo, ובכל פעם שמשתמש מקבל או שולח מייל בשירות שלי - אני בעצם שומר אותו בתיבה שפתחתי.

האם זה יעבוד? במילים אחרות, האם תיבה אינסופית אחת של Yahoo יכולה להכיל שתי תיבות אינסופיות אחרות? עשרים תיבות אינסופיות? אינסוף תיבות אינסופיות?

השאלה הזו דורשת מאיתנו לעשות משהו שהוא לכאורה בלתי אפשרי - להשוות בין אינסוף אחד לאינסוף אחר. זה כאילו נשאל מה יש יותר - מספרים שלמים, או מספרים שלמים זוגיים. על פניו נראה שיש יותר מספרים שלמים (כי הם כוללים בתוכם את הזוגיים, ובנוסף גם את האי-זוגיים), אבל למעשה שני הביטויים שווים לאינסוף! האם ∞ > ∞ ?

כדי לענות על השאלה, מתמטיקאים נדרשו למצוא הגדרה טובה יותר למושג אינסוף (ולמעשה גם למושג "קטן מ"). התוצאה היתה הגדרת המושג "עוצמה" כחלק מתורת הקבוצות - אינטואיטיבית, אפשר לחשוב על עוצמה של קבוצה כמדד למספר האיברים בה.

חמוש בהגדרות החדשות, המתמטיקאי הגרמני גיאורג קנטור הוכיח שעוצמת קבוצת המספרים הזוגיים שווה לעוצמת קבוצת המספרים השלמים (וגם לעוצמת המספרים הטבעיים, הרציונליים והאלגבריים). לעוצמה הזו, שהיא כמובן אינסופית, הוא קרא א'-אפס (הסימון המקובל בעולם משתמש באות העברית א). כדי להבין את רעיון ההוכחה (ועוצמות באופן כללי) מומלץ לקרוא את סיפור המלון של הילברט.

האם כל העוצמות האינסופיות שוות זו לזו? באופן מפתיע, מתברר שלא. קנטור הוכיח שעוצמת המספרים הממשיים (שמסומנת פשוט: א') גדולה יותר מא'-אפס. אינטואיטיבית, המשמעות היא שיש יותר מספרים בין 0 ל-1, מאשר מספרים שלמים. קנטור גם הוכיח שקבוצת כל העוצמות היא בעצמה קבוצה אינסופית. במילים אחרות: לא רק שיש יותר מסוג אחד של אינסוף, מספר הסוגים הזה הוא בעצמו אינסופי. יותר מזה - אין אינסוף שגדול מכולם, ולכל אינסוף ניתן למצוא אינסוף אחר שממש גדול ממנו.

ובחזרה לתיבות הדואר. האם התיבה האינסופית של Yahoo היא השלב האחרון בתחרות בין ספקיות הדואר, ול-GMail נשאר רק להציע תיבת "אינסוף + 1Gb", כמו שמישהו הציע בצחוק? התשובה היא לא מוחלט. אפילו אם Yahoo אכן יציעו תיבה עם שטח איחסון אינסופי, יתכן שהיא לא תוכל להכיל מייל עבור כל מספר בין 0 ל-1. ואפילו אם כן, GMail עדיין יוכלו להציע תיבה אינסופית גדולה יותר. וכך עד אינסוף.

והערה לסיום: אחת השאלות התיאורטיות המעניינות במתמטיקה של האינסוף, היתה האם קיימת עוצמה אינסופית שגדולה ממש מא'-אפס וקטנה ממש מ-א'. קנטור טען שלא קיימת עוצמה כזו ("השערת הרצף"). מתברר שהתשובה מורכבת יותר מכן או לא, ולמעשה התשובה היא שאי אפשר לדעת. ב-1963 השלים פול כהן הוכחה שהתחיל קורט גדל ב-1940, והראה שהבעיה אינה כריעה, ז"א שלעולם לא ניתן יהיה להוכיח את נכונותה או לשלול אותה. הכוונה היא לא שההוכחה קשה במיוחד, אלא שהוכחה כזו אינה קיימת (במובן של משפט אי השלמות של גדל). פול כהן נפטר בשבוע שעבר, בגיל 72.

קודגורו אקסטרים 2007

שלישי, 20 בפברואר 2007

בבוקר יום ראשון הקרוב (25/2) תערך במכון ויצמן תחרות קודגורו אקסטרים 2007. זו השנה השלישית לתחרות, שמקורה ביוזמה שלי שזכתה לתמיכה של מגוון גופים: מכון ויצמן למדע, המרכז הבינתחומי הרצליה, חברת אלאדין, שירות ביטחון כללי ועוד.

התחרות מבוססת על הקונספט של Core Wars - מלחמה בין תוכניות מחשב. הרעיון הבסיסי פשוט למדי: הצוותים המתחרים כותבים תוכניות מחשב קצרות שנטענות למרחב זיכרון משותף ומורצות במקביל (התוכניות נכתבות בשפת אסמבלי של מעבד 8086 סטנדרטי). במהלך המשחק, התוכניות מנסות לפגוע זו בזו ולהמנע מפגיעה בעצמן. כשנשארת תוכנית אחת בלבד, היא מוכרזת כמנצחת.

התמונה הבאה מציגה קרב אקראי מהתחרות שנערכה בשנה שעברה. הריבוע הגדול מציין את מרחב הזיכרון המשותף, והצבעים השונים שבתוכו - מקומות ש"הופצצו" ע"י צוותים שונים:

cgx.gif

כדי לזכות בתחרות, הצוותים המתחרים - רובם תלמידי תיכון - נדרשים להפגין מגוון יכולות: חשיבה אסטרטגית (איזון אופטימלי בין התקפה להגנה), יכולת טכנית (כתיבת קוד יעיל באסמבלי), גמישות מחשבתית ועבודה בלחץ זמן (שינוי התוכנית ביום התחרות, כך שתתמודד בצורה הטובה ביותר מול המתחרים בפועל), יצירתיות ושיתוף פעולה. באופן טבעי, הצוותים הטובים בכל תחרות זוכים להתעניינות מצד גורמים שונים בתעשיה ובכלל.

מניסיון העבר, התחרות עצמה היא אירוע נחמד מאוד, לצוותים המתחרים וגם לצופים. התחרות פתוחה לקהל הרחב, וכולכם מוזמנים לבוא ולראות - שלב הגמר מתחיל מעט אחרי השעה 12:00. פרטים נוספים ניתן למצוא באתר הרשמי של התחרות.

למתעניינים בטכנולוגיה שמאחורי המשחק: המנוע הייעודי שמריץ את התחרות (שכולל אמולוציה מלאה למעבד 8086 של אינטל) פותח ב-Java כפרויקט קוד פתוח, וניתן להורדה כאן.