ארכיון פוסטים ששייכים לנושא 'מתמטיקה'

פוקר ודירוגים

שלישי, 09 ביוני 2009

כששואלים אותי למה הלכתי ללמוד מתמטיקה ופסיכולוגיה, אני עונה שעשיתי את זה כדי להשתפר בפוקר: שחקן פוקר טוב נדרש לשלב ידע בהסתברות, בסטטיסטיקה, בתורת המשחקים, באמוציות ובפיזיולוגיה שלהם (שפת גוף, למשל), בקבלת החלטות ואולי גם בתורות אישיות.

משחק הפוקר עצמו, על הווריאציות השונות שלו, מסובך להפליא למידול ולחקירה (משחק חוזר, רב-משתתפים, לא דטרמיניסטי ועם אינפורמציה חלקית. שח-מט, למשל, הוא משחק ילדים לעומתו), והתוספת של אלמנטים פסיכולוגיים רק מגדילה את הפער בין כל מודל תיאורטי לבין המציאות. לכן, כמעט בלתי אפשרי לתאר בצורה אנליטית את אסטרטגיות המשחק של שחקנים שונים, ובפרט להשוות ביניהן ולהגיע למסקנה ברורה מי השחקן הטוב יותר.

הפוסט הנוכחי לא יעסוק בדרך הטובה ביותר לשחק פוקר. השאלה שאנסה לענות עליה בסיסית יותר, והיא כיצד בכלל ניתן להשוות בין שחקני פוקר שונים. ספציפית, בהינתן קבוצת שחקני פוקר שמשחקים זה עם זה באופן קבוע, מי השחקן הטוב יותר מביניהם?

poker-chips.png

כדי שהדיון הנוכחי לא יהיה תיאורטי לחלוטין, אבסס אותו על נתונים אמיתיים. בשנה האחרונה שיחקתי פוקר עם קבוצה פחות-או-יותר קבועה: "גרעין קשה" של בערך 10 חברים, ושחקנים מזדמנים שהצטרפו מדי פעם. שיחקנו טקסס הולדם בתצורת טורניר, כשעלות הכניסה היא 20 ש"ח לאדם (ללא rebuy) וחלוקת הפרסים קבועה בהתאם למספר השחקנים. בטורניר ממוצע השתתפו 6-7 שחקנים, והוא ארך כשעה וחצי. עבור כל משחק שהתרחש (גם לא בנוכחותי), ניהלתי רישום של השחקנים שהשתתפו ושל חלוקת הפרסים ביניהם.

בסה"כ נרשמו 377 משחקים בהם השתתפו 28 שחקנים, עם מחזור כספים של 41,300 ש"ח. מתוכם, אגביל את הדיון למשחקים שהתרחשו ברבעון השלישי של 2008: 71 משחקים בהם השתתפו 12 שחקנים, עם מחזור כספים של 7,720 ש"ח (כיוון שאסטרטגיות משחק בפוקר עשויות להשתנות לאורך זמן, דיון רציני בשאלה מי משחק טוב יותר חייב גם הוא להגביל את עצמו לתקופה באורך סביר). בקבוצת הפוקר שלנו נוהגים להסתכל על תוצאות רבעוניות, ובחרתי להתמקד ברבעון שבו באו לידי ביטוי סוגיות מעניינות לגבי דירוג השחקנים - זה לאו דוקא הרבעון שבו השגתי את התוצאות הטובות ביותר.

הגרף הבא מציג את מספר המשחקים בהם השתתף כל שחקן. כפי שניתן לראות, יש שונות גדולה בין השחקנים (חלק מהשמות בדויים):

poker-played.png

לפני שאמשיך בניתוח, נשאלת השאלה האם משחקי הפוקר שלנו חוקיים. האיסור הרלוונטי בחוק הוא סעיף י"ב בחוק העונשין, העוסק ב"משחקים אסורים, הגרלות והימורים". משחק אסור מוגדר שם כ"משחק שבו עשוי אדם לזכות בכסף, בשווה כסף או בטובת הנאה לפי תוצאות המשחק, והתוצאות תלויות בגורל יותר מאשר בהבנה או ביכולת". ניתן להתווכח האם התוצאה בטורניר פוקר אכן תלויה בגורל יותר מאשר בהבנה או ביכולת. באופן אישי, אני מאמין שלאורך זמן התשובה היא שלילית (אמנם, אם המזל היה משחק תפקיד עיקרי בפוקר, ניתן היה לצפות כי ניצחונות בטורנירים יתפלגו בצורה כמעט אחידה בין השחקנים. בפועל, ניתן להראות ברמת בטחון גבוהה ביותר כי לפחות במקרה שלנו זה לא המצב). בכל מקרה, המשחקים שלנו בודאי חוקיים כיוון שהם עומדים בסעיף 230 של החוק ("נסיבות מיוחדות"), המתיר משחקים אם הם א) מכוונים לחוג אנשים מסוים ב) אינם חורגים מגדר שעשוע או בידור ג) אינם נערכים במקום משחקים אסורים.

ובחזרה לנושא העיקרי: מהו מדד טוב לרמת המשחק של כל שחקן בטורניר נתון? מדד אפשרי, למשל, הוא המיקום אליו הגיע בטורניר. אפשרות אחרת היא למדוד בצורה כלשהי את האופן שבו שיחק ידיים ספציפיות. טענתי היא שבהינתן מספיק משחקים, המדד היחיד לטיב המשחק הוא מדד התוצאה, או במילים אחרות: כמות הכסף שהרוויח כל שחקן. מבחינתי, שחקן שמסיים כל טורניר במקום רביעי (ללא פרס), משחק משמעותית רע יותר משחקן שמסיים 90% מהטורנירים במקום האחרון (ללא פרס) ו-10% מהטורנירים במקום הראשון (עם פרס). השחקן הראשון מפסיד כסף תמיד והשחקן השני לא - ובמובן הזה, השחקן השני משחק טוב יותר. העובדה שהשחקן הראשון אולי שיחק ידיים ספציפיות טוב יותר לא רלוונטית לדיון: המטרה היחידה בפוקר היא להרוויח כסף, ובפרט לאורך זמן זהו המדד היחיד לטיב המשחק.

הגרף הבא מציג את כמות הכסף שהרוויח כל שחקן (פרסים שקיבל פחות דמי השתתפות ששילם):

poker-total.png

הסתכלות בגרף מעלה שתי נקודות מעניינות. ראשית, נשאלת השאלה האם מי שהרוויח יותר כסף הוא אכן שחקן טוב יותר (שימו לב! אמנם טענתי שמדד הכסף מייצג את טיב המשחק, אבל לא ברור בכלל שדוקא כמות הכסף הכוללת היא המדד הנכון). למשל, שי הרוויח פי 2 מניר, אבל גם שיחק פי 1.5 משחקים ממנו. האמנם שי שחקן טוב יותר? ברור שמדד שלא משקלל את כמות המשחקים ששיחק כל שחקן לא עונה על השאלה הנכונה. שנית, סולם המדידה של המדד הנוכחי אינו מייצג יחס מנה: האם ניתן לומר ששי משחק טוב יותר מניר פי 2? אם כן, פי כמה משחק שי טוב יותר מאלון?

פתרון מתבקש לבעיה הראשונה הוא למדוד את הרווח הממוצע למשחק, במקום את הרווח הכולל. פורמאלית, היינו רוצים לדעת את תוחלת המשתנה המקרי שמייצג את הרווח של כל שחקן ממשחק בודד. אם נניח שהרווח במשחקים שונים מתפלג בצורה זהה ובלתי תלויה, אז ממוצע הרווח במשחקים שראינו הוא אומד טוב לתוחלת הזו.

הגרף הבא מציג את ממוצע הרווח למשחק של כל שחקן (רווח כולל חלקי מספר משחקים):

poker-average.png

המדד הזה בודאי רלוונטי יותר לדיון מכמות הכסף הכוללת שהרוויח כל שחקן, אבל יש לו שתי בעיות מהותיות: ראשית, יש הבדל בין שחקן שהפסיד בממוצע 20 שקלים למשחק לאורך שבעה משחקים לבין שחקן שהפסיד בממוצע 20 שקלים למשחק לאורך שבעים משחקים - אבל המדד הנוכחי לא מתחשב בכך. לדוגמא, תומר הפסיד 20 שקלים בממוצע לאורך 2 משחקים, וגאס הפסיד 7.5 שקלים בממוצע לאורך 64 משחקים. כיוון שגם לשחקן מצוין יש סיכוי סביר להפסיד ב-2 המשחקים הראשונים, לא ברור בכלל שגאס צריך להחשב לשחקן טוב יותר. באופן מקביל, גיל הרוויח 30 שקלים בממוצע לאורך 2 משחקים בלבד - האם זה מספיק כדי לומר שהוא השחקן הטוב ביותר? פורמאלית, המדד שלנו הוא סטטיסטי ולכן יש לו שונות. השאלה היא כיצד להתחשב בשונות הזאת במדד הסופי. למשל, היינו יכולים לתת לכל שחקן רווח סמך, כמו בסקרי בחירות: "ארז מרוויח בממוצע למשחק בין 1.2 ל-2.4 שקלים", אבל אז היתה נשאלת השאלה איך משווים בין שני שחקנים - לפי הגבול העליון? לפי הגבול התחתון?

שנית, כדי שבכלל יהיה טעם בהשוואת תוחלות רווח של אנשים שונים, צריך להניח שהם משחקים בתנאים זהים - השאלה היא האם זה מתקיים במקרה הנוכחי. למשל, נניח ששי משחק רק במשחקים שגם אופיר משחק בהם. כיוון שאופיר מרוויח הרבה בממוצע למשחק, ברור שבמובן מסויים שי מרוויח פחות מאשר אם אופיר לא היה משחק (ובאופן כללי, כששחקנים טובים משחקים זה מול זה הם מורידים באופן מעשי את תוחלת הרווח שלהם: מדד הממוצע מוטה לטובת שחקנים שנוטים לשחק מול שחקנים טובים פחות, על חשבון שחקנים שמעדיפים - או נאלצים - לשחק מול שחקנים טובים יותר). זה מקביל לכך שפדרר ימנע מלשחק מול נאדל, ובכל זאת יצליח לעבור אותו בדירוג העולמי כי ניצח המון ילדים בני ארבע.

פתרון חלקי לבעיה האחרונה הוא לבחון בנפרד כל תת קבוצה של שחקנים. למשל, תחילה נתבונן רק במשחקים שנערכו בין אופיר, ארז, חוליאן, גאס ונתן ונחשב את ממוצע הרווח של כל שחקן במשחקים אלה. לאחר מכן נתבונן רק במשחקים שנערכו בין אופיר, ארז, חוליאן, גאס וניר, ונחשב גם שם ממוצעי רווח. בסופו של דבר, כשנסיים לעבור על כל תתי הקבוצות האפשריות, נקבל רשימה ארוכה של ממוצעי רווח לכל שחקן. כל רשימה כזאת ניתן אז לצמצם לערך יחיד ע"י ממוצע משוקלל.

הגרף הבא מציג עבור כל שחקן את מספר תתי הקבוצות שהשתתף במשחקים שלהן. כפי שניתן לראות, שחקנים מסויימים אכן נוטים לשחק בתתי קבוצות "קבועות" יחסית (ניתן להשוות את היחס בין סה"כ המשחקים של כל שחקן לבין מספר תתי הקבוצות ששיחק בהן):

poker-groups-total.png

מהו השיקלול הנכון של רשימת הממוצעים שקיבלנו לערך בודד? שיקלול טריוויאלי הוא לתת משקל זהה עבור כל תת קבוצה. שיקלול אפשרי אחר הוא לתת משקל גדול יותר לתתי קבוצות שבהן מספר גדול יותר של שחקנים. למי שמכיר מושגים בסיסיים במשחקים שיתופיים, זה עשוי להשמע מוכר: השיקלול הראשון דומה במהותו לערך בנזף, והשני לערך שפלי.

הגרף הבא מציג את ממוצע הרווח המשוקלל למשחק של כל שחקן, בשיקלול הטריוויאלי. הערך שמוצמד לכל שחקן עונה, פחות או יותר, על השאלה הבאה: אם נגריל תת קבוצה אקראית של שחקנים ונערוך ביניהם משחק, כמה ירוויח בתוחלת כל שחקן?

poker-groups-average.png

כפי שניתן לראות, המדד הזה צמצם מאוד את הפער בפסגה (למשל, ההפרש בין שי לאופיר קטן משמעותית פה לעומת מדד הממוצע הרגיל), וגם הסדר היחסי של השחקנים השתנה מעט. בפועל, מדד ממוצע הרווח המשוקלל אכן מצמצם את בעית ה"עדיף לשחק נגד שחקנים חלשים", אך בודאי אינו פותר אותה: כמו קודם, שחקן יכול לקבל דירוג גבוה יותר משחקנים טובים ממנו ע"י כך שימנע לחלוטין מלשחק מולם.

מה שנדרש הוא מדד שבו התגמול לשחקנים שניצחו שחקנים שדורגו גבוה מהם, גדול יותר מאשר התגמול לשחקנים שניצחו שחקנים שדורגו נמוך מהם. במילים אחרות, כששחקן כלשהו מנצח משחק, השינוי בדירוג שלו צריך להיות פונקציה של השחקנים שהוא ניצח, והדירוג שלו צריך לעלות יותר כשהוא מנצח שחקנים שדורגו גבוה ממנו (שוב, הניסיון כאן הוא להמנע מאפקט "פדרר והילדים" שהזכרתי קודם). דוגמא למדד כזה הוא מד הכושר של אלו - הסטנדרט העולמי לדירוג שחקני שחמט - שלמרבה הצער אינו רלוונטי לדירוג שחקני פוקר.

קצת מחשבה הובילה אותי למסקנה שהבעיה מקבילה ל… חיפוש באינטרנט!

בשלב ראשון, נשים לב שאת כל המשחקים שהתרחשו עד כה ניתן לראות כגרף מכוון וממושקל, שבו קודקודים מייצגים שחקנים והמשקלות על הקשתות מייצגות סכומי כסף שעברו משחקן לשחקן. למשל, משחק יחיד של ארבעה שחקנים (דני, אופיר, ארז, ניר) שבו ניר outplayed everyone וזכה בכל הקופה נראה כך (באדיבות Gliffy):

poker-graph.png

אם נעדכן את הקודקודים והקשתות כך שייצגו את כל המשחקים שנערכו, נקבל בסופו של דבר גרף די גדול ועמוס. בשלב זה, ניתן להפעיל על הגרף את אלגוריתם PageRank של גוגל (או בשמו החדש: PokerRank) ולקבל דירוג לכל שחקן. הדירוגים שמתקבלים הם למעשה ההסתברות הסטציונרית של שרשרת המעבר המרקובית שמייצגת את תנועת הכסף בין האנשים, או במילים אחרות, התשובה לשאלה הבאה: נניח שמישהו זורק שקל לתוך קופת הפרסים של טורניר כלשהו, והמנצח בטורניר מקבל אותו. בכל פעם שיערך משחק אח"כ, יש סיכוי כלשהו שהשקל יחליף ידיים. אחרי שיעבור הרבה זמן (והרבה משחקים נוספים), מה הסיכוי שהשקל יהיה בכיס של כל אחד מהשחקנים?

כדי להבין את הקשר בין הפסקה האחרונה לבין חיפוש באינטרנט, תחשבו על הבעיה הבאה (שהעסיקה פעם את מייסדי גוגל): בפוסט הזה יש מספר קישורים לאתרים חיצוניים, ובכל פעם שאתם נתקלים באחד כזה יש סיכוי מסוים שתלחצו עליו. משם יש סיכוי שתלחצו על לינק לאתר אחר, וחוזר חלילה. PageRank מתאים לכל אתר באינטרנט את הסיכוי שבעוד שעה (נניח), תגלשו דוקא באתר ההוא. כהערת אגב, אלגוריתם PageRank מקבל פרמטר שמגדיר את הסיכוי שתעברו מאתר א' לאתר ב' שלא מקושר אליו (למשל ע"י תקתוק ישיר בשורת הכתובת של הדפדפן). במקרה שלנו, ניתן לתת לפרמטר הזה מובן של "כמה פוקר מבוסס על מזל לעומת יכולת". אני בחרתי להריץ את האלגוריתם עם 80-20 לטובת יכולת (ככל שמניחים מעורבות חזקה יותר של מזל, ההפרשים בין דירוגי האנשים מצטמצמים, אך הסדר ביניהם לא משתנה).

הגרף הבא מציג את ערכי ה-PokerRank של השחקנים השונים:

poker-pokerrank.png

למדד ה-PokerRank יש שני יתרונות בולטים: ראשית, לראשונה קיבלנו מדד שמייצג סולם יחס. יש סיכוי של 0.14 שהשקל יסיים בידיים של ארז, וסיכוי של 0.07 שהשקל יסיים בידיים של ניר - ובמובן הזה, ארז אכן טוב מניר פי 2. שנית, המדד הזה אכן מתגמל את מי שמשחק (ומנצח) מול שחקנים שמדורגים בו גבוה - בדיוק כמו בגלישה באינטרנט, שם יש סיכוי גבוה יותר שיגיעו אליכם גולשים אם קיבלתם לינק מ-ynet מאשר מהבלוג הנוכחי.

מצד שני, למדד הזה יש גם חסרון משמעותי: ככל שתשחקו יותר, הדירוג שלכם יעלה. ואכן, הסיכוי שהשקל יסיים בידיו של שחקן מעולה שמנצח 90% מהטורנירים אבל משחק לעיתים רחוקות מאוד, קטן מהסיכוי שיסיים בידיו של שחקן ממוצע שמשחק תמיד. זאת בעיה קשה, כי בסופו של דבר אנחנו רוצים לדעת מי משחק טוב יותר, ולא רק מי משחק יותר. בכל זאת, מדד ה-PokerRank מקיים הרבה מהתכונות שהיינו מצפים למצוא במדד האידיאלי.

המדד האחרון שאציג הוא אולי המסובך ביותר להבנה, אבל לטעמי המוצלח ביותר.

הסכמנו כבר ששחקן טוב הוא פשוט שחקן שמרוויח כסף, או במילים אחרות: שחקן שתוחלת הרווח שלו למשחק חיובית. עבור כל שחקן ספציפי, ניתן לשאול עד כמה סביר שהוא אכן שחקן טוב בהינתן מדגם המשחקים שהשתתף בהם. לחילופין, ניתן לשאול את השאלה הבאה: נניח שלשחקן קופה התחלתית של 1000 ש"ח. בכל פעם שהשחקן משתתף במשחק הוא משלם את דמי הכניסה מהקופה שלו, וכל פרס שיזכה בו יכנס בחזרה לקופה. מה הסיכוי שהשחקן ישרוד לנצח, ז"א לעולם לא "יהרס"?

השאלה הזו עמוקה יותר ממה שנראה. ראשית, שימו לב שאם לשחקן יש תוחלת רווח שלילית, סיכוי ההישרדות שלו הוא ממש 0 (זאת תוצאה ישירה של החוק החזק של המספרים הגדולים). לעומת זאת, אם לשחקן יש תוחלת רווח חיובית (אבל הוא עדין יכול להפסיד מדי פעם), סיכוי ההישרדות שלו גדול מ-0, אבל קטן ממש מ-1. הסיבה היא שהשחקן עשוי להפסיד רצף של משחקים שיחסל את הקופה ההתחלתית שלו. אולי מדובר בסיכוי נמוך מאוד, אבל האפשרות קיימת.

בפועל, כמובן, תוחלת הרווח של השחקן (ומן הסתם גם התפלגות הרווח שלו למשחק) אינה ידועה לנו. מה שכן, יש לנו מדגם של משחקים שהשחקן השתתף בהם, ובעזרתו ניתן לאמוד אותה. Bill Chen פיתח מודל סטטיסטי שמאפשר לנו להעריך את סיכוי ההישרדות של שחקן תחת מספר הנחות פשוטות (בעיקר הנחות נורמאליות, שמתקיימות עבור מדגמים גדולים ממשפט הגבול המרכזי) ע"י חישוב של כמה אינטגרלים. קוראים שמתעניינים בפרטים מופנים לפרקים 22-23 בספר של צ'ן שמוזכר בסוף הפוסט.

הגרף הבא מציג את סיכוי ההישרדות של השחקנים השונים:

poker-survival.png

מה שהופך את המדד הזה למוצלח כל כך בעיני, הוא שהוא משקלל לתוכו גם את ממוצע הרווח למשחק, גם את שונות הרווח של השחקן וגם את מספר המשחקים ששיחק. מדד ההישרדות מתגמל שחקנים עם ממוצע רווח למשחק גבוה ושונות רווח למשחק נמוכה (ז"א שחקנים טובים ויציבים), ומעניש שחקנים עם ממוצע רווח למשחק נמוך ושונות רווח למשחק גבוהה (שחקנים רעים ולא יציבים). מספר המשחקים ששיחקת משמש כמגבר, ז"א יותר משחקים יגדילו את התגמול / העונש שקיבלת. בנוסף, בדומה למדד ה-PokerRank גם מדד ההישרדות מייצג סולם יחס.

אז לסיכום, מה היה לנו פה? ראינו מדדים שונים לדירוג שחקני פוקר: ממדדים סטטיסטיים פשוטים כמו ממוצע למשחק ועד מדדים מסובכים שמקורם בתיאוריה של תהליכים סטוכסטיים. בשורה התחתונה, אין תשובה חד משמעית לשאלה באיזה מדד להשתמש. כל מדד מספר לנו אינפורמציה מעט שונה על השחקנים, וכל קורא מוזמן לבחור את המדד שנראה לו ביותר. מהסתכלות על תקופות שונות של המשחקים שלנו, מדד ההישרדות הוא הקרוב ביותר לקונספט שיש לי לגבי שחקנים טובים.

אגב, כיוון שהחישובים של חלק מהמדדים כבדים יחסית (ספציפית PokerRank ומדד ההישרדות), הסטטיסטיקות והדירוגים בקבוצה שלנו כבר מזמן לא מנוהלים בקובץ Excel פשוט. היום כל העסק מנוהל ונגיש דרך אפליקצית web ייעודית שכתבתי ב-Java, ומחובר לפייסבוק דרך Facebook Connect. בנוסף למדדים שהזכרתי למעלה, האפליקציה גם מספרת לך מי הנמסיס שלך (השחקן שנוכחותו במשחק מקטינה את הרווח הממוצע שלך בצורה המשמעותית ביותר) ומי הסיידקיק שלך (השחקן שנוכחותו במשחק מגדילה את הרווח הממוצע שלך בצורה המשמעותית ביותר). אולי מתישהו אפתח אותה לשימוש גם ע"י קבוצות פוקר אחרות. ואולי לא :)

ולסיום, הנה רשימת קריאה מומלצת במיוחד למי שבכל זאת רוצה לשפר את משחק הפוקר שלו:

מפת ישראל בגוגל מפס

שני, 18 באוגוסט 2008

בתקופה האחרונה יצא לי להתעסק הרבה עם שירות המפות של גוגל (Google Maps), וספציפית להשתמש בממשק שגוגל מציעים כדי להציג נתונים על מפה ולשלב את התוצאה באתר חיצוני.

הבעיה היא שנכון לרגע זה, גוגל לא מספקים מפות של ישראל, אלא רק תצלומי לווין. לעומת זאת, אתרים שכן מציגים מפות של ישראל (למשל emap ו-וואלה! מפות) לא מאפשרים לשלב את המפה באתר חיצוני או להציג עליה שכבות מידע נוספות. בפוסט הנוכחי אציג פתרון שמבוסס על הצגת מפות מהאתר ABMaps כשכבה בתוך גוגל מפס.

קוד עובד שמאפשר לעשות זאת ניתן להורדה פה תחת רישיון קוד פתוח. כיוון ששימוש בקוד בודאי מפר את תנאי השימוש של כמה אתרים, המלצתי האישית היא לא להשתמש בו בכלל, ובפרט לא באפליקציה מסחרית. הקוד מוצע להורדה למטרות חינוכיות בלבד, והתוצאה הסופית נראית כך:

abmaps.jpg

כדי להבין איך הפתרון עובד, צריך קודם להבין איך עובדות מפות באופן כללי. הרעיון הבסיסי הוא שיש לנו מידע שנמצא על שטח הפנים של כדור הארץ (או לחילופין על גלובוס), ואנחנו רוצים להציג אותו על דף ניר רגיל. כדור הארץ אמנם תלת מימדי, אבל שטח הפנים שלו דו מימדי - ולכן לפחות ברמה הראשונית לא נראה שאמורה להיות בעיה.

השאלה היא איך בדיוק עושים את זה. כדי להבין איפה הבעיה, תחשבו על תפוז, ותנסו לדמיין איך אפשר להוריד ממנו את הקליפה ולהציג אותה כמלבן מושלם - כשאסור לקרוע מהקליפה חלקים ולשנות את המיקום שלהם.

הפתרון מגיע מהמתמטיקה: בניסוח פורמאלי, השאלה היא כיצד למפות (ז"א להתאים באופן חד-חד ערכי) נקודות על פני כדור תלת-מימדי לנקודות במישור הדו-מימדי. העובדה שניתן לעשות זאת שקולה לכך ששטח הפנים של כדור הוא יריעה דו-מימדית (למשל ניתן לתאר כל נקודה כזו בעזרת שתי קורדינטות כדוריות).

מה שמעניין יותר, הוא שכל מיפוי כזה בהכרח יגרום לעיוותים במרחב, במובן שמרחקים בין נקודות ישתנו כשנעבור מהגלובוס למפה: שני זוגות של נקודות במרחק זהה על הגלובוס עלולים להיות פתאום במרחק שונה על המפה. אם נחשוב שוב על קליפת התפוז שלנו, המשמעות היא שאם אנחנו רוצים למלבן את הקליפה מבלי לשבור אותה לחתיכות, נהיה חייבים למתוח או לדחוס חלקים ממנה.

בפועל, במפות של כדור הארץ נהוג להשתמש בהתאמה בשם היטל מרקטור (Mercator projection), עם נוסחא נוראית מספיק בשביל לכלול לוגריתם של טנגנס. מה לגבי העיוותים במרחב? מתברר שלא חסרים כאלה. למשל, לפי המפות הסטנדרטיות נראה שלגרינלנד ולאפריקה שטח זהה, כשבפועל שטחה של אפריקה גדול פי 14. באופן דומה, אלסקה נראית גדולה יותר מברזיל, למרות שהאחרונה גדולה ממנה פי 5 ויותר. מי שלא מאמין (ואין לו גלובוס בבית בשביל לבדוק) יכול להשוות בין גוגל מפס לגוגל earth.

כעת יש לנו את הכלים להבין איך גוגל מפס עובד. עבור כל רמת זום שנתמכת בגוגל מפס, לגוגל יש מפה מלבנית מתאימה של העולם (שהתקבלה כמובן ע"י הפעלת היטל מרקטור). את המפה הזאת הם בחרו לחלק לריבועי תמונה בגודל 256 על 256 פיקסל כל אחד, ובכל פעם לשלוח לדפדפן רק את הריבועים המתאימים לאיזור הקטן שבו המפה מתמקדת.

למזלינו, גוגל היו חכמים ונחמדים מספיק בשביל לאפשר לכל אחד להרחיב את גוגל מפס, ולהצביע על אתר חיצוני שמספק ריבועים כאלה. אם היה אתר שיודע לספק ריבועי מפה כאלה שכוללים מפות של ישראל, היינו יכולים להצביע עליו והבעיה היתה נפתרת. שיטוט קצר במספר אתרי מפות באינטרנט (עם FireFox פתוח על FireBug, כדי לבחון אילו קבצים יורדים לדפדפן בכל גלישה כזו) העלה שהאתר ABMaps (של חברת AtlasCT הישראלית) מספק את הסחורה.

כעת נותרו שתי בעיות בלבד: ראשית, התברר ש-ABMaps עובדים עם מלבני מפה בגודל 400 על 280 פיקסלים, בעוד גוגל מוכנה לקבל ריבועים בלבד. למזלינו, מתברר שניתן (ע"י שינוי קל בכתובת התמונה) לבקש מ-ABMaps לספק חלקי מפה בכל גודל שהוא. Problem solved.

הבעיה השניה היתה כיצד להתאים בין הקורדינטות של גוגל לבין הקורדינטות של ABMaps. למשל, ריבוע המפה שלפי גוגל הפינה השמאלית העליונה שלו נמצאת בקורדינטות (256, 1024) לא הצביע על אותו איזור של הריבוע המקביל לפי ABMaps.

הנחתי ש-ABMaps לא המציאו את הגלגל מחדש, ובחרו גם הם להשתמש בהיטל מרקטור, או לכל היותר בטרנספורמציה לינארית שלו. לכן, פתרון לבעיה יהיה פשוט למצוא את המקדמים של הטרנספורמציה הזו, ז"א מדובר בבעיית רגרסיה לינארית. כדי לפתור אותה בחרתי 15 נקודות על כדור הארץ, ומצאתי את הקורדינטות שלהן לפי ABMaps ולפי גוגל מפס. והרי התוצאות:

abmaps-graph.png

המתאם המושלם בין הנתונים מאשש את ההשערה ש-ABMaps משתמשים בטרנספורמציה לינארית על היטל מרקטור הסטנדרטי. בנוסף, ממקדמי הרגרסיה שהתקבלו ניתן לשער שנקודות החיתוך עם הצירים הן בפועל 364000000 ו-164000000, ושהשיפוע זהה עבור קורדינטת ה-x וקורדינטת ה-y. לכן, מודל רגרסיה טוב יותר הוא כזה שמחפש רק את השיפוע (הזהה) האופטימלי בהינתן שנקודות החיתוך עם הצירים הן כנ"ל.

בשלב זה נטשתי את excel, וכתבתי קוד CVX שפותר את הבעיה, כדי להגיע לערך שיפוע של 1.072883578234450 (מה לעשות, כשלומדים למבחן באופטימיזציה לא-לינארית כל בעיה נראית כמו בעית תכנון קמור). התוצאה לא מושלמת - כשמזפזפים בין צילום הלווין של גוגל למפה של ABMaps מקומות זהים לא נופלים בדיוק אחד על השני - אבל היא קרובה מאוד למושלמות.

כאמור, ניתן להוריד את הקוד בקישור הבא.

מי מנצח בווינר?

ראשון, 20 באפריל 2008

הפוסט הנוכחי עוסק במשחק ווינר של המועצה להסדר ההימורים בספורט: תחילה, אעזר במדגם עצום של טפסי ווינר כדי לתאר תופעה מסויימת שקשורה לעמלות של ווינר ליין. אח"כ, אנסה לשכנע שמדובר בתופעה מוזרה מאוד, הסותרת עקרונות כלכליים ופסיכולוגיים בתחום ההימורים. לבסוף, אציע הסבר אפשרי (ולא מספק, לדעתי) לתופעה שמצאתי.

הערת אזהרה: הפוסט הפעם יחסית קשה לקריאה. משיקולי זמן ומקום, אני אניח שלקורא יש הכרות מסויימת עם ווינר ועם עקרונות בסיסיים בהסתברות (למשל ההבדל בין תוחלת לממוצע).

winner.gif

ווינר הוא התשובה החוקית של המועצה להסדר ההימורים בספורט לאתרי ההימורים באינטרנט. למרות שמדובר במשחק חדש יחסית (החל לפעול רק בשנת 2002), הוא מהווה היום את מקור ההכנסה העיקרי של המועצה. למעשה, מדובר בשני משחקים שונים: ווינר ליין וווינר מאצ' - אני אתמקד בראשון.

חוקי ווינר ליין פשוטים למדי: בטופס ווינר ליין רגיל מהמרים על תוצאות 3-6 משחקים. עבור כל משחק יש לבחור 1, 2 או X (ז"א נצחון של הקבוצה הראשונה, נצחון של הקבוצה השניה או תיקו) כשהמטרה היא לצדוק בכולם. בניגוד לטוטו, ווינר הוא מה שמכונה בעגה מקצועית הימור parlay: לכל אחת משלוש התוצאות האפשריות של כל משחק מתלווה יחס שנקבע מראש. אם הצלחת לנחש נכון את תוצאות כל המשחקים שסימנת, תזכה בסכום כסף ששווה למכפלת היחסים המופיעים בטופס. לדוגמא: אם הימרת במשחק הראשון על 1 ביחס של 1:1.5, במשחק השני על X ביחס של 1:1.05 ובמשחק השלישי על 1 ביחס של 1:5, במידה ותזכה תקבל פי 1.5*1.05*5 = 7.875 מהסכום שהשקעת.

בניגוד לאתרי הימורים באינטרנט בהם יחסי ההימורים דינאמיים ומשתנים כל הזמן (עוד על כך, בהמשך), בווינר יחסי ההימורים נקבעים מראש ע"י מחלקה של קובעי יחסי הימורים (odds compilers) של המועצה להסדר ההימורים בספורט, שלכאורה מורכבת מ"מומחים למתמטיקה או סטטיסטיקה או הסתברות … שמבינים בכדורגל ברמה של מידת הנעליים של כל שחקן בליגת המילואים הנורווגית".

השאלה שאנסה לענות עליה, היא עד כמה טובה קביעת יחסי ההימורים בווינר ליין.

winner_line.gif

מידע גולמי על ווינר ניתן למצוא באתר המועצה להסדר ההימורים בספורט: עבור כל משחק שנערך, הארכיון של ווינר ליין מפרט את יחס ההימור שניתן לכל אחת משלוש התוצאות האפשריות ואת התוצאה שהתקבלה בסופו של דבר. הארכיון לא נגיש בפורמט נוח לעבודה, אבל 200 שורות Java ו-15 דקות של "טחינת" האתר הספיקו כדי לייצר עבורי קובץ אקסל ענק עם כלל הנתונים ההיסטוריים של ווינר ליין.

בסה"כ התקבלו נתונים לגבי 54382 משחקים שהתקיימו בתקופה של כ-6 שנים (בין ה-22/5/2002 וה-15/4/2008), ולאחר סילוק נתונים בעייתיים (663 משחקים ללא תוצאה סופית; 86 משחקים ללא יחסי ההימור; 567 משחקים עם שתי תוצאות אפשריות בלבד) נשארו נתונים לגבי 53066 משחקים. כיוון שכל משחק כזה מגלם שלושה הימורים שונים, למעשה התקבלו נתונים לגבי 159198 הימורים שונים - כשעבור כל הימור בודד ידוע יחס ההימור בווינר, והאם בסופו של דבר ההימור זכה.

ניתוח הנתונים מתבסס על החוק החלש של המספרים הגדולים, שקובע כי "במדגמים גדולים הממוצע בדר"כ קרוב לתוחלת". לדוגמא, ווינר הציעו יחס הימור של 1:3 ב-6766 הזדמנויות שונות, ובסופו של דבר זכו 1805 מתוכן. 6766/1805 = 3.75, ולכן ניתן לומר שהימורים שווינר נותנים עליהם יחס של 1:3 זכו במדגם ביחס של 1:3.75. אינטואיטיבית, החוק החלש של המספרים הגדולים מבטיח שבאופן כללי הימורי ווינר ביחס של 1:3 (גם כאלה שיערכו בעתיד!), יזכו ביחס שקרוב ל-1:3.75.

כהערת צד, אוסיף כי כיוון שההימורים השונים בלתי תלויים זה בזה (למעט מקרים נדירים של שני הימורים ביחס זהה על תוצאות שונות של אותו משחק), ניתן להניח כי מספר הזכיות של הימורים ביחס נתון מתפלג בינומית. המשך הניתוח עוסק רק ביחסי הימורים שעבורם מס' הזכיות בפועל היה גדול מ-50, ובפרט ניתן לבצע עבורם קירוב להתפלגות נורמאלית ולהגיע להערכה מדויקת למדי של יחס הזכיה במציאות (ואכן, הוא קרוב מאוד ליחס הזכיה במדגם).

הגרף הבא מציג את תוצאות הניתוח. בציר האופקי מופיע יחס ההימור שניתן בווינר, ובציר האנכי מופיע האומדן ליחס ההימור האמיתי (ז"א שיעור הפעמים בהם הימור ביחס כזה אכן זכה):

winner_chart1.gif

מבט מהיר בגרף מעלה כי היחס בווינר תמיד נמוך מהיחס האמיתי. לדוגמא, הימורי ווינר ביחס 1:2 זוכים ביחס 1:2.52, ולכן (חישוב פשוט) על כל שקל שתשקיעו בהימור כזה תפסידו בתוחלת כ-20 אגורות. הממצא הזה לא מפתיע - הוא בסה"כ מבטא את העובדה שווינר מרוויחים כסף מהמהמרים (ההבדל בין יחס ההימור שווינר מציעים ליחס האמיתי הוא בדיוק העמלה שווינר לוקחים). מה שבכל זאת מפתיע הוא שהעמלה של ווינר תלויה ביחס ההימור, כפי שניתן לראות בגרף הבא:

winner_chart2.gif

כאמור, ההימור בווינר לא משתלם (בתוחלת), כי ווינר מרוויחים כסף על חשבון המהמרים. מה שמוזר הוא שווינר לוקחים עמלה גדולה יותר - ז"א מרוויחים יותר - ככל שיחס ההימור גדול יותר! לדוגמא, על הימורים ביחס 1:1.15 תפסידו בתוחלת כ-12 אגורות לכל שקל, על הימורים ביחס 1:4.2 תפסידו בתוחלת כ-29 אגורות לכל שקל, ועל הימורים ביחס 1:9 תפסידו בתוחלת כ-68 אגורות לכל שקל!

הנקודה האחרונה עשויה להראות בטעות כמו משהו מובן מאליו. יחס הימור נמוך (למשל 1:1.15) אומר שאתה מהמר על הפייבוריט, ויחס הימור גבוה (למשל 1:9) אומר שאתה מהמר על האנדרדוג, ולכאורה סביר שלאורך זמן תפסיד יותר אם תהמר תמיד על האנדרדוג. אך זו כמובן טעות: אמנם בהימורים על הפייבוריט סביר שתזכה יותר פעמים - אבל כשמדובר בתוחלת הרווח, לא בהכרח אמור להיות הבדל בין שני המקרים. תחשבו, למשל, על משחק שבו אתם מהמרים ביחס של 1:6 שיצא 6 בקוביה (הימור על מאורע לא סביר, "האנדרדוג"), לעומת משחק מקביל שבו אתם מהמרים ביחס של 1:1.2 שלא יצא 6 בקוביה (הימור על מאורע סביר, "הפייבוריט") - במקרה זה, התוחלת של שני המשחקים זהה (ושווה לאפס, אלה משחקים הוגנים).

מה שאני מנסה להגיד, הוא שעל פניו לווינר אין סיבה להפלות לרעה את מי שבחר להמר על האנדרדוג. מבחינת ווינר, האידיאל הוא לגבות עמלה זהה מכל מהמר, בלי קשר לדת, גזע, מין או סוג ההימור.

אז מה בעצם קורה כאן? כדי לענות על השאלה, ננסה להבין מה ווינר מנסים להשיג (ומה לא) בקביעה מסויימת של יחסי ההימורים.

נקודת הסתכלות נאיבית היא שווינר מנסים לקבוע את יחס ההימור כך שיהיה מדויק ככל האפשר (במובן של החוק החלש של המספרים הגדולים): בשלב הראשון, ווינר קובעים את יחסי ההימורים "האמיתיים" כך שלאורך זמן, שליש מההימורים שקיבלו יחס אמיתי של 1:3 יקרו בפועל. בשלב השני, ווינר משנים את יחסי ההימורים כך שישקפו עמלה קבועה על כל הימור (למשל, יחס הימור אמיתי של 1:3 יפורסם בטופס כיחס הימור של 1:1.15, לאחר הפרשת עמלה של כ-12%).

איך אפשר לקבוע את יחסי ההימורים האמיתיים? יש הרבה דרכים: אפשר להעסיק odds compilers טובים ולהסתמך על הידע שלהם כמומחים, אפשר להשתמש במודלים סטטיסטיים, אפשר להעזר ב"חוכמת ההמונים" (למשל בורסות הימורים) ואפשר לשלב בין מספר שיטות.

בכל מקרה, אם זה אכן היה המצב, הייתי אומר שווינר עושים עבודה גרועה מאוד בקביעת היחס האמיתי: חישוב פשוט מראה שהעמלה הממוצעת למשחק היא כ-19% (עם סטיית תקן מזערית של כ-0.015%), ואם "ננרמל" את יחסי ההימורים כך שלא ישקפו את העמלה (ז"א נחזור, לכאורה, ליחסי ההימורים האמיתיים תחת ההנחה שהעמלה קבועה) נגלה שהם מוטים מאוד לעומת הקו האידיאלי של Y=X (אני לא ארחיב, אבל למעשה מדובר בצורת הסתכלות שונה על הגרף האחרון).

אם שתי הפסקאות האחרונות לא היו ברורות מספיק, זה לא מאוד משנה. העובדה הפשוטה היא שווינר, ולצורך העניין גם אתרי הימורים באינטרנט, לא מנסים לקבוע את יחס ההימור כך שישקף את המציאות! הסיבה לכך היא שהשאיפה של אתרי הימורים היא לא להמר בעצמם, אלא להרוויח כסף ללא סיכון. במקום להתעמק בקשר של הדיון הנוכחי למושג השונות, אני אתן דוגמא שתבהיר את הכל:

אתר הימורים א' מציע הימור על האם מחר ירד גשם או לא (נניח שהסיכוי לגשם הוא בדיוק שליש). האתר קובע יחס אמיתי של 1:3 לאפשרות שמחר ירד גשם ויחס אמיתי של 1:1.5 לאפשרות שמחר לא ירד גשם. כדי להרוויח משהו, האתר מחליט לגבות עמלה של 10% ולכן יחסי ההימורים שהוא מפרסם הם 1:2.7 על האפשרות שירד גשם, ו-1:1.35 על האפשרות שלא ירד גשם.

לעומתו, אתר הימורים ב' בוחר בשיטה הבאה: בשלב הראשון, הוא קובע את יחסי ההימורים כך שישקפו עמלה של 10% אם אותו מספר אנשים מהמרים על כל אפשרות (ז"א יחס זהה של 1:1.9 לשתי האפשרויות). בהמשך, בכל פעם שמישהו מהמר על אחת האפשרויות, האתר מקטין מעט את היחס של האפשרות שהרגע הימרו עליה ומעלה את היחס של האפשרות השניה, כך שהעמלה הסופית תשאר 10%.

נבחן כעת מה קורה לאתרים בשני תרחישים טיפוסיים:

בתרחיש הראשון, נניח שקהל המהמרים יודע שהסיכוי לגשם מחר הוא אכן בערך שליש, ולמהמרים מסויימים יש הטיה קלה לכאן או לכאן. עבור אתר א', ההימורים יתחלקו פחות או יותר שווה בשווה בין האפשרויות, והאתר יגרוף רווח יפה של 10%. עבור אתר ב', תחילה יהיו הרבה הימורים על האפשרות שלא ירד גשם (האתר מציע יחס של 1:1.9 על הימור שלדעתך יקרה ב-1:1.5, ז"א הימור משתלם מאוד), אבל מהר מאוד יחסי ההימורים ישתנו, עד שלבסוף יזדהו עם יחסי ההימורים של האתר הראשון, וישארו כך (זוהי נקודת שיווי משקל). בסופו של דבר, גם אתר ב' יגרוף רווח של כ-10%.

בתרחיש השני, נניח שלקהל המהמרים יש הטיה, וההערכה שלהם היא שהסיכוי לגשם מחר הוא כ-80%. במקרה של האתר הראשון, יהיו הרבה יותר הימורים על האפשרות שירד גשם. במקרה של האתר השני, יחסי ההימורים ישתנו בהתאם, ולבסוף יתאזנו על יחס של 1:4.5 שלא ירד גשם, ויחס של 1:1.125 שירד גשם. אם בסופו של דבר לא ירד גשם מחר, אתר א' יגרוף עמלה אדירה. לעומת זאת, אם מחר ירד גשם, אתר א' יפסיד סכום כסף עצום (וה-odds compiler שקבע את היחס ילך לישון עם הדגים). אתר ב', לעומת זאת, יגרוף בכל מקרה עמלה של כ-10%.

אז מה קרה כאן בעצם? אתר א' ממלא תפקיד של מהמר: הוא לוקח סיכון, ומרוויח או מפסיד בהתאם לתוצאה הסופית. אתר ב' ממלא תפקיד של מתווך: הוא עוזר למהמרים להמר זה מול זה, וגובה עמלה קבועה על שירותיו. הרווח שלו גדל ככל שמהמרים יותר אנשים, ובכל מקרה הוא אינו מסתכן בהפסד. בהקשר זה, ראו גם מאמר של סטיבן לויט מפריקונומיקס [2004].

ואכן, אתרי ההימורים באינטרנט משנים באופן דינמי את יחסי ההימורים שהם מציעים, בצורה דומה מאוד לאתר ב' בדוגמא. השינויים מתבצעים אונליין, ויחסי ההימורים משתנים ממש מדקה לדקה (כמובן, יחס ההימורים המעודכן רלוונטי רק להימורים עתידיים, ולא להימורים שכבר התבצעו ביחס הקודם).

כל זה טוב ויפה, אבל במקרה של ווינר לא ניתן לשנות את יחסי ההימורים מהרגע שנקבעו, כיוון שטפסי ווינר מודפסים מראש ונשלחים לנקודות המכירה. לכן, ווינר עצמם מחוייבים להמר - הנקודה היא שכדי להקטין ככל האפשר את הסיכון שלהם להפסיד, ווינר לא צריכים להתאים את יחסי ההימורים שלהם ליחס ההימורים האמיתי, אלא ל"יחס ההימורים האמיתי הנתפס" של ציבור המהמרים, מוטה ככל שיהיה.

איזה סוגי הטיות צפויים להיות בקרב המהמרים?

הטיה אחת היא מה שמכונה Wishful Thinking: הנטיה של אנשים לבצע הערכת-יתר לסיכוי שמאורע רצוי אכן יקרה. לדוגמא, אלישע בבד ויוסי כץ הראו [1991] שאוהדים במשחק כדורגל מגזימים בהערכת סיכויי קבוצתם לנצח בהשוואה לצופים חסרי העדפה בולטת, ושהתופעה מתקיימת אפילו כאשר האוהדים ממלאים טפסי טוטו (במובן מסוים, המהמרים במקרה האחרון שילמו כדי לשמר את ההטיה). כיוון שאנשים נוטים לאהוד את הקבוצה המנצחת, Wishful Thinking תבוא לידי ביטוי, בדרך כלל, בהטיה לטובת הפייבוריט בהימור.

הטיה נוספת היא תחזית של תורת הערך של כהנמן וטברסקי. אנשים הם "שונאי סיכון" בתחום הרווח, ויעדיפו, למשל, לקבל 100 שקל ביד מאשר להשתתף בהימור שיתן להם 250 שקל בסיכוי של 50% (למרות שתוחלת הרווח גבוהה יותר במקרה השני). אני מאמין שהימורים בווינר נתפסים בדרך כלל כרווח (ז"א שרוב המהמרים בווינר עושים זאת כדי להרוויח, ולא כדי להמנע מהפסד), ולכן יעדיפו להמר על הפייבוריט ולזכות בסיכוי גבוה יותר, אפילו במחיר של הקטנת תוחלת הרווח. ואמנם, נראה שהשיקול שרוב האנשים עושים בבחירת אפשרות ההימור הוא "איזה קבוצה כנראה תנצח", ולא "עבור איזה הימור אני מקבל יחס טוב יותר לעומת היחס האמיתי שאני חושב שמתקיים" (או במילים אחרות: אני מהמר על מכבי כי אני חושב שהיא תנצח, ולא כי אני חושב שהיא תנצח ביחס של 1:5 אבל מציעים לי עליה הימור ביחס של 1:10). ובשורה התחתונה, כל האמור לעיל יגרום, שוב, להטיה לטובת הפייבוריט בהימור.

ובחזרה לעמלות של ווינר: ראינו שווינר גובים עמלה נמוכה יותר ממי שמהמר על הפייבוריט, ז"א הופכים את ההימור על הפייבוריט לאטרקטיבי יותר. אם  ווינר מנסים לקלוע ליחסי ההימורים האמיתיים כפי שהם נתפסים ע"י המהמרים, המשמעות היא שווינר חושבים שלמהמרים יש הטיה טבעית להמר דוקא על האנדרדוג, וזאת בניגוד מוחלט לאמור בשתי הפסקאות האחרונות!

בהנחה שווינר לא טפשים (ז"א לא טועים לגמרי בדרך שבה הם קובעים את העמלות), ומצד שני גם לא גאונים (ז"א לא גילו הטיות קוגניטיביות שאינן מוכרות לפסיכולוגיה המודרנית), נשאלת השאלה מה ההגיון בקביעת העמלות בצורה הזו?

אני אציע הסבר אפשרי אחד, אבל האמת היא שאין לי מושג. אם למישהו יש רעיון, או מכיר מישהו שעובד בווינר ויכול לספק הסבר טוב יותר, אני אשמח מאוד לשמוע. בכל מקרה, תיאוריית הקונספירציה שלי היא כדלהלן:

כפי שראינו, העמלה הממוצעת שווינר גובים על כל הימור היא כ-19% (עד כדי סטיית תקן מזערית, שיכולה אפילו לנבוע משגיאות עיגול), ונניח שמסיבה כלשהי ווינר מחוייבים לגבות עמלה בשיעור הזה בדיוק (לדוגמא שהעמלה הזו מוגדרת בחוק להסדר ההימורים בספורט או באחד מהתיקונים שלו). הנקודה החשובה היא שמדובר בעמלה גבוהה מאוד, ובפרט עמלה גבוהה יותר משמעותית מזו שגובים המתחרים של ווינר: אתרי ההימורים באינטרנט (בדיקה אקראית של כמה אתרי הימורים גדולים מראה שהם לוקחים עמלות של פחות מ-5% על משחקי כדורגל).

עכשיו, מי שרוצה להמר על מכבי צריך להחליט אם לעשות את זה בווינר, או באתר אינטרנט כלשהו. לווינר יש יתרון אחד גדול - ההימור חוקי - ובשבילו אנשים מוכנים לשלם כסף (התשלום מתבטא בכך שהם מקבלים יחס הימור גרוע יותר מאשר באינטרנט, על אותם הימורים בדיוק). השאלה היא כמה כסף אנשים יהיו מוכנים לשלם, אבל בלי קשר לתשובה המדויקת ברור שיש הפרש עמלות מסויים שממנו והלאה אנשים יעדיפו לא להמר בווינר.

אמרנו שווינר מחוייבים, לכאורה, לגבות עמלה קבועה של 19% על כל משחק (משחק הוא למעשה שלושה הימורים שונים שקשורים זה לזה: הימור על התוצאות 1, 2 או X של משחק מסויים). העמלה הזו כל כך גבוהה יחסית לעמלות של אתרי הימורים, שקשה להאמין שמישהו יסכים להמר בווינר.

תיאוריית הקונספירציה שלי היא שווינר מצאו דרך לעקוף את הבעיה הזו. לכאורה, הם מציעים יחסי הימורים שמבטאים עמלה פוטנציאלית של 19% למשחק. בפועל, הם מטים את יחסי ההימורים כך שרוב העמלה באה לידי ביטוי בהימור על האנדרדוג, שאף אחד לא לוקח גם ככה. ההימורים שאנשים כן לוקחים (ההימורים על הפייבוריט) מגלמים עמלה של כ-10% - עדיין גבוהה יותר מבאתרי ההימורים, אבל לא גבוהה מספיק בשביל להצדיק עבירה על החוק. בקיצור, אני מאמין שווינר מציעים הימורים עם עמלה ממוצעת של 19%, אך בפועל גוזרים קופון של מעט יותר מ-10%.

עדיין נשאלת השאלה עד כמה ווינר מסתכנים - אני לא מאמין שהם ממלאים תפקיד של מתווך בין מהמרים, כי סביר שהרוב המוחלט של ההימורים מתבצעים על הפייבוריט בכל משחק (ויחסי ההימורים לא מאזנים זאת, בניגוד לדוגמא של אתר הימורים ב' מקודם). מצד שני, הם גובים עמלות גבוהות כל כך שיכול להיות שהן מכסות את הסיכון.

בשורה התחתונה: לא כדאי להמר בכלל. ואם מהמרים, לא כדאי להמר בווינר. ואם מהמרים בווינר, לא כדאי להמר על האנדרדוג.

טראק, שש בש וגשם

חמישי, 11 באוקטובר 2007

בחודש האחרון טיילתי בתורכיה עם שלושה חברים, בעיקר באיזור הרי הקצ'קר שבצפון מזרח המדינה. הפוסט הזה הוא אוסף של כמה אנקדוטות משם.

סדר הליכה בטראק
סדר היום בטראק די קבוע: קמים בבוקר (לא מוקדם מדי!), מעמיסים את המוצ'ילה על הגב, ומתחילים ללכת לפי סיפור הדרך. בכל יום הולכים 7-8 שעות נטו, עם הפסקות קצרות בין לבין. במהלך היום הולכים ביחד כקבוצה, והיום מסתיים כשכולם מגיעים ליעד המתוכנן.

כבר החל מהיום הראשון היה ברור שקצב ההליכה של כל אחד מאיתנו שונה משל האחרים. אלעד הוא יוצא פלחה"ן צנחנים, והיה נראה שהטראק והשבוע שבילינו בבודרום היו פחות או יותר שקולים עבורו מבחינת האתגר הפיסי. אחריו הלך אלון, שלזכותו יאמר שסחב את המשקל הגדול ביותר. אני הלכתי שלישי בדר"כ, וארז השתרך מאחור עם רגליים כואבות ומיובלות. כדי שלא יווצרו פערים גדולים מדי ביננו (במיוחד בערפל של הקצ'קר, שהגביל את הראות לעשרה מטרים בערך), היינו עוצרים מדי פעם להפסקה זריזה, מחכים שכולם יישרו קו, ואז ממשיכים ללכת.

האם סדר ההליכה הטבעי (ז"א, מי שהולך מהר יותר הולך ראשון) הוא גם סדר ההליכה האופטימלי?

מתברר שלא. בספר המטרה (קריאת חובה בקורס יסודות ניהול התפעול והייצור, שנה ג' בחוג לניהול) עושה ד"ר אליהו גולדרט עבודה טובה בלשכנע שסדר ההליכה האידיאלי הוא בדיוק הפוך לקצב ההליכה, ז"א הסדר האידיאלי הוא זה שבו האדם האיטי ביותר הולך ראשון. גולדרט מראה את זה בעזרת עקרונות של תורת האילוצים שפיתח, אבל גם אינטואיטיבית ברור מדוע זה כך: זמן ההגעה ליעד נקבע בכל מקרה ע"י האדם האיטי ביותר, והמרחק בין האנשים (שהיינו רוצים לצמצם) קטן ביותר כשהוא הולך ראשון, כיוון שהשאר "מצטופפים" אחריו.

אבל גולדרט מניח שקצב ההליכה אינו מושפע מסדר ההליכה, ולכן עוסק רק בנסיונות לצמצם את המרחק בין האנשים (לא מפתיע, בהתחשב בכך שעבורו סדר ההליכה בטראק הוא רק אנלוגיה לקו ייצור במפעל). הטענה שלי היא שסדר ההליכה שמציע גולדרט יעשה יותר מכך - הוא אפילו יקטין את זמן ההגעה ליעד! ספציפית, אני טוען כי קצב ההליכה של אדם גדל כשאחריו הולך אדם אחר.

למה שזה יקרה, בעצם? ההסבר הטריויאלי הוא שכשהולך אחריך מישהו מהיר יותר, אתה מעכב אותו. זה רע משתי בחינות: ראשית, אתה מפריע לו (ולכן, לפחות בהנחה שמדובר בחבר שלך, תווצר אצלך תחושת חוסר נעימות). שנית, אתה נמצא בסיטואציה שמדגישה את הנחיתות הפיסית שלך מולו (ולכן תווצר אצלך תחושת בושה). בשני המקרים מדובר בתחושות שלילית, ולכן תנסה להמנע מהן: פתרון אפשרי אחד הוא לתת לו לעקוף אותך, ופתרון אפשרי שני הוא להאיץ את הקצב.

אבל ההסבר הזה (שהוא מוטיבציוני במהותו) הוא לא ההסבר היחיד. הסבר נוסף הוא שעצם הנוכחות של אדם אחר מאחוריך מאפשרת לך - ברמה הפיזיולוגית ממש! - ללכת מהר יותר.

לפי תיאוריית ה-Social Facilitation של רוברט זיינס, עצם הנוכחות של אחרים סביבנו מגבירה עוררות. התוצאה של הגברת העוררות היא הגדלת הסיכוי שהאדם יפעל בצורה הרגלית, ז"א יבצע תגובות דומיננטיות-אוטומטיות. לכך יש השפעה מורכבת: במטלות פשוטות, התגובה ההרגלית היא לרוב התגובה הנכונה - ואז יהיה שיפור בביצוע; במטלות קשות, התגובה ההרגלית היא לרוב התגובה הלא הנכונה - ואז תהיה הרעה בביצוע. לדוגמא: שחקן סקווש מנוסה ישחק טוב יותר בנוכחות קהל, בעוד שחקן סקווש מתחיל ישחק גרוע יותר (כדוגמא קיצונית, תחשבו על ההשפעה של "משחק בלי קהל" על איכות המשחק של שחקני כדורגל מקצוענים). במקרה של טראק, ברור שהליכה היא תגובה אוטומטית ודומיננטית, ולכן קצב ההליכה יגבר עם רמת העוררות.

לא חסרים ניסויים שמאששים את התיאוריה, ואחד המעניינים יותר מביניהם אפילו לא עוסק בבני אדם. זיינס עצמו הראה ב-1969 שהתיאוריה פועלת גם עבור ג'וקים: הניסוי שלו כלל ג'וק באחד משני סוגי מבוכים (מבוך קל, שבו הג'וק היה צריך ללכת בקו ישר בלבד; מבוך קשה, שבו הג'וק היה צריך לבצע פניה אחת) ותיבת צפיה שקופה שבה היו ג'וקים אחרים. לפי התיאוריה, נוכחות הצופים תגרום לג'וק לפתור את המבוך הקל מהר יותר לעומת מצב שבו אין צופים, אבל לפתור את המבוך הקשה לאט יותר לעומת מצב שבו אין צופים - ואכן כך היה.

גירסאות עדכניות ונכונות יותר של התיאוריה זונחות את העיסוק בנוכחות בני אדם אחרים כשלעצמה, ומתמקדות ביכולת של אחרים לקלוט ולהעריך את מה שאתה עושה. למשל, הטענה היא שרמת העוררות שלך לא תגדל אם אתה נמצא בנוכחות אנשים שעיניהם ואוזניהם מכוסות.

ובחזרה לסדר ההליכה בטראק. בסדר ההליכה הטבעי, האדם האיטי ביותר הולך אחרון. במקרה זה, שני ההסברים שציינתי לא באים לידי ביטוי במלוא עוצמתם (הוא לא מעכב איש באופן ישיר, ושאר ההולכים מפנים אליו את הגב ולכן אינם קולטים אותו ואינם גורמים לו לעוררות מוגברת). זה כמובן לא המצב בסדר ההליכה ההפוך. במקרה זה, האדם האיטי מפריע למספר המקסימלי של אנשים, ובמקביל המספר המקסימלי של אנשים קולט אותו ומעריך אותו. לכן, ניתן לצפות שבמקרה זה קצב ההליכה שלו יגבר.

בקיצור, אני טוען שאם היינו כופים על ארז ללכת ראשון תמיד, היינו מגיעים מהר יותר ליעד בכל יום. מצד שני, תנסו אתם להסביר את זה למישהו בזמן טראק…

שש בש
אחרי ארבעה ימי הליכה הגענו לכפר קטן בשם ברהל, שם נחנו במשך יומיים. חלק משמעותי מהזמן הוקדש למשחק המקומי - שש בש (או טבלא בתורכית).

אחרי רצף נצחונות ארוך במיוחד שלי (44:10, עם הכפלות) אלון התחיל להתלונן שאני מרמה בקוביות. אני, לעומת זאת, טענתי שהקוביות מוטות לטובת שש (למה זה שיפר דוקא את המשחק שלי? לא יודע - באופן כללי אני משתדל לשחק בהתאם להסתברויות הצפויות במשחק).

כדי לבדוק את הטענה, הטלתי את אחת הקוביות 36 פעמים וספרתי את מספר הפעמים שיצא שש. אם הקוביה הוגנת, ניתן לצפות שזה יקרה בערך 6 פעמים. בפועל, זה קרה 11 פעם. האם מדובר בהבדל מקרי, או שהקוביה באמת נוטה לשש? לפי הקירוב הנורמאלי להתפלגות הבינומית סטיית התקן של מספר השש'ים במדגם בגודל 36 (בהנחה שהקוביה אינה מוטית) היא שורש 5, ז"א בערך 2.25. אם כן, מספר השש'ים במדגם מתפלג בקירוב נורמאלית ורחוק מהצפוי ביותר מ-2 סטיות תקן, ולכן ההבדל מובהק ברמת בטחון של 95% - הקוביה אכן נוטה לטובת שש!

כדי לוודא שההטיה היא בקוביה ולא בזורק, ביקשתי מארז לחזור על הניסוי ולזרוק גם הוא את הקוביה 36 פעם. הפעם המספר שש יצא 10 פעמים, ז"א הבדל של בערך 4/2.25 = 1.75 סטיות תקן. שוב, הבדל מובהק ברמת בטחון של 95% (יותר מ-1.65 סטיות תקן).

מעניין לשים לב לנקודה טכנית נחמדה: באופן עקרוני ניתן לעשות את הניתוח הסטטיסטי שלמעלה בצורה מדויקת בעזרת התפלגות בינומית. כל זה טוב ויפה במעבדה, אבל בכפר נידח ללא מחשבון או מחשב (ולמעשה, ביום השני גם ללא חשמל), חישוב כזה היה אורך שעות. השימוש בקירוב הנורמאלי בשילוב עם בחירה חכמה של מספר הזריקות הפך את החישוב לפעולה חשבונית פשוטה שאורכת 10 שניות בראש (בהנחה שזוכרים את הנוסחא לסטיית התקן המקורבת, שהיא פשוטה למדי), תוך שמירה על רמת דיוק גבוהה מאוד.

לסיכום: סטטיסטיקה היא מדע הנאחס.

גשם
כל ההמלצות שקראתי לפני הטיול טענו שהזמן האחרון לטייל בקצק'ר הוא באמצע ספטמבר, כי אחרי זה מתחיל להיות שם קר מאוד. אנחנו התחלנו את הטראק בערך ב-8 לספטמבר, כך שאת העליה לפסגת הקצק'ר עשינו בדיוק ב-16. באותו יום בלילה, ממש רגע אחרי שהקמנו את האוהל ונכנסנו לתוכו, התחיל לרדת גשם שוטף.

אחד המשפטים שאני אוהב להגיד ברגעים קשים (ובטראק היו כמה כאלה) הוא "היה יכול להיות גרוע יותר - היה יכול לרדת גשם". הפעם יכולתי רק להגיד: "היה יכול להיות גרוע יותר…." [שתיקה].

ואז אלעד אמר משהו מפתיע - שבעצם זה טוב שיורד עכשיו גשם! והוא הסביר: באיזור של הקצק'ר יש בממוצע כמות משקעים שנתית מסויימת. לכן, אם לא יורד עכשיו גשם, צריך "להשלים יותר" גשם (בהמשך השנה) בשביל להגיע לממוצע, ובפרט יש סיכוי גבוה יותר שירד מחר גשם. המסקנה היא שהסיכוי שירד גשם מחר קטן יותר אם יורד עכשיו גשם מאשר אם לא.

זאת דוגמא קלאסית לכשל המהמר - הנטיה לייחס תלות לאירועים בלתי תלויים. כשל המהמר בא לידי ביטוי, לדוגמא, אצל אנשים שחושבים ש-10 זריקות קוביה בהן לא יצא המספר שש מגדילות את הסיכוי שיצא שש בזריקה הבאה (מפתיע כמה כאלה יש). אבל כיוון שזריקות קוביה אינן מושפעות מזריקות קודמות (לפחות בתיאוריה), הסיכוי אמור להשאר קבוע - 1/6 בדיוק.

מעניין לשים לב שההסבר של אלעד היה תקף אם, למשל, היה ידוע שכמות המשקעים השנתית בקצ'קר היא קבועה, כי במקרה כזה לא ניתן לטעון שכמות הגשם מחר אינה תלויה בכמות הגשם היום (למשל אם אנחנו ביום הלפני-אחרון של השנה, והרגע הגענו לכמות המשקעים הידועה - מחר בודאות לא ירד גשם). הטעות של אלעד נבעה כנראה מהסתכלות על הממוצע השנתי כמעין חסם עליון, מה שכמובן אינו נכון.

מה שאני אוהב במיוחד בכשל המהמר, הוא שלא רק שהוא לא צודק - הוא אפילו טועה: במקרים רבים באמת מתקיים קשר בין אירועים שהם לכאורה בלתי תלויים, אבל הקשר הזה הוא בדיוק הפוך מזה שהמהמר חושב עליו. הנה דוגמא מהחיים שממחישה את זה:

רובם המוחלט של המבחנים בחוג לפסיכולוגיה (בתואר ראשון בתל אביב, לפחות) הם אמריקאיים. נניח שאתה עונה על מבחן כזה, ונאלץ להמר בשאלה מסויימת. מה תבחר - א', ב', ג' או ד'? מתברר שלא מעט סטודנטים לפסיכולוגיה סופרים את מיקומי התשובות הנכונות שכבר סימנו, ומסמנים את המיקום שהופיע הכי מעט פעמים. ההגיון כאן זהה בדיוק לזה שעומד מאחורי טיעון הגשם של אלעד - אם התשובה הנכונה בכל שאלה ממוקמת באקראי ע"י מחבר השאלון, במבחן כולו יהיה מספר שווה, בערך, של תשובות נכונות שהן א', ב', ג' או ד'. לכן, לכאורה, בהעדר מידע נוסף כדאי להמר על משהו שמקרב אותנו לאיזון הזה. זאת כמובן שטות מוחלטת - אם מיקום התשובה הנכונה נבחר באקראי, מיקום התשובות הנכונות בשאלות האחרות במבחן אינו תורם כל מידע לגבי מיקום התשובה הנכונה בשאלה מסויימת כלשהי (כמובן, המצב שונה אם בשאלון מתבצע איזון פיקטיבי של התשובות).

בפועל, אסטרטגיה טובה יותר תהיה לבחור דוקא את התשובה שהופיעה עד כה הכי הרבה פעמים. הסיבה היא שמיקום התשובות הנכונות בכל שאלה לא נקבע באקראי ע"י מחשב, אלא נקבע ידנית ע"י המרצה. אם למרצה יש הטיה לטובת מיקומים מסויימים (למשל נטיה שהתשובה הנכונה תהיה ג'), סביר שהיא תבוא לידי ביטוי בשאלון כולו. במובן מסויים, אפשר לחשוב על השאלות שעליהן כבר ענינו כעל מדגם שבודק את התפלגות התשובות הנכונות במבחן המסויים הזה, ובאופן כללי במבחנים של המרצה המסויים הזה. למשל, אם הרבה מהתשובות הנכונות במדגם יצאו ג' - סביר להניח כי גם בשאלות שלא ענינו עליהן יש סיכוי גבוה יותר שהתשובה הנכונה היא ג' (זו בדיוק האסטרטגיה שלי במבחנים בפסיכולוגיה, ועד כה היא הוכיחה את עצמה כטובה למדי).

אם כן, סיכום זריז: מטילים קוביה 36 פעמים, ולא יוצא שש בכלל. מה הסיכוי שיצא שש בהטלה הבאה? מהמר יגיד שיותר מ-1/6 ("כדי להשלים"); חכם יגיד שבדיוק 1/6 ("אין קשר"); סטטיסטיקאי יגיד שפחות מ-1/6 ("הקוביה מוטה"). ראו גם את החלק על השש-בש מקודם.

ובחזרה לאוהל. אחרי כמה דקות בהן הסברתי לאלעד על כשל המהמר, הוא השתכנע שהסיכוי לגשם מחר לא קטן בעקבות הגשם שיורד ברגע זה (ואם כבר רק גדל), ורק שאל איך קוראים לכשל המהמר במתמטיקה. התשובה הטובה ביותר שהצלחתי למצוא היא שכשל המהמר פשוט לא קיים במתמטיקה - כשמנסחים שאלה בהסתברות מצוין בדר"כ במפורש האם המאורעות תלויים או לא, ולכן כשל המהמר יקרא פשוט "טעות".

והשורה התחתונה? כשקמנו מצאנו את האוהל תחת 20 ס"מ שלג שהצטברו במהלך הלילה. גשם לא ירד למחרת, בהמשך הטראק או בהמשך הטיול.

המלצת קריאה
אחרי הטראק המשכנו לשבוע של של בטן-גב בבודרום, ורוב מה שעשיתי שם (לפחות בשעות היום) היה לקיים הבטחה ישנה למאיה, ולקרוא את Cryptonomicon של Neal Stephenson. הספר הזה פשוט מעולה בצורה יוצאת דופן. אני לא אספר שום דבר על העלילה, רק אומר שאלן טיורינג הוא אחת הדמויות ושכבר בעמוד 11 מופיעה הנוסחא של פונקציית זטא של רימן. אם זה לא מספיק, ברוס שנייר כתב אלגוריתם הצפנה במיוחד עבור הספר (ספוילר), ואיאן גולדברג מימש אותו ב-Perl. בקיצור, מומלץ ביותר.

רימזו: מה החברים שלך חושבים עליך?

שני, 25 ביוני 2007

אזהרה: פוסט זה עשוי לשנות את חייך. מי שקצר בזמן, מוזמן לדלג על ההקדמה המעט ארוכה ולעבור ישירות לתכל'ס, שמתחיל מיד לפני התמונה הראשונה.

תמונה עצמית היא מושג המתאר את האופן שבו כל אחד מאיתנו תופס את התכונות הקבועות שלו: בין אם תכונות חיצוניות שניתנות לבחינה אוביקטיבית ("יש לי שיער בלונדיני", "אני זכר") ובין אם תכונות פנימיות שנחוות רק בעקיפין ("אני חרוץ", "אני אוהב מוסיקה אלקטרונית"). התמונה העצמית מתגבשת לאורך החיים, ונוטה לשמור על יציבות יחסית.

לכאורה, הגיוני לצפות שהתמונה העצמית של כל אחד מאיתנו תהיה די מדויקת (או בפסיכולוגית מדוברת: תהיה "מכוילת"). אחרי הכל, מי מכיר אותי טוב יותר מאשר אני עצמי?

אבל בפועל, מתברר, התמונה העצמית אינה בהכרח מדויקת. מי לא מכיר את האדיוט שמשוכנע שהוא גאון הדור? את המניאק מהעבודה שבטוח שכולם אוהבים אותו? ולחילופין, את הבחורה המדהימה שחושבת שהיא לא נראית משהו בכלל? לעיתים קרובות מתברר כי הדרך שבה אנשים תופסים את עצמם שונה מאוד מהדרך שבה הם נתפסים ע"י אחרים, ומחקרים רבים (למשל [1998]) מוכיחים כי רוב האנשים תופסים את עצמם כחכמים יותר, מצחיקים יותר ונחמדים יותר מאיך שהם במציאות. למעשה, סביר להניח שגם התמונה העצמית שלכם מוטה.

תמונה עצמית מוטה היא בעייתית, כיוון שסופה של כל אשליה להתנפץ. לדוגמא, במחקר ארוך טווח בקרב סטודנטים [2001] נמצא כי תמונה עצמית מוגזמת ניבאה (לאורך זמן) ירידה בהערכה העצמית, בהתעניינות בלימודים ובאופן כללי באיכות החיים (well being). ההטיה לא הביאה לשיפור במדדים אובייקטיביים (הצלחה בלימודים, למשל), כפי שאולי ניתן היה לחשוב בטעות.

גם אם האשליה לא תתנפץ לעולם, לתמונה עצמית מוטה לפחות היבט שלילי אחד נוסף: חוסר היכולת להשתפר. אדם אכפתי שמגלה שהוא נתפס כקר ומנוכר, סביר להניח שיעשה מאמץ לשנות זאת. כל עוד הוא חי באשליה שהכל בסדר, אין סיבה שהמצב ישתנה.

איך אפשר לדעת האם התמונה העצמית שלך מוטה? במילים אחרות: איך אפשר לדעת האם הדרך שבה אתה תופס את עצמך אכן מבטאת את המציאות? כדי לעשות זאת יש למצוא מדד כלשהו שאינו מבוסס על דיווח עצמי.

עבור תכונות מסויימות, קיימים מבחנים אוביקטיבים שעשויים לתת תשובה מספקת. לדוגמא, אינטליגנציה ניתן למדוד בעזרת מבחן IQ כזה או אחר, ומראה חיצוני ניתן להעריך בעזרת אתרים כמו HOT or NOT (באופן אישי, אני חושב שאדם צריך להיות בעל אישיות קיצונית - חזקה או מעורערת באופן יוצא דופן - כדי שיכניס את התמונה שלו לאתר כזה, אבל לפחות בתיאוריה האפשרות קיימת).

מה לגבי תכונות אחרות? איך אפשר לדעת עד כמה אני מצחיק, או עד כמה אפשר לסמוך עלי? לרוב התכונות אין מבחנים סטנדרטיים שאינם מבוססים על דיווח עצמי, וגם אם היו כאלה - עבור תכונות רבות השאלה המעניינת היא לא איך אני באמת במציאות (אם יש לכך בכלל משמעות), אלא איך אני נתפס ע"י אחרים. למשל, הרבה פחות מעניין אותי לדעת עד כמה אני באמת אדם אכפתי - איך בכלל אפשר למדוד את זה? - מאשר עד כמה אני נתפס כאדם אכפתי, וספציפית עד כמה אני נתפס כאדם אכפתי ע"י אנשים שדעתם חשובה לי.

למעשה, השאלה המעניינת באמת היא מה החברים שלך חושבים עליך.

אז איך בעצם אפשר לדעת? לשאול אותם ישירות (סטייל קל"ע שעושים בקורס קצינים) לא עומד על הפרק, כי סביר להניח שלא תקבלו תשובה אמיתית - בטוח לא לגבי סוגיות רגישות באמת. לכאורה אפשר להעביר מבחן סוציומטרי בחבר'ה, אבל בפועל ברור שגם זה בלתי אפשרי: מעבר לזה שסוציומטרי הוא מבחן ארוך ומייגע, הוא דורש ניתוח מקצועי ע"י גורמים מוסמכים.

רימזו (rimzu) היא הפתרון לבעיה, שפיתחנו במשך כמה ימים מרוכזים בקיץ האחרון - אי שם בין המבחנים, המילואים והכנסים. המטרה העיקרית מבחינתנו היתה להרים ביחד פרויקט צד מגניב (ולאו דוקא להרוויח ממנו כסף), ולכן רימזו אינה מערכת מסחרית. לפחות בעתיד הנראה לעין, זה גם לא הולך להשתנות.

rimzu.gif

רימזו היא מעין מבחן אישיות (או מבחן סוציומטרי משוכלל, אם תרצו), רק אמין יותר והרבה יותר כיף. במקום לשאול אותך שאלות על עצמך, רימזו שואלת אותך שאלות על החברים שלך. כל שאלה היא השוואה פשוטה בין שני חברים, על בסיס תכונה מסויימת (למשל, "מי יותר אינטליגנטי: אמיר או בועז?"). המערכת מנתחת את התשובות של החברים שלך, מחשבת את הדירוגים האישיים שלך ומציגה אותם (לעיניך בלבד!) בגרפים מגניבים.

question.gif

כדי לשאול אותך את השאלות הנכונות, רימזו צריכה לדעת מי החברים שלך. מהבחינה הזו, רימזו דומה מאוד ל-LinkedIn, ל-Friendster, ל-Orkut ולשאר הרשתות החברתיות: אפשר לצרף חברים, לראות את החברים שלהם וכו'. המידע הזה משמש את המערכת פעמיים: מצד אחד לדעת על מי רלוונטי לשאול אותך, ומצד שני לדעת בדעתו של מי להתחשב בחישוב הדירוגים שלך.

הייחוד של רימזו (מעבר לכך שהיא עונה על אחת השאלות המעניינות ביותר שאפשר לשאול), הוא הדיוק המדהים של התשובות שהיא נותנת. ה"מוח" מאחורי המערכת הוא מודל סטטיסטי מתוחכם למדי, שלמעשה מתחייב שהדירוגים שלך אכן מייצגים בדיוק את מה שהחברים שלך חושבים עליך: בהתחלה, רימזו מספקת דירוגים כלליים יחסית (למשל, אומרת שהחברים שלך חושבים שאתה נמצא "ב-50% הגבוהים במדד היצירתיות"). בהמשך - ככל שהחברים שלך עונים על יותר שאלות לגביך - המערכת מרשה לעצמה יותר ויותר להתחייב על הדירוג האמיתי שלך, ובסופו של דבר כל תכונה שלך מכומתת לטווח מצומצם ומדויק מאוד.

rankings.gif

בהקשר הזה, חשוב לציין שרימזו מקדישה תשומת לב מיוחדת לשמירה על המידע האישי של המשתמשים: ברמה הראשונה - הדירוגים האישיים הם באמת אישיים, ונגישים אך ורק למשתמש עצמו. זה מבטא את הגישה שלנו שרואה ברימזו כלי לשיפור עצמי, ולא תחרות פופולריות באינטרנט (כמובן, שום דבר לא מונע ממך להראות לאחרים את הדירוגים שקיבלת - אבל זו כבר הבחירה שלך). ברמה השניה - אף אחד, כולל אתה עצמך, לא יכול לראות כיצד דירגת את חבריך בעבר. המטרה היא להבטיח את האנונימיות המוחלטת של הדירוגים, כך שאפילו אם מישהו פרץ לכם לחשבון, הוא לעולם לא ידע מה אתם ספציפית חושבים עליו (או על כל אחד אחר). מאותה סיבה, לא ניתן לראות את הדירוגים שלך כל עוד לא דורגת ע"י לפחות חמישה אנשים שונים (שוב, כדי להבטיח שלעולם לא תדע מה אדם ספציפי חושב עליך).

נכון לרגע זה רשומים ברימזו למעלה ממאתיים אנשים, ועד כה קיבלנו תגובות חיוביות מאוד. כדי להבטיח שהמערכת תמשיך לתפקד בצורה הטובה ביותר, בחרנו לעבוד בשיטת ההזמנות, ז"א משתמשים קיימים יכולים להזמין משתמשים נוספים להצטרף לרימזו. מי שלא מכיר משתמש קיים, יכול למלא כתובת אימייל בעמוד הראשי ולבקש הזמנה (הזמנות נשלחות בדרך כלל תוך יום-יומיים).

אז אם מעניין אתכם לדעת מה באמת החברים שלכם חושבים עליכם, אם אתם מחפשים מנגנון מדויק שיאפשר לכם לזהות ולשפר את החלקים הפחות טובים באישיות שלכם, או אם אתם משוכנעים שאתם הכי אחלה שבעולם ורק רוצים טפיחה על השכם - רימזו מחכה לכם. אהה, וזה אפילו כשר.

בלי קשר, בעתיד הקרוב אני מתכנן לכתוב פוסט נוסף על הטכנולוגיה שמאחורי רימזו. כטיזר אומר רק שפיתחנו את רימזו במתודולוגיה שונה לחלוטין (ולדעתי טובה יותר) מזו שמקובלת בפיתוח אתרים. בין היתר, אנחנו מאפשרים למפתחים חיצוניים להתממשק לרימזו בקלות ובעוצמה שטרם נראו. מי שלא יכול לחכות מוזמן לקרוא בינתיים על ה-API שאנחנו מספקים, ואת הביקורת שקיבלנו (אני לא מסכים עם רוב מה שנאמר שם - ארחיב על כך בעתיד).