תדלק יותר, שלם פחות

17 ביולי 2009 מאת דיסוננס קוגניטיבי

לפני כמה שנים יצא לי לחשוב על צריכת דלק במכוניות, וספציפית האם ניתן להקטין את ההוצאה החודשית על דלק בלי להפחית את צריכת הדלק ובלי להחליף תחנת דלק. זה נשמע כמו פרדוקס: הרי מחיר הדלק נמדד לפי נפח, ולכן אם נקנה את אותה כמות דלק באותו מקום נשלם את אותו המחיר… אבל כפי שנראה מיד, זה ממש לא המצב.

gas-tank.png

הרעיון הבסיסי הוא שבעוד שאנחנו צורכים את הדלק "בזמן אמת", אנחנו קונים אותו (מתדלקים) במרוכז בזמנים ובכמויות שבמידה רבה נתונים לשליטתנו. כיוון שמחירי הדלק אינם קבועים, בחירת זמני התדלוק משפיעה על ההוצאה החודשית שלנו.

רוב האנשים פועלים לפי מדיניות התדלוק הנאיבית הבאה: "כשהמיכל מתרוקן, סע לתחנת דלק ומלא אותו עד הסוף". ברור שהמדיניות הזאת אופטימלית מבחינת מספר התדלוקים, ומי שפועל לפיה מבקר מעט ככל האפשר בתחנות דלק. אך האם המדיניות הזו אופטימלית גם מבחינת ההוצאה החודשית הממוצעת?

נניח לרגע שיש לנו מידע רלוונטי מושלם, ז"א שעבור כל יום בעתיד אנחנו יודעים מראש מה יהיה מחירו של ליטר דלק וכמה ליטר דלק נצרוך. במקרה הזה, ניתן להציע מדיניות תדלוק טובה יותר, שמבוססת על שני הכללים הבאים:

  1. אם מחיר הדלק צפוי לעלות מחר, סע היום לתחנת דלק ומלא את המיכל עד הסוף.
  2. אם המיכל מתרוקן, מלא אותו לכל היותר בכמות הדרושה כדי לכסות על צריכת הדלק הצפויה עד לירידת המחיר הבאה.

למעשה, אנחנו מנצלים את המידע המושלם שלנו ואת העובדה שנפח ממוצע של מיכל דלק ברכב הוא כחמישים ליטר כדי לאגור דלק שנקנה במחיר זול ובכמות שמתאימה לצריכה הנתונה שלנו. במובן מסוים, זה דומה למדיניות ההשקעה האופטימלית של ברוקר שיודע בדיוק איך מניה מסוימת תתנהג בכל יום בעתיד, אבל אסור לו להחזיק יותר מחמישים מניות בכל רגע נתון.

אוקי, אז בהינתן מידע מושלם אפשר לתזמן את התדלוקים כך שבסופו של דבר נשלם פחות כסף. אבל האם מידע מושלם כזה הוא משהו שסביר להניח? לפחות לגבי מחיר הדלק, התשובה היא שבגדול כן. ראשית, מחיר הדלק לא מתעדכן בישראל בצורה רציפה, אלא נקבע (בדר"כ) בתחילת כל חודש ע"י מינהל הדלק במשרד התשתיות הלאומיות. שנית, את מי שפועל לפי מדיניות התדלוק המשופרת לא באמת מעניין מחיר הדלק בכל זמן בעתיד, אלא רק האם בתקופת זמן של כשבוע-שבועיים קדימה מחיר הדלק צפוי לעלות או לרדת ביחס למחיר הקודם. כיוון שמחירי הדלק בישראל מושפעים בעיקר ממחיר הנפט העולמי (שכן מתעדכן בצורה רציפה), כל מה שצריך לעשות הוא להתבונן במחיר הנוכחי של חבית נפט לעומת מחירה בתחילת החודש, ולשער האם בסוף החודש מחירה יהיה גבוה או נמוך מהמחיר בתחילת החודש. שימו לב, אנחנו לא מנסים לדעת כבר בתחילת החודש האם בסוף החודש הנפט יעלה או ירד - אם היינו יודעים לעשות את זה, היו לנו דרכים טובות יותר להרוויח כסף מאשר תזמון שונה של התדלוקים שלנו.

הגרף הבא מציג ערכים מנורמלים של מחירי הדלק בישראל (מחירי הדלק ההיסטוריים מאתר משרד התשתיות הלאומיות) ושל מדד NYMEX:CL (מדד אופציות עתידיות של הנפט הרלוונטי בבורסת הסחורות של ניו יורק). כפי שניתן לראות, מדד NYMEX:CL שמתעדכן בצורה רציפה הוא חזאי מצוין לכיוון השינוי במחיר הנפט בישראל:

fuel-price-chart.png

ומה לגבי מידע מושלם לגבי צריכת הדלק העתידית? הטענה שלי היא שבגדול, צריכת הדלק של רוב האנשים היא פחות או יותר קבועה. רובנו משתמשים ברכב בצורה די שגרתית, וניתן להשתמש בנתוני צריכת הדלק שלנו בעבר כדי לשער לגבי העתיד בהצלחה סבירה.

אז אחרי ההקדמה הארוכה הזאת, נשאלת השאלה עד כמה המדיניות המשופרת שהצענו שונה ממדיניות התדלוק הנאיבית מבחינת ההוצאה החודשית וכמות התדלוקים. כדי לענות על השאלה, כתבתי קוד Java שמבצע סימולציה של שתי אסטרטגיות התדלוק, בהתבסס על נתוני צריכת דלק שונים ועל מחירי הדלק האמיתיים בישראל מינואר 2005 ועד מאי 2009. הקוד זמין להורדה כפרויקט קוד פתוח בשם FullTank.

התוצאה לא מעודדת. עבור צריכת דלק קבועה של 50 ליטר בשבועיים, תחת מדיניות התדלוק הנאיבית היינו מתדלקים 105 פעמים ומשלמים 29,314 ש"ח. תחת המדיניות המשופרת, היינו מתדלקים 129 פעמים ומשלמים 28,836 ש"ח. בקיצור, לאורך כמעט ארבע וחצי שנים הגדלנו את מספר התדלוקים ב-23% והקטנו את ההוצאה הכוללת ב-1.6% בלבד. כפי שנאמר: FAIL.

ובשורה התחתונה: אפשר להקטין את ההוצאה החודשית על דלק בלי להקטין את צריכת הדלק ובלי יותר מדי מאמץ, אבל הרווח הכלכלי כל כך קטן שחבל לטרוח.

פוקר ודירוגים

09 ביוני 2009 מאת דיסוננס קוגניטיבי

כששואלים אותי למה הלכתי ללמוד מתמטיקה ופסיכולוגיה, אני עונה שעשיתי את זה כדי להשתפר בפוקר: שחקן פוקר טוב נדרש לשלב ידע בהסתברות, בסטטיסטיקה, בתורת המשחקים, באמוציות ובפיזיולוגיה שלהם (שפת גוף, למשל), בקבלת החלטות ואולי גם בתורות אישיות.

משחק הפוקר עצמו, על הווריאציות השונות שלו, מסובך להפליא למידול ולחקירה (משחק חוזר, רב-משתתפים, לא דטרמיניסטי ועם אינפורמציה חלקית. שח-מט, למשל, הוא משחק ילדים לעומתו), והתוספת של אלמנטים פסיכולוגיים רק מגדילה את הפער בין כל מודל תיאורטי לבין המציאות. לכן, כמעט בלתי אפשרי לתאר בצורה אנליטית את אסטרטגיות המשחק של שחקנים שונים, ובפרט להשוות ביניהן ולהגיע למסקנה ברורה מי השחקן הטוב יותר.

הפוסט הנוכחי לא יעסוק בדרך הטובה ביותר לשחק פוקר. השאלה שאנסה לענות עליה בסיסית יותר, והיא כיצד בכלל ניתן להשוות בין שחקני פוקר שונים. ספציפית, בהינתן קבוצת שחקני פוקר שמשחקים זה עם זה באופן קבוע, מי השחקן הטוב יותר מביניהם?

poker-chips.png

כדי שהדיון הנוכחי לא יהיה תיאורטי לחלוטין, אבסס אותו על נתונים אמיתיים. בשנה האחרונה שיחקתי פוקר עם קבוצה פחות-או-יותר קבועה: "גרעין קשה" של בערך 10 חברים, ושחקנים מזדמנים שהצטרפו מדי פעם. שיחקנו טקסס הולדם בתצורת טורניר, כשעלות הכניסה היא 20 ש"ח לאדם (ללא rebuy) וחלוקת הפרסים קבועה בהתאם למספר השחקנים. בטורניר ממוצע השתתפו 6-7 שחקנים, והוא ארך כשעה וחצי. עבור כל משחק שהתרחש (גם לא בנוכחותי), ניהלתי רישום של השחקנים שהשתתפו ושל חלוקת הפרסים ביניהם.

בסה"כ נרשמו 377 משחקים בהם השתתפו 28 שחקנים, עם מחזור כספים של 41,300 ש"ח. מתוכם, אגביל את הדיון למשחקים שהתרחשו ברבעון השלישי של 2008: 71 משחקים בהם השתתפו 12 שחקנים, עם מחזור כספים של 7,720 ש"ח (כיוון שאסטרטגיות משחק בפוקר עשויות להשתנות לאורך זמן, דיון רציני בשאלה מי משחק טוב יותר חייב גם הוא להגביל את עצמו לתקופה באורך סביר). בקבוצת הפוקר שלנו נוהגים להסתכל על תוצאות רבעוניות, ובחרתי להתמקד ברבעון שבו באו לידי ביטוי סוגיות מעניינות לגבי דירוג השחקנים - זה לאו דוקא הרבעון שבו השגתי את התוצאות הטובות ביותר.

הגרף הבא מציג את מספר המשחקים בהם השתתף כל שחקן. כפי שניתן לראות, יש שונות גדולה בין השחקנים (חלק מהשמות בדויים):

poker-played.png

לפני שאמשיך בניתוח, נשאלת השאלה האם משחקי הפוקר שלנו חוקיים. האיסור הרלוונטי בחוק הוא סעיף י"ב בחוק העונשין, העוסק ב"משחקים אסורים, הגרלות והימורים". משחק אסור מוגדר שם כ"משחק שבו עשוי אדם לזכות בכסף, בשווה כסף או בטובת הנאה לפי תוצאות המשחק, והתוצאות תלויות בגורל יותר מאשר בהבנה או ביכולת". ניתן להתווכח האם התוצאה בטורניר פוקר אכן תלויה בגורל יותר מאשר בהבנה או ביכולת. באופן אישי, אני מאמין שלאורך זמן התשובה היא שלילית (אמנם, אם המזל היה משחק תפקיד עיקרי בפוקר, ניתן היה לצפות כי ניצחונות בטורנירים יתפלגו בצורה כמעט אחידה בין השחקנים. בפועל, ניתן להראות ברמת בטחון גבוהה ביותר כי לפחות במקרה שלנו זה לא המצב). בכל מקרה, המשחקים שלנו בודאי חוקיים כיוון שהם עומדים בסעיף 230 של החוק ("נסיבות מיוחדות"), המתיר משחקים אם הם א) מכוונים לחוג אנשים מסוים ב) אינם חורגים מגדר שעשוע או בידור ג) אינם נערכים במקום משחקים אסורים.

ובחזרה לנושא העיקרי: מהו מדד טוב לרמת המשחק של כל שחקן בטורניר נתון? מדד אפשרי, למשל, הוא המיקום אליו הגיע בטורניר. אפשרות אחרת היא למדוד בצורה כלשהי את האופן שבו שיחק ידיים ספציפיות. טענתי היא שבהינתן מספיק משחקים, המדד היחיד לטיב המשחק הוא מדד התוצאה, או במילים אחרות: כמות הכסף שהרוויח כל שחקן. מבחינתי, שחקן שמסיים כל טורניר במקום רביעי (ללא פרס), משחק משמעותית רע יותר משחקן שמסיים 90% מהטורנירים במקום האחרון (ללא פרס) ו-10% מהטורנירים במקום הראשון (עם פרס). השחקן הראשון מפסיד כסף תמיד והשחקן השני לא - ובמובן הזה, השחקן השני משחק טוב יותר. העובדה שהשחקן הראשון אולי שיחק ידיים ספציפיות טוב יותר לא רלוונטית לדיון: המטרה היחידה בפוקר היא להרוויח כסף, ובפרט לאורך זמן זהו המדד היחיד לטיב המשחק.

הגרף הבא מציג את כמות הכסף שהרוויח כל שחקן (פרסים שקיבל פחות דמי השתתפות ששילם):

poker-total.png

הסתכלות בגרף מעלה שתי נקודות מעניינות. ראשית, נשאלת השאלה האם מי שהרוויח יותר כסף הוא אכן שחקן טוב יותר (שימו לב! אמנם טענתי שמדד הכסף מייצג את טיב המשחק, אבל לא ברור בכלל שדוקא כמות הכסף הכוללת היא המדד הנכון). למשל, שי הרוויח פי 2 מניר, אבל גם שיחק פי 1.5 משחקים ממנו. האמנם שי שחקן טוב יותר? ברור שמדד שלא משקלל את כמות המשחקים ששיחק כל שחקן לא עונה על השאלה הנכונה. שנית, סולם המדידה של המדד הנוכחי אינו מייצג יחס מנה: האם ניתן לומר ששי משחק טוב יותר מניר פי 2? אם כן, פי כמה משחק שי טוב יותר מאלון?

פתרון מתבקש לבעיה הראשונה הוא למדוד את הרווח הממוצע למשחק, במקום את הרווח הכולל. פורמאלית, היינו רוצים לדעת את תוחלת המשתנה המקרי שמייצג את הרווח של כל שחקן ממשחק בודד. אם נניח שהרווח במשחקים שונים מתפלג בצורה זהה ובלתי תלויה, אז ממוצע הרווח במשחקים שראינו הוא אומד טוב לתוחלת הזו.

הגרף הבא מציג את ממוצע הרווח למשחק של כל שחקן (רווח כולל חלקי מספר משחקים):

poker-average.png

המדד הזה בודאי רלוונטי יותר לדיון מכמות הכסף הכוללת שהרוויח כל שחקן, אבל יש לו שתי בעיות מהותיות: ראשית, יש הבדל בין שחקן שהפסיד בממוצע 20 שקלים למשחק לאורך שבעה משחקים לבין שחקן שהפסיד בממוצע 20 שקלים למשחק לאורך שבעים משחקים - אבל המדד הנוכחי לא מתחשב בכך. לדוגמא, תומר הפסיד 20 שקלים בממוצע לאורך 2 משחקים, וגאס הפסיד 7.5 שקלים בממוצע לאורך 64 משחקים. כיוון שגם לשחקן מצוין יש סיכוי סביר להפסיד ב-2 המשחקים הראשונים, לא ברור בכלל שגאס צריך להחשב לשחקן טוב יותר. באופן מקביל, גיל הרוויח 30 שקלים בממוצע לאורך 2 משחקים בלבד - האם זה מספיק כדי לומר שהוא השחקן הטוב ביותר? פורמאלית, המדד שלנו הוא סטטיסטי ולכן יש לו שונות. השאלה היא כיצד להתחשב בשונות הזאת במדד הסופי. למשל, היינו יכולים לתת לכל שחקן רווח סמך, כמו בסקרי בחירות: "ארז מרוויח בממוצע למשחק בין 1.2 ל-2.4 שקלים", אבל אז היתה נשאלת השאלה איך משווים בין שני שחקנים - לפי הגבול העליון? לפי הגבול התחתון?

שנית, כדי שבכלל יהיה טעם בהשוואת תוחלות רווח של אנשים שונים, צריך להניח שהם משחקים בתנאים זהים - השאלה היא האם זה מתקיים במקרה הנוכחי. למשל, נניח ששי משחק רק במשחקים שגם אופיר משחק בהם. כיוון שאופיר מרוויח הרבה בממוצע למשחק, ברור שבמובן מסויים שי מרוויח פחות מאשר אם אופיר לא היה משחק (ובאופן כללי, כששחקנים טובים משחקים זה מול זה הם מורידים באופן מעשי את תוחלת הרווח שלהם: מדד הממוצע מוטה לטובת שחקנים שנוטים לשחק מול שחקנים טובים פחות, על חשבון שחקנים שמעדיפים - או נאלצים - לשחק מול שחקנים טובים יותר). זה מקביל לכך שפדרר ימנע מלשחק מול נאדל, ובכל זאת יצליח לעבור אותו בדירוג העולמי כי ניצח המון ילדים בני ארבע.

פתרון חלקי לבעיה האחרונה הוא לבחון בנפרד כל תת קבוצה של שחקנים. למשל, תחילה נתבונן רק במשחקים שנערכו בין אופיר, ארז, חוליאן, גאס ונתן ונחשב את ממוצע הרווח של כל שחקן במשחקים אלה. לאחר מכן נתבונן רק במשחקים שנערכו בין אופיר, ארז, חוליאן, גאס וניר, ונחשב גם שם ממוצעי רווח. בסופו של דבר, כשנסיים לעבור על כל תתי הקבוצות האפשריות, נקבל רשימה ארוכה של ממוצעי רווח לכל שחקן. כל רשימה כזאת ניתן אז לצמצם לערך יחיד ע"י ממוצע משוקלל.

הגרף הבא מציג עבור כל שחקן את מספר תתי הקבוצות שהשתתף במשחקים שלהן. כפי שניתן לראות, שחקנים מסויימים אכן נוטים לשחק בתתי קבוצות "קבועות" יחסית (ניתן להשוות את היחס בין סה"כ המשחקים של כל שחקן לבין מספר תתי הקבוצות ששיחק בהן):

poker-groups-total.png

מהו השיקלול הנכון של רשימת הממוצעים שקיבלנו לערך בודד? שיקלול טריוויאלי הוא לתת משקל זהה עבור כל תת קבוצה. שיקלול אפשרי אחר הוא לתת משקל גדול יותר לתתי קבוצות שבהן מספר גדול יותר של שחקנים. למי שמכיר מושגים בסיסיים במשחקים שיתופיים, זה עשוי להשמע מוכר: השיקלול הראשון דומה במהותו לערך בנזף, והשני לערך שפלי.

הגרף הבא מציג את ממוצע הרווח המשוקלל למשחק של כל שחקן, בשיקלול הטריוויאלי. הערך שמוצמד לכל שחקן עונה, פחות או יותר, על השאלה הבאה: אם נגריל תת קבוצה אקראית של שחקנים ונערוך ביניהם משחק, כמה ירוויח בתוחלת כל שחקן?

poker-groups-average.png

כפי שניתן לראות, המדד הזה צמצם מאוד את הפער בפסגה (למשל, ההפרש בין שי לאופיר קטן משמעותית פה לעומת מדד הממוצע הרגיל), וגם הסדר היחסי של השחקנים השתנה מעט. בפועל, מדד ממוצע הרווח המשוקלל אכן מצמצם את בעית ה"עדיף לשחק נגד שחקנים חלשים", אך בודאי אינו פותר אותה: כמו קודם, שחקן יכול לקבל דירוג גבוה יותר משחקנים טובים ממנו ע"י כך שימנע לחלוטין מלשחק מולם.

מה שנדרש הוא מדד שבו התגמול לשחקנים שניצחו שחקנים שדורגו גבוה מהם, גדול יותר מאשר התגמול לשחקנים שניצחו שחקנים שדורגו נמוך מהם. במילים אחרות, כששחקן כלשהו מנצח משחק, השינוי בדירוג שלו צריך להיות פונקציה של השחקנים שהוא ניצח, והדירוג שלו צריך לעלות יותר כשהוא מנצח שחקנים שדורגו גבוה ממנו (שוב, הניסיון כאן הוא להמנע מאפקט "פדרר והילדים" שהזכרתי קודם). דוגמא למדד כזה הוא מד הכושר של אלו - הסטנדרט העולמי לדירוג שחקני שחמט - שלמרבה הצער אינו רלוונטי לדירוג שחקני פוקר.

קצת מחשבה הובילה אותי למסקנה שהבעיה מקבילה ל… חיפוש באינטרנט!

בשלב ראשון, נשים לב שאת כל המשחקים שהתרחשו עד כה ניתן לראות כגרף מכוון וממושקל, שבו קודקודים מייצגים שחקנים והמשקלות על הקשתות מייצגות סכומי כסף שעברו משחקן לשחקן. למשל, משחק יחיד של ארבעה שחקנים (דני, אופיר, ארז, ניר) שבו ניר outplayed everyone וזכה בכל הקופה נראה כך (באדיבות Gliffy):

poker-graph.png

אם נעדכן את הקודקודים והקשתות כך שייצגו את כל המשחקים שנערכו, נקבל בסופו של דבר גרף די גדול ועמוס. בשלב זה, ניתן להפעיל על הגרף את אלגוריתם PageRank של גוגל (או בשמו החדש: PokerRank) ולקבל דירוג לכל שחקן. הדירוגים שמתקבלים הם למעשה ההסתברות הסטציונרית של שרשרת המעבר המרקובית שמייצגת את תנועת הכסף בין האנשים, או במילים אחרות, התשובה לשאלה הבאה: נניח שמישהו זורק שקל לתוך קופת הפרסים של טורניר כלשהו, והמנצח בטורניר מקבל אותו. בכל פעם שיערך משחק אח"כ, יש סיכוי כלשהו שהשקל יחליף ידיים. אחרי שיעבור הרבה זמן (והרבה משחקים נוספים), מה הסיכוי שהשקל יהיה בכיס של כל אחד מהשחקנים?

כדי להבין את הקשר בין הפסקה האחרונה לבין חיפוש באינטרנט, תחשבו על הבעיה הבאה (שהעסיקה פעם את מייסדי גוגל): בפוסט הזה יש מספר קישורים לאתרים חיצוניים, ובכל פעם שאתם נתקלים באחד כזה יש סיכוי מסוים שתלחצו עליו. משם יש סיכוי שתלחצו על לינק לאתר אחר, וחוזר חלילה. PageRank מתאים לכל אתר באינטרנט את הסיכוי שבעוד שעה (נניח), תגלשו דוקא באתר ההוא. כהערת אגב, אלגוריתם PageRank מקבל פרמטר שמגדיר את הסיכוי שתעברו מאתר א' לאתר ב' שלא מקושר אליו (למשל ע"י תקתוק ישיר בשורת הכתובת של הדפדפן). במקרה שלנו, ניתן לתת לפרמטר הזה מובן של "כמה פוקר מבוסס על מזל לעומת יכולת". אני בחרתי להריץ את האלגוריתם עם 80-20 לטובת יכולת (ככל שמניחים מעורבות חזקה יותר של מזל, ההפרשים בין דירוגי האנשים מצטמצמים, אך הסדר ביניהם לא משתנה).

הגרף הבא מציג את ערכי ה-PokerRank של השחקנים השונים:

poker-pokerrank.png

למדד ה-PokerRank יש שני יתרונות בולטים: ראשית, לראשונה קיבלנו מדד שמייצג סולם יחס. יש סיכוי של 0.14 שהשקל יסיים בידיים של ארז, וסיכוי של 0.07 שהשקל יסיים בידיים של ניר - ובמובן הזה, ארז אכן טוב מניר פי 2. שנית, המדד הזה אכן מתגמל את מי שמשחק (ומנצח) מול שחקנים שמדורגים בו גבוה - בדיוק כמו בגלישה באינטרנט, שם יש סיכוי גבוה יותר שיגיעו אליכם גולשים אם קיבלתם לינק מ-ynet מאשר מהבלוג הנוכחי.

מצד שני, למדד הזה יש גם חסרון משמעותי: ככל שתשחקו יותר, הדירוג שלכם יעלה. ואכן, הסיכוי שהשקל יסיים בידיו של שחקן מעולה שמנצח 90% מהטורנירים אבל משחק לעיתים רחוקות מאוד, קטן מהסיכוי שיסיים בידיו של שחקן ממוצע שמשחק תמיד. זאת בעיה קשה, כי בסופו של דבר אנחנו רוצים לדעת מי משחק טוב יותר, ולא רק מי משחק יותר. בכל זאת, מדד ה-PokerRank מקיים הרבה מהתכונות שהיינו מצפים למצוא במדד האידיאלי.

המדד האחרון שאציג הוא אולי המסובך ביותר להבנה, אבל לטעמי המוצלח ביותר.

הסכמנו כבר ששחקן טוב הוא פשוט שחקן שמרוויח כסף, או במילים אחרות: שחקן שתוחלת הרווח שלו למשחק חיובית. עבור כל שחקן ספציפי, ניתן לשאול עד כמה סביר שהוא אכן שחקן טוב בהינתן מדגם המשחקים שהשתתף בהם. לחילופין, ניתן לשאול את השאלה הבאה: נניח שלשחקן קופה התחלתית של 1000 ש"ח. בכל פעם שהשחקן משתתף במשחק הוא משלם את דמי הכניסה מהקופה שלו, וכל פרס שיזכה בו יכנס בחזרה לקופה. מה הסיכוי שהשחקן ישרוד לנצח, ז"א לעולם לא "יהרס"?

השאלה הזו עמוקה יותר ממה שנראה. ראשית, שימו לב שאם לשחקן יש תוחלת רווח שלילית, סיכוי ההישרדות שלו הוא ממש 0 (זאת תוצאה ישירה של החוק החזק של המספרים הגדולים). לעומת זאת, אם לשחקן יש תוחלת רווח חיובית (אבל הוא עדין יכול להפסיד מדי פעם), סיכוי ההישרדות שלו גדול מ-0, אבל קטן ממש מ-1. הסיבה היא שהשחקן עשוי להפסיד רצף של משחקים שיחסל את הקופה ההתחלתית שלו. אולי מדובר בסיכוי נמוך מאוד, אבל האפשרות קיימת.

בפועל, כמובן, תוחלת הרווח של השחקן (ומן הסתם גם התפלגות הרווח שלו למשחק) אינה ידועה לנו. מה שכן, יש לנו מדגם של משחקים שהשחקן השתתף בהם, ובעזרתו ניתן לאמוד אותה. Bill Chen פיתח מודל סטטיסטי שמאפשר לנו להעריך את סיכוי ההישרדות של שחקן תחת מספר הנחות פשוטות (בעיקר הנחות נורמאליות, שמתקיימות עבור מדגמים גדולים ממשפט הגבול המרכזי) ע"י חישוב של כמה אינטגרלים. קוראים שמתעניינים בפרטים מופנים לפרקים 22-23 בספר של צ'ן שמוזכר בסוף הפוסט.

הגרף הבא מציג את סיכוי ההישרדות של השחקנים השונים:

poker-survival.png

מה שהופך את המדד הזה למוצלח כל כך בעיני, הוא שהוא משקלל לתוכו גם את ממוצע הרווח למשחק, גם את שונות הרווח של השחקן וגם את מספר המשחקים ששיחק. מדד ההישרדות מתגמל שחקנים עם ממוצע רווח למשחק גבוה ושונות רווח למשחק נמוכה (ז"א שחקנים טובים ויציבים), ומעניש שחקנים עם ממוצע רווח למשחק נמוך ושונות רווח למשחק גבוהה (שחקנים רעים ולא יציבים). מספר המשחקים ששיחקת משמש כמגבר, ז"א יותר משחקים יגדילו את התגמול / העונש שקיבלת. בנוסף, בדומה למדד ה-PokerRank גם מדד ההישרדות מייצג סולם יחס.

אז לסיכום, מה היה לנו פה? ראינו מדדים שונים לדירוג שחקני פוקר: ממדדים סטטיסטיים פשוטים כמו ממוצע למשחק ועד מדדים מסובכים שמקורם בתיאוריה של תהליכים סטוכסטיים. בשורה התחתונה, אין תשובה חד משמעית לשאלה באיזה מדד להשתמש. כל מדד מספר לנו אינפורמציה מעט שונה על השחקנים, וכל קורא מוזמן לבחור את המדד שנראה לו ביותר. מהסתכלות על תקופות שונות של המשחקים שלנו, מדד ההישרדות הוא הקרוב ביותר לקונספט שיש לי לגבי שחקנים טובים.

אגב, כיוון שהחישובים של חלק מהמדדים כבדים יחסית (ספציפית PokerRank ומדד ההישרדות), הסטטיסטיקות והדירוגים בקבוצה שלנו כבר מזמן לא מנוהלים בקובץ Excel פשוט. היום כל העסק מנוהל ונגיש דרך אפליקצית web ייעודית שכתבתי ב-Java, ומחובר לפייסבוק דרך Facebook Connect. בנוסף למדדים שהזכרתי למעלה, האפליקציה גם מספרת לך מי הנמסיס שלך (השחקן שנוכחותו במשחק מקטינה את הרווח הממוצע שלך בצורה המשמעותית ביותר) ומי הסיידקיק שלך (השחקן שנוכחותו במשחק מגדילה את הרווח הממוצע שלך בצורה המשמעותית ביותר). אולי מתישהו אפתח אותה לשימוש גם ע"י קבוצות פוקר אחרות. ואולי לא :)

ולסיום, הנה רשימת קריאה מומלצת במיוחד למי שבכל זאת רוצה לשפר את משחק הפוקר שלו:

שאלון קבלת החלטות

19 באוקטובר 2008 מאת דיסוננס קוגניטיבי

הפעם לא מדובר בפוסט, אלא בבקשת עזרה (ואולי גם בטיזר לפוסט עתידי).

הדבר היחיד שעומד ביני לבין התואר בפסיכולוגיה הוא מחקר אחד אחרון, בקבלת החלטות: מדובר בשאלון מחשב קצר (כ-20 דקות), אנונימי לגמרי, ואפילו די מעניין. אני ממש אודה לכם אם תוכלו להשקיע את הזמן ולענות עליו. כתובת השאלון: http://survey.tntforthebrain.com.

חוץ מזה, אני אשמח אם תפיצו את הבקשה לכמה מחבריכם הקרובים ותשדלו אותם לענות גם. המטרה שלי היא להגיע לכמה עשרות נבדקים, וכל אחד נוסף יעזור.

יש לי רק שתי בקשות: הראשונה היא שתענו על השאלון ברצינות, ללא הסחות דעת ולפי ההוראות (אחרת אתם פוגעים בי ובמחקר). השניה היא שלא תמסרו פרטים על השאלון בתגובות (זה גם יפגע במחקר וגם יפגום בהנאה של אלה שעוד לא ענו).

בתמורה, אני מבטיח לפרסם פוסט אמיתי וחדש בחודשיים הקרובים! :)

מפת ישראל בגוגל מפס

18 באוגוסט 2008 מאת דיסוננס קוגניטיבי

בתקופה האחרונה יצא לי להתעסק הרבה עם שירות המפות של גוגל (Google Maps), וספציפית להשתמש בממשק שגוגל מציעים כדי להציג נתונים על מפה ולשלב את התוצאה באתר חיצוני.

הבעיה היא שנכון לרגע זה, גוגל לא מספקים מפות של ישראל, אלא רק תצלומי לווין. לעומת זאת, אתרים שכן מציגים מפות של ישראל (למשל emap ו-וואלה! מפות) לא מאפשרים לשלב את המפה באתר חיצוני או להציג עליה שכבות מידע נוספות. בפוסט הנוכחי אציג פתרון שמבוסס על הצגת מפות מהאתר ABMaps כשכבה בתוך גוגל מפס.

קוד עובד שמאפשר לעשות זאת ניתן להורדה פה תחת רישיון קוד פתוח. כיוון ששימוש בקוד בודאי מפר את תנאי השימוש של כמה אתרים, המלצתי האישית היא לא להשתמש בו בכלל, ובפרט לא באפליקציה מסחרית. הקוד מוצע להורדה למטרות חינוכיות בלבד, והתוצאה הסופית נראית כך:

abmaps.jpg

כדי להבין איך הפתרון עובד, צריך קודם להבין איך עובדות מפות באופן כללי. הרעיון הבסיסי הוא שיש לנו מידע שנמצא על שטח הפנים של כדור הארץ (או לחילופין על גלובוס), ואנחנו רוצים להציג אותו על דף ניר רגיל. כדור הארץ אמנם תלת מימדי, אבל שטח הפנים שלו דו מימדי - ולכן לפחות ברמה הראשונית לא נראה שאמורה להיות בעיה.

השאלה היא איך בדיוק עושים את זה. כדי להבין איפה הבעיה, תחשבו על תפוז, ותנסו לדמיין איך אפשר להוריד ממנו את הקליפה ולהציג אותה כמלבן מושלם - כשאסור לקרוע מהקליפה חלקים ולשנות את המיקום שלהם.

הפתרון מגיע מהמתמטיקה: בניסוח פורמאלי, השאלה היא כיצד למפות (ז"א להתאים באופן חד-חד ערכי) נקודות על פני כדור תלת-מימדי לנקודות במישור הדו-מימדי. העובדה שניתן לעשות זאת שקולה לכך ששטח הפנים של כדור הוא יריעה דו-מימדית (למשל ניתן לתאר כל נקודה כזו בעזרת שתי קורדינטות כדוריות).

מה שמעניין יותר, הוא שכל מיפוי כזה בהכרח יגרום לעיוותים במרחב, במובן שמרחקים בין נקודות ישתנו כשנעבור מהגלובוס למפה: שני זוגות של נקודות במרחק זהה על הגלובוס עלולים להיות פתאום במרחק שונה על המפה. אם נחשוב שוב על קליפת התפוז שלנו, המשמעות היא שאם אנחנו רוצים למלבן את הקליפה מבלי לשבור אותה לחתיכות, נהיה חייבים למתוח או לדחוס חלקים ממנה.

בפועל, במפות של כדור הארץ נהוג להשתמש בהתאמה בשם היטל מרקטור (Mercator projection), עם נוסחא נוראית מספיק בשביל לכלול לוגריתם של טנגנס. מה לגבי העיוותים במרחב? מתברר שלא חסרים כאלה. למשל, לפי המפות הסטנדרטיות נראה שלגרינלנד ולאפריקה שטח זהה, כשבפועל שטחה של אפריקה גדול פי 14. באופן דומה, אלסקה נראית גדולה יותר מברזיל, למרות שהאחרונה גדולה ממנה פי 5 ויותר. מי שלא מאמין (ואין לו גלובוס בבית בשביל לבדוק) יכול להשוות בין גוגל מפס לגוגל earth.

כעת יש לנו את הכלים להבין איך גוגל מפס עובד. עבור כל רמת זום שנתמכת בגוגל מפס, לגוגל יש מפה מלבנית מתאימה של העולם (שהתקבלה כמובן ע"י הפעלת היטל מרקטור). את המפה הזאת הם בחרו לחלק לריבועי תמונה בגודל 256 על 256 פיקסל כל אחד, ובכל פעם לשלוח לדפדפן רק את הריבועים המתאימים לאיזור הקטן שבו המפה מתמקדת.

למזלינו, גוגל היו חכמים ונחמדים מספיק בשביל לאפשר לכל אחד להרחיב את גוגל מפס, ולהצביע על אתר חיצוני שמספק ריבועים כאלה. אם היה אתר שיודע לספק ריבועי מפה כאלה שכוללים מפות של ישראל, היינו יכולים להצביע עליו והבעיה היתה נפתרת. שיטוט קצר במספר אתרי מפות באינטרנט (עם FireFox פתוח על FireBug, כדי לבחון אילו קבצים יורדים לדפדפן בכל גלישה כזו) העלה שהאתר ABMaps (של חברת AtlasCT הישראלית) מספק את הסחורה.

כעת נותרו שתי בעיות בלבד: ראשית, התברר ש-ABMaps עובדים עם מלבני מפה בגודל 400 על 280 פיקסלים, בעוד גוגל מוכנה לקבל ריבועים בלבד. למזלינו, מתברר שניתן (ע"י שינוי קל בכתובת התמונה) לבקש מ-ABMaps לספק חלקי מפה בכל גודל שהוא. Problem solved.

הבעיה השניה היתה כיצד להתאים בין הקורדינטות של גוגל לבין הקורדינטות של ABMaps. למשל, ריבוע המפה שלפי גוגל הפינה השמאלית העליונה שלו נמצאת בקורדינטות (256, 1024) לא הצביע על אותו איזור של הריבוע המקביל לפי ABMaps.

הנחתי ש-ABMaps לא המציאו את הגלגל מחדש, ובחרו גם הם להשתמש בהיטל מרקטור, או לכל היותר בטרנספורמציה לינארית שלו. לכן, פתרון לבעיה יהיה פשוט למצוא את המקדמים של הטרנספורמציה הזו, ז"א מדובר בבעיית רגרסיה לינארית. כדי לפתור אותה בחרתי 15 נקודות על כדור הארץ, ומצאתי את הקורדינטות שלהן לפי ABMaps ולפי גוגל מפס. והרי התוצאות:

abmaps-graph.png

המתאם המושלם בין הנתונים מאשש את ההשערה ש-ABMaps משתמשים בטרנספורמציה לינארית על היטל מרקטור הסטנדרטי. בנוסף, ממקדמי הרגרסיה שהתקבלו ניתן לשער שנקודות החיתוך עם הצירים הן בפועל 364000000 ו-164000000, ושהשיפוע זהה עבור קורדינטת ה-x וקורדינטת ה-y. לכן, מודל רגרסיה טוב יותר הוא כזה שמחפש רק את השיפוע (הזהה) האופטימלי בהינתן שנקודות החיתוך עם הצירים הן כנ"ל.

בשלב זה נטשתי את excel, וכתבתי קוד CVX שפותר את הבעיה, כדי להגיע לערך שיפוע של 1.072883578234450 (מה לעשות, כשלומדים למבחן באופטימיזציה לא-לינארית כל בעיה נראית כמו בעית תכנון קמור). התוצאה לא מושלמת - כשמזפזפים בין צילום הלווין של גוגל למפה של ABMaps מקומות זהים לא נופלים בדיוק אחד על השני - אבל היא קרובה מאוד למושלמות.

כאמור, ניתן להוריד את הקוד בקישור הבא.

מי מנצח בווינר?

20 באפריל 2008 מאת דיסוננס קוגניטיבי

הפוסט הנוכחי עוסק במשחק ווינר של המועצה להסדר ההימורים בספורט: תחילה, אעזר במדגם עצום של טפסי ווינר כדי לתאר תופעה מסויימת שקשורה לעמלות של ווינר ליין. אח"כ, אנסה לשכנע שמדובר בתופעה מוזרה מאוד, הסותרת עקרונות כלכליים ופסיכולוגיים בתחום ההימורים. לבסוף, אציע הסבר אפשרי (ולא מספק, לדעתי) לתופעה שמצאתי.

הערת אזהרה: הפוסט הפעם יחסית קשה לקריאה. משיקולי זמן ומקום, אני אניח שלקורא יש הכרות מסויימת עם ווינר ועם עקרונות בסיסיים בהסתברות (למשל ההבדל בין תוחלת לממוצע).

winner.gif

ווינר הוא התשובה החוקית של המועצה להסדר ההימורים בספורט לאתרי ההימורים באינטרנט. למרות שמדובר במשחק חדש יחסית (החל לפעול רק בשנת 2002), הוא מהווה היום את מקור ההכנסה העיקרי של המועצה. למעשה, מדובר בשני משחקים שונים: ווינר ליין וווינר מאצ' - אני אתמקד בראשון.

חוקי ווינר ליין פשוטים למדי: בטופס ווינר ליין רגיל מהמרים על תוצאות 3-6 משחקים. עבור כל משחק יש לבחור 1, 2 או X (ז"א נצחון של הקבוצה הראשונה, נצחון של הקבוצה השניה או תיקו) כשהמטרה היא לצדוק בכולם. בניגוד לטוטו, ווינר הוא מה שמכונה בעגה מקצועית הימור parlay: לכל אחת משלוש התוצאות האפשריות של כל משחק מתלווה יחס שנקבע מראש. אם הצלחת לנחש נכון את תוצאות כל המשחקים שסימנת, תזכה בסכום כסף ששווה למכפלת היחסים המופיעים בטופס. לדוגמא: אם הימרת במשחק הראשון על 1 ביחס של 1:1.5, במשחק השני על X ביחס של 1:1.05 ובמשחק השלישי על 1 ביחס של 1:5, במידה ותזכה תקבל פי 1.5*1.05*5 = 7.875 מהסכום שהשקעת.

בניגוד לאתרי הימורים באינטרנט בהם יחסי ההימורים דינאמיים ומשתנים כל הזמן (עוד על כך, בהמשך), בווינר יחסי ההימורים נקבעים מראש ע"י מחלקה של קובעי יחסי הימורים (odds compilers) של המועצה להסדר ההימורים בספורט, שלכאורה מורכבת מ"מומחים למתמטיקה או סטטיסטיקה או הסתברות … שמבינים בכדורגל ברמה של מידת הנעליים של כל שחקן בליגת המילואים הנורווגית".

השאלה שאנסה לענות עליה, היא עד כמה טובה קביעת יחסי ההימורים בווינר ליין.

winner_line.gif

מידע גולמי על ווינר ניתן למצוא באתר המועצה להסדר ההימורים בספורט: עבור כל משחק שנערך, הארכיון של ווינר ליין מפרט את יחס ההימור שניתן לכל אחת משלוש התוצאות האפשריות ואת התוצאה שהתקבלה בסופו של דבר. הארכיון לא נגיש בפורמט נוח לעבודה, אבל 200 שורות Java ו-15 דקות של "טחינת" האתר הספיקו כדי לייצר עבורי קובץ אקסל ענק עם כלל הנתונים ההיסטוריים של ווינר ליין.

בסה"כ התקבלו נתונים לגבי 54382 משחקים שהתקיימו בתקופה של כ-6 שנים (בין ה-22/5/2002 וה-15/4/2008), ולאחר סילוק נתונים בעייתיים (663 משחקים ללא תוצאה סופית; 86 משחקים ללא יחסי ההימור; 567 משחקים עם שתי תוצאות אפשריות בלבד) נשארו נתונים לגבי 53066 משחקים. כיוון שכל משחק כזה מגלם שלושה הימורים שונים, למעשה התקבלו נתונים לגבי 159198 הימורים שונים - כשעבור כל הימור בודד ידוע יחס ההימור בווינר, והאם בסופו של דבר ההימור זכה.

ניתוח הנתונים מתבסס על החוק החלש של המספרים הגדולים, שקובע כי "במדגמים גדולים הממוצע בדר"כ קרוב לתוחלת". לדוגמא, ווינר הציעו יחס הימור של 1:3 ב-6766 הזדמנויות שונות, ובסופו של דבר זכו 1805 מתוכן. 6766/1805 = 3.75, ולכן ניתן לומר שהימורים שווינר נותנים עליהם יחס של 1:3 זכו במדגם ביחס של 1:3.75. אינטואיטיבית, החוק החלש של המספרים הגדולים מבטיח שבאופן כללי הימורי ווינר ביחס של 1:3 (גם כאלה שיערכו בעתיד!), יזכו ביחס שקרוב ל-1:3.75.

כהערת צד, אוסיף כי כיוון שההימורים השונים בלתי תלויים זה בזה (למעט מקרים נדירים של שני הימורים ביחס זהה על תוצאות שונות של אותו משחק), ניתן להניח כי מספר הזכיות של הימורים ביחס נתון מתפלג בינומית. המשך הניתוח עוסק רק ביחסי הימורים שעבורם מס' הזכיות בפועל היה גדול מ-50, ובפרט ניתן לבצע עבורם קירוב להתפלגות נורמאלית ולהגיע להערכה מדויקת למדי של יחס הזכיה במציאות (ואכן, הוא קרוב מאוד ליחס הזכיה במדגם).

הגרף הבא מציג את תוצאות הניתוח. בציר האופקי מופיע יחס ההימור שניתן בווינר, ובציר האנכי מופיע האומדן ליחס ההימור האמיתי (ז"א שיעור הפעמים בהם הימור ביחס כזה אכן זכה):

winner_chart1.gif

מבט מהיר בגרף מעלה כי היחס בווינר תמיד נמוך מהיחס האמיתי. לדוגמא, הימורי ווינר ביחס 1:2 זוכים ביחס 1:2.52, ולכן (חישוב פשוט) על כל שקל שתשקיעו בהימור כזה תפסידו בתוחלת כ-20 אגורות. הממצא הזה לא מפתיע - הוא בסה"כ מבטא את העובדה שווינר מרוויחים כסף מהמהמרים (ההבדל בין יחס ההימור שווינר מציעים ליחס האמיתי הוא בדיוק העמלה שווינר לוקחים). מה שבכל זאת מפתיע הוא שהעמלה של ווינר תלויה ביחס ההימור, כפי שניתן לראות בגרף הבא:

winner_chart2.gif

כאמור, ההימור בווינר לא משתלם (בתוחלת), כי ווינר מרוויחים כסף על חשבון המהמרים. מה שמוזר הוא שווינר לוקחים עמלה גדולה יותר - ז"א מרוויחים יותר - ככל שיחס ההימור גדול יותר! לדוגמא, על הימורים ביחס 1:1.15 תפסידו בתוחלת כ-12 אגורות לכל שקל, על הימורים ביחס 1:4.2 תפסידו בתוחלת כ-29 אגורות לכל שקל, ועל הימורים ביחס 1:9 תפסידו בתוחלת כ-68 אגורות לכל שקל!

הנקודה האחרונה עשויה להראות בטעות כמו משהו מובן מאליו. יחס הימור נמוך (למשל 1:1.15) אומר שאתה מהמר על הפייבוריט, ויחס הימור גבוה (למשל 1:9) אומר שאתה מהמר על האנדרדוג, ולכאורה סביר שלאורך זמן תפסיד יותר אם תהמר תמיד על האנדרדוג. אך זו כמובן טעות: אמנם בהימורים על הפייבוריט סביר שתזכה יותר פעמים - אבל כשמדובר בתוחלת הרווח, לא בהכרח אמור להיות הבדל בין שני המקרים. תחשבו, למשל, על משחק שבו אתם מהמרים ביחס של 1:6 שיצא 6 בקוביה (הימור על מאורע לא סביר, "האנדרדוג"), לעומת משחק מקביל שבו אתם מהמרים ביחס של 1:1.2 שלא יצא 6 בקוביה (הימור על מאורע סביר, "הפייבוריט") - במקרה זה, התוחלת של שני המשחקים זהה (ושווה לאפס, אלה משחקים הוגנים).

מה שאני מנסה להגיד, הוא שעל פניו לווינר אין סיבה להפלות לרעה את מי שבחר להמר על האנדרדוג. מבחינת ווינר, האידיאל הוא לגבות עמלה זהה מכל מהמר, בלי קשר לדת, גזע, מין או סוג ההימור.

אז מה בעצם קורה כאן? כדי לענות על השאלה, ננסה להבין מה ווינר מנסים להשיג (ומה לא) בקביעה מסויימת של יחסי ההימורים.

נקודת הסתכלות נאיבית היא שווינר מנסים לקבוע את יחס ההימור כך שיהיה מדויק ככל האפשר (במובן של החוק החלש של המספרים הגדולים): בשלב הראשון, ווינר קובעים את יחסי ההימורים "האמיתיים" כך שלאורך זמן, שליש מההימורים שקיבלו יחס אמיתי של 1:3 יקרו בפועל. בשלב השני, ווינר משנים את יחסי ההימורים כך שישקפו עמלה קבועה על כל הימור (למשל, יחס הימור אמיתי של 1:3 יפורסם בטופס כיחס הימור של 1:1.15, לאחר הפרשת עמלה של כ-12%).

איך אפשר לקבוע את יחסי ההימורים האמיתיים? יש הרבה דרכים: אפשר להעסיק odds compilers טובים ולהסתמך על הידע שלהם כמומחים, אפשר להשתמש במודלים סטטיסטיים, אפשר להעזר ב"חוכמת ההמונים" (למשל בורסות הימורים) ואפשר לשלב בין מספר שיטות.

בכל מקרה, אם זה אכן היה המצב, הייתי אומר שווינר עושים עבודה גרועה מאוד בקביעת היחס האמיתי: חישוב פשוט מראה שהעמלה הממוצעת למשחק היא כ-19% (עם סטיית תקן מזערית של כ-0.015%), ואם "ננרמל" את יחסי ההימורים כך שלא ישקפו את העמלה (ז"א נחזור, לכאורה, ליחסי ההימורים האמיתיים תחת ההנחה שהעמלה קבועה) נגלה שהם מוטים מאוד לעומת הקו האידיאלי של Y=X (אני לא ארחיב, אבל למעשה מדובר בצורת הסתכלות שונה על הגרף האחרון).

אם שתי הפסקאות האחרונות לא היו ברורות מספיק, זה לא מאוד משנה. העובדה הפשוטה היא שווינר, ולצורך העניין גם אתרי הימורים באינטרנט, לא מנסים לקבוע את יחס ההימור כך שישקף את המציאות! הסיבה לכך היא שהשאיפה של אתרי הימורים היא לא להמר בעצמם, אלא להרוויח כסף ללא סיכון. במקום להתעמק בקשר של הדיון הנוכחי למושג השונות, אני אתן דוגמא שתבהיר את הכל:

אתר הימורים א' מציע הימור על האם מחר ירד גשם או לא (נניח שהסיכוי לגשם הוא בדיוק שליש). האתר קובע יחס אמיתי של 1:3 לאפשרות שמחר ירד גשם ויחס אמיתי של 1:1.5 לאפשרות שמחר לא ירד גשם. כדי להרוויח משהו, האתר מחליט לגבות עמלה של 10% ולכן יחסי ההימורים שהוא מפרסם הם 1:2.7 על האפשרות שירד גשם, ו-1:1.35 על האפשרות שלא ירד גשם.

לעומתו, אתר הימורים ב' בוחר בשיטה הבאה: בשלב הראשון, הוא קובע את יחסי ההימורים כך שישקפו עמלה של 10% אם אותו מספר אנשים מהמרים על כל אפשרות (ז"א יחס זהה של 1:1.9 לשתי האפשרויות). בהמשך, בכל פעם שמישהו מהמר על אחת האפשרויות, האתר מקטין מעט את היחס של האפשרות שהרגע הימרו עליה ומעלה את היחס של האפשרות השניה, כך שהעמלה הסופית תשאר 10%.

נבחן כעת מה קורה לאתרים בשני תרחישים טיפוסיים:

בתרחיש הראשון, נניח שקהל המהמרים יודע שהסיכוי לגשם מחר הוא אכן בערך שליש, ולמהמרים מסויימים יש הטיה קלה לכאן או לכאן. עבור אתר א', ההימורים יתחלקו פחות או יותר שווה בשווה בין האפשרויות, והאתר יגרוף רווח יפה של 10%. עבור אתר ב', תחילה יהיו הרבה הימורים על האפשרות שלא ירד גשם (האתר מציע יחס של 1:1.9 על הימור שלדעתך יקרה ב-1:1.5, ז"א הימור משתלם מאוד), אבל מהר מאוד יחסי ההימורים ישתנו, עד שלבסוף יזדהו עם יחסי ההימורים של האתר הראשון, וישארו כך (זוהי נקודת שיווי משקל). בסופו של דבר, גם אתר ב' יגרוף רווח של כ-10%.

בתרחיש השני, נניח שלקהל המהמרים יש הטיה, וההערכה שלהם היא שהסיכוי לגשם מחר הוא כ-80%. במקרה של האתר הראשון, יהיו הרבה יותר הימורים על האפשרות שירד גשם. במקרה של האתר השני, יחסי ההימורים ישתנו בהתאם, ולבסוף יתאזנו על יחס של 1:4.5 שלא ירד גשם, ויחס של 1:1.125 שירד גשם. אם בסופו של דבר לא ירד גשם מחר, אתר א' יגרוף עמלה אדירה. לעומת זאת, אם מחר ירד גשם, אתר א' יפסיד סכום כסף עצום (וה-odds compiler שקבע את היחס ילך לישון עם הדגים). אתר ב', לעומת זאת, יגרוף בכל מקרה עמלה של כ-10%.

אז מה קרה כאן בעצם? אתר א' ממלא תפקיד של מהמר: הוא לוקח סיכון, ומרוויח או מפסיד בהתאם לתוצאה הסופית. אתר ב' ממלא תפקיד של מתווך: הוא עוזר למהמרים להמר זה מול זה, וגובה עמלה קבועה על שירותיו. הרווח שלו גדל ככל שמהמרים יותר אנשים, ובכל מקרה הוא אינו מסתכן בהפסד. בהקשר זה, ראו גם מאמר של סטיבן לויט מפריקונומיקס [2004].

ואכן, אתרי ההימורים באינטרנט משנים באופן דינמי את יחסי ההימורים שהם מציעים, בצורה דומה מאוד לאתר ב' בדוגמא. השינויים מתבצעים אונליין, ויחסי ההימורים משתנים ממש מדקה לדקה (כמובן, יחס ההימורים המעודכן רלוונטי רק להימורים עתידיים, ולא להימורים שכבר התבצעו ביחס הקודם).

כל זה טוב ויפה, אבל במקרה של ווינר לא ניתן לשנות את יחסי ההימורים מהרגע שנקבעו, כיוון שטפסי ווינר מודפסים מראש ונשלחים לנקודות המכירה. לכן, ווינר עצמם מחוייבים להמר - הנקודה היא שכדי להקטין ככל האפשר את הסיכון שלהם להפסיד, ווינר לא צריכים להתאים את יחסי ההימורים שלהם ליחס ההימורים האמיתי, אלא ל"יחס ההימורים האמיתי הנתפס" של ציבור המהמרים, מוטה ככל שיהיה.

איזה סוגי הטיות צפויים להיות בקרב המהמרים?

הטיה אחת היא מה שמכונה Wishful Thinking: הנטיה של אנשים לבצע הערכת-יתר לסיכוי שמאורע רצוי אכן יקרה. לדוגמא, אלישע בבד ויוסי כץ הראו [1991] שאוהדים במשחק כדורגל מגזימים בהערכת סיכויי קבוצתם לנצח בהשוואה לצופים חסרי העדפה בולטת, ושהתופעה מתקיימת אפילו כאשר האוהדים ממלאים טפסי טוטו (במובן מסוים, המהמרים במקרה האחרון שילמו כדי לשמר את ההטיה). כיוון שאנשים נוטים לאהוד את הקבוצה המנצחת, Wishful Thinking תבוא לידי ביטוי, בדרך כלל, בהטיה לטובת הפייבוריט בהימור.

הטיה נוספת היא תחזית של תורת הערך של כהנמן וטברסקי. אנשים הם "שונאי סיכון" בתחום הרווח, ויעדיפו, למשל, לקבל 100 שקל ביד מאשר להשתתף בהימור שיתן להם 250 שקל בסיכוי של 50% (למרות שתוחלת הרווח גבוהה יותר במקרה השני). אני מאמין שהימורים בווינר נתפסים בדרך כלל כרווח (ז"א שרוב המהמרים בווינר עושים זאת כדי להרוויח, ולא כדי להמנע מהפסד), ולכן יעדיפו להמר על הפייבוריט ולזכות בסיכוי גבוה יותר, אפילו במחיר של הקטנת תוחלת הרווח. ואמנם, נראה שהשיקול שרוב האנשים עושים בבחירת אפשרות ההימור הוא "איזה קבוצה כנראה תנצח", ולא "עבור איזה הימור אני מקבל יחס טוב יותר לעומת היחס האמיתי שאני חושב שמתקיים" (או במילים אחרות: אני מהמר על מכבי כי אני חושב שהיא תנצח, ולא כי אני חושב שהיא תנצח ביחס של 1:5 אבל מציעים לי עליה הימור ביחס של 1:10). ובשורה התחתונה, כל האמור לעיל יגרום, שוב, להטיה לטובת הפייבוריט בהימור.

ובחזרה לעמלות של ווינר: ראינו שווינר גובים עמלה נמוכה יותר ממי שמהמר על הפייבוריט, ז"א הופכים את ההימור על הפייבוריט לאטרקטיבי יותר. אם  ווינר מנסים לקלוע ליחסי ההימורים האמיתיים כפי שהם נתפסים ע"י המהמרים, המשמעות היא שווינר חושבים שלמהמרים יש הטיה טבעית להמר דוקא על האנדרדוג, וזאת בניגוד מוחלט לאמור בשתי הפסקאות האחרונות!

בהנחה שווינר לא טפשים (ז"א לא טועים לגמרי בדרך שבה הם קובעים את העמלות), ומצד שני גם לא גאונים (ז"א לא גילו הטיות קוגניטיביות שאינן מוכרות לפסיכולוגיה המודרנית), נשאלת השאלה מה ההגיון בקביעת העמלות בצורה הזו?

אני אציע הסבר אפשרי אחד, אבל האמת היא שאין לי מושג. אם למישהו יש רעיון, או מכיר מישהו שעובד בווינר ויכול לספק הסבר טוב יותר, אני אשמח מאוד לשמוע. בכל מקרה, תיאוריית הקונספירציה שלי היא כדלהלן:

כפי שראינו, העמלה הממוצעת שווינר גובים על כל הימור היא כ-19% (עד כדי סטיית תקן מזערית, שיכולה אפילו לנבוע משגיאות עיגול), ונניח שמסיבה כלשהי ווינר מחוייבים לגבות עמלה בשיעור הזה בדיוק (לדוגמא שהעמלה הזו מוגדרת בחוק להסדר ההימורים בספורט או באחד מהתיקונים שלו). הנקודה החשובה היא שמדובר בעמלה גבוהה מאוד, ובפרט עמלה גבוהה יותר משמעותית מזו שגובים המתחרים של ווינר: אתרי ההימורים באינטרנט (בדיקה אקראית של כמה אתרי הימורים גדולים מראה שהם לוקחים עמלות של פחות מ-5% על משחקי כדורגל).

עכשיו, מי שרוצה להמר על מכבי צריך להחליט אם לעשות את זה בווינר, או באתר אינטרנט כלשהו. לווינר יש יתרון אחד גדול - ההימור חוקי - ובשבילו אנשים מוכנים לשלם כסף (התשלום מתבטא בכך שהם מקבלים יחס הימור גרוע יותר מאשר באינטרנט, על אותם הימורים בדיוק). השאלה היא כמה כסף אנשים יהיו מוכנים לשלם, אבל בלי קשר לתשובה המדויקת ברור שיש הפרש עמלות מסויים שממנו והלאה אנשים יעדיפו לא להמר בווינר.

אמרנו שווינר מחוייבים, לכאורה, לגבות עמלה קבועה של 19% על כל משחק (משחק הוא למעשה שלושה הימורים שונים שקשורים זה לזה: הימור על התוצאות 1, 2 או X של משחק מסויים). העמלה הזו כל כך גבוהה יחסית לעמלות של אתרי הימורים, שקשה להאמין שמישהו יסכים להמר בווינר.

תיאוריית הקונספירציה שלי היא שווינר מצאו דרך לעקוף את הבעיה הזו. לכאורה, הם מציעים יחסי הימורים שמבטאים עמלה פוטנציאלית של 19% למשחק. בפועל, הם מטים את יחסי ההימורים כך שרוב העמלה באה לידי ביטוי בהימור על האנדרדוג, שאף אחד לא לוקח גם ככה. ההימורים שאנשים כן לוקחים (ההימורים על הפייבוריט) מגלמים עמלה של כ-10% - עדיין גבוהה יותר מבאתרי ההימורים, אבל לא גבוהה מספיק בשביל להצדיק עבירה על החוק. בקיצור, אני מאמין שווינר מציעים הימורים עם עמלה ממוצעת של 19%, אך בפועל גוזרים קופון של מעט יותר מ-10%.

עדיין נשאלת השאלה עד כמה ווינר מסתכנים - אני לא מאמין שהם ממלאים תפקיד של מתווך בין מהמרים, כי סביר שהרוב המוחלט של ההימורים מתבצעים על הפייבוריט בכל משחק (ויחסי ההימורים לא מאזנים זאת, בניגוד לדוגמא של אתר הימורים ב' מקודם). מצד שני, הם גובים עמלות גבוהות כל כך שיכול להיות שהן מכסות את הסיכון.

בשורה התחתונה: לא כדאי להמר בכלל. ואם מהמרים, לא כדאי להמר בווינר. ואם מהמרים בווינר, לא כדאי להמר על האנדרדוג.