סימון אוטומטי של טוקבקיסטים אינטליגנטים
רביעי, 27 בספטמבר 2006כקורא נלהב של טוקבקים ב-ynet, אני נתקל באופן קבוע בבעיה: כתבות העוסקות בנושאים שנויים במחלוקת זוכות לכמות אדירה של תגובות, לעיתים כמה מאות ובמקרים קיצוניים אף אלפים.
קריאת כמות כזו של תגובות אינה אפשרית במגבלות זמן סבירות, מה גם שרובן המוחלט של התגובות הוא זבל, וקריאתן פשוט מבזבזת את זמנו של הקורא. לכן, נדרש מנגנון שיזהה את התגובות הערכיות ביותר (ערכיות במובן בעלות ערך, ז"א התגובות ששוות קריאה), ויסמן אותן עבור הקוראים. בהמשך, אציג גישה מעניינת למנגנון כזה, שאכנה SMARTCHA.
ראשית, יש להגדיר מה הופך תגובה לערכית, ובפרט האם מדובר במדד אובייקטיבי. האם יתכן שתגובה מסויימת תחשב שוות קריאה בעיני, ובזבוז זמן בעיני אדם אחר? כנראה שכן. למרות זאת, מדובר לדעתי במדד שהוא במהותו אובייקטיבי או לפחות דומה מאוד אצל אנשים שונים, ובסופו של דבר תגובה ערכית תחשב לכזו בעיני רוב האנשים.
מציאת התגובות הערכיות, אם כן, היא לכאורה בעיה קלאסית לפתרון בעזרת חוכמת ההמונים: נבקש מאנשים לדרג את התגובות שהם קוראים, ונניח כי התגובות שיקבלו את הדירוג הממוצע הגבוה ביותר הן הערכיות ביותר. מאוחר יותר, נסמן את התגובות המומלצות בצורה בולטת.
ואכן, נראה שכך בדיוק פועל מנגנון המלצת התגובות ב-ynet. הקורא יכול לדרג כל תגובה, ולמעשה לבחור בין שני דירוגים אפשריים: "מומלץ" או לא. האתר סופר את מספר ההמלצות שקיבלה כל תגובה, וברגע שהוא עובר סף מסויים, כותרת התגובה מודגשת.
לגישה זו כמה בעיות מהותיות:
- הטיה חזקה לטובת התגובות הראשונות, שמטבע הדברים זוכות למספר הקוראים הגדול ביותר (טענה זו ניתנת כמובן להוכחה סטטיסטית).
- הטיה הנובעת מכך שלא כל הקוראים משתמשים במנגנון הדירוג: אם לקוראים שנוטים יותר לדרג תגובות יש במקרה גם העדפות תוכן משותפות (למשל חיבה לבדיחות סטייל "כנסו… עכשיו תצאו!", או אפילו העדפות פוליטיות דומות), המנגנון כולו קורס.
- פרק זמן ארוך יחסית מרגע שתגובה עולה לאתר, ועד שתסומן כמומלצת.
- כמעט בלתי אפשרי להגן על המערכת מהטיה ע"י גורמים בעלי אינטרס שמעוניינים לקדם תגובות מסויימות. גורמים כאלה יכולים להיות חברות מסחריות, מפלגות, ואפילו מיזמים כמו giyus.org. דוגמא מוכרת (מתחום אחר דוקא) היא פרשת הזיופים בכוכב נולד 3.
חלק מהבעיות ניתנות לפתרון: בעיה 1, למשל, נפתרת מיידית אם סדר התגובות נקבע בכל פעם מחדש באקראי (במחיר של שבירת הרצף של תגובות לתגובות: "34 - אתה אדיוט!"). אבל באופן כללי מדובר בבעיות אינהרנטיות של השיטה, ולכן קשה מאוד להתגבר עליהן. בפועל, ניתן לראות שמנגנון ההמלצות של ynet משיג תוצאות בינוניות ביותר.
אציע כעת דרך אלטרנטיבית לסימון תגובות ערכיות, תחת ההנחה שיש קשר חזק בין אינטליגנציית המגיב לערכיות התגובה. בפרט, ההנחה היא שככל שהמגיב אינטליגנטי יותר, כך סביר יותר שהתגובה תהיה ערכית. בעיית סימון התגובות הערכיות מצטמצמת, אם כן, לשאלה כיצד ניתן לזהות באופן אוטומטי את המגיבים האינטליגנטים ביותר.
את הפתרון אני מכנה SMARTCHA, והוא שילוב של שאלות ממבחני IQ עם מערכת CAPTCHA.
CAPTCHA היא שיטה שפותחה באוניברסיטת קרנגי מלון, במטרה לזהות בצורה אוטומטית האם משתמש במערכת הוא אדם או מחשב (מדובר במעין מבחן טיורינג מהיר ואוטומטי). השימוש העיקרי בשיטה הוא וידוא שפתיחת חשבון דואר (ב-gmail, למשל) מתבצעת ע"י אדם, כדי למנוע ממערכות אוטומטיות לפתוח חשבונות דואר רבים שאח"כ ישמשו לשליחת ספאם.
השיטה מבוססת על הצגת תמונה מעוותת של טקסט שניתנת לזיהוי בקלות יחסית ע"י אדם אך לא ע"י מחשב, והמשתמש נדרש להקליד את הטקסט מחדש כדי להוכיח שהוא אנושי. לדוגמא, התמונה הבאה מקודדת את הטקסט smwm:

מבחני IQ הם מבחנים המודדים אינטליגנציה. קיימים סוגים רבים של מבחנים ושל שאלות, ואני אתמקד בסוג אחד של שאלות שמתאים במיוחד ליישום במערכת דמוית CAPTCHA: שאלות Matrix Reasoning מתוך מבחן האינטליגנציה של וקסלר.
בשאלת Matrix Reasoning מוצגת מטריצת ריבועים שבה ריבוע אחד חסר. המטרה היא לזהות את החוקיות הפנימית במטריצה, ולסמן את הריבוע החסר מתוך מספר אפשרויות. לדוגמא:

נראה קל? לא בהכרח. הנה דוגמא קשה יותר מתוך מבחן הדוגמא של מכון נועם:


SMARTCHA, כאמור, היא שילוב של שתי השיטות: עם שליחת התגובה, תוצג למגיב שאלת Matrix Reasoning, וינתן לו פרק זמן מוגבל (נניח דקה) לענות עליה. במידה והמשתמש ענה נכון, המערכת תסמן את התגובה כ"אינטליגנטית פוטנציאלית". היתרון בשימוש דוקא בשאלות מסוג Matrix Reasoning הוא שהן ניתנות לייצור אוטומטי ע"י מחשב (בדיוק כמו שאלות CAPTCHA).
אני מאמין שבחירה נכונה של שאלות תאפשר לזהות אחוזון אינטליגנציה לפי בחירתנו. ז"א, רמת שאלות מסויימת תזהה את 10% האינטליגנטים ביותר באוכלוסיה, רמת שאלות אחרת תזהה את 20% האינטליגנטים ביותר וכו'. שיפור לשיטה יהיה לזכור את תוצאות העבר של כל משתמש ואת פרק הזמן שנדרש לו להגיע לתשובה הנכונה בכל פעם, וכך להגיע להערכה מדוייקת יותר של האינטליגנציה שלו.
חשוב להדגיש ששאלות Matrix Reasoning אינן מדד יחיד לאינטליגנציה, ויתכן שאדם אינטליגנטי למדי יתקשה לפתור דוקא שאלות מסוג זה. יחד עם זאת, מדובר במדד אינטליגנציה טוב יחסית, ואף כזה שאינו תלוי תרבות.
כאלטרנטיבה, ניתן להציג בפני המגיב שאלה אמריקאית העוסקת בתחום הכתבה עליה הוא מגיב (מחשבים, בישול וכו'). ההנחה כאן היא שיש קשר חזק בין מידת ההכרות של המגיב את נושא התגובה לבין ערכיות התגובה. בעיות: קושי לחבר את השאלות אוטומטית, תלוי תרבות (שפה, למשל), קושי ליישום בתחומי ידע שאינם ממוקדים (פוליטיקה, מוסר וערכים, יחסים בינו לבינה).
לסיכום, תיארתי שיטה אוטומטית לזיהוי תגובות של טוקבקיסטים אינטליגנטים, שאינה מבוססת על שקלול המלצות של גולשים אחרים. כמובן, גם לשיטה הזו יש בעיות, ובודאי לא מובטח שתמליץ תמיד על התגובות הערכיות ביותר. למרות זאת, אני מאמין שיש לה פוטנציאל רב להגיע לתוצאות טובות, והייתי שמח לראות שילוב של שיטת ההמלצות של ynet עם השיטה שלי.
פלאגין לוורדפרס, מישהו? :)