דילמת האסיר
מתוך ויקיפדיה, האנציקלופדיה החופשית
דילמת האסיר היא בעיה פרדוקסלית בתורת המשחקים, שפורסמה בשנת 1950 על-ידי מריל פלאד ומלווין דרשר מ־"מכון ראנד" בארצות הברית. הדילמה מדגימה מצב בו התנהגות רציונלית לחלוטין, מנקודת מבטו של הפרט, תוביל לתוצאה שאינה אופטימלית. בשל פשטותה, הדילמה משמשת כדוגמה קלסית לבעיות בהן תורת המשחקים עוסקת.
תוכן עניינים |
[עריכה] הדילמה הבסיסית
גרסה נפוצה לבעיה זו: המשטרה עצרה שני עבריינים שביצעו פשע משותף, ומפרידה ביניהם לצורך חקירה. אם תצליח המשטרה להביא להרשעתם, ייכנס כל אחד מהם לכלא ל-15 שנה, אך בחוסר ראיות הם יועמדו לדין על עבירה משנית שבגינה ייכנס כל אחד מהם לכלא לשנה אחת. למשטרה אין די ראיות להעמידם לדין, ולכן היא מציעה לכל אחד מהם להעיד נגד רעהו, וכפרס מובטח לעד עונש מופחת: אם שני האסירים יקבלו את הצעת המשטרה, ייכנס כל אחד מהם לכלא לחמש שנים, ואם רק אחד מהם יעיד ורעהו ישתוק, העד יצא מיד לחופשי וחברו ייכלא ל-15 שנה. ניתן לסכם סיטואציה זו בטבלה הבאה, שמסכמת את העונשים שייגזרו על אסיר א (אדום) ואסיר ב (כחול) בהתאם לפעולתם:
אסיר ב | |||
שותק | מעיד | ||
אסיר א | שותק | שנה אחת, שנה אחת | 15 שנה, אפס שנים |
מעיד | אפס שנים, 15 שנה | חמש שנים, חמש שנים |
כל העובדות הללו ידועות לשני האסירים, אך אין באפשרותם לתקשר האחד עם השני. הדילמה שעומדת בפני כל אחד מהם היא "באיזה טקטיקה לנקוט - לשתוק או להעיד?". אסיר א' מסתכל בטבלה וחושב: "בלי תלות בטקטיקה שבה יבחר ב', כדאי לי להעיד, משום שבכל מקרה אם אעיד עונשי יהיה קטן מאשר אם אשתוק" ולפיכך "הודאה" היא אסטרטגיה שלטת עבורו. גם אסיר ב' מנתח את המצב בצורה דומה. החלטה רציונלית של שניהם מובילה לכך ששניהם בוחרים להעיד, ונכנסים לכלא לחמש שנים. אילו שתקו שניהם, היה כל אחד מהם נכנס לכלא לשנה בלבד.
הפרדוקסליות שבדילמה נובעת מכך שהחלטה רציונלית מביאה לתוצאה שאינה הטובה ביותר. כדי להגיע לתוצאה הטובה ביותר עבור שניהם נדרשים השחקנים לשיתוף פעולה (שתיקה של שניהם), אך מכיוון שדרך הפעולה המשתלמת יותר לכל שחקן לבדו היא תמיד לא לשתף פעולה (כלומר, להעיד), בוחר כל אחד מהשחקנים לא לשתף פעולה.
מעניין לשים לב שגם אם יוכלו האסירים לתקשר אחד עם השני, כל עוד אין הם חותמים על הסכם מחייב, שמבטיח שהחותמים עליו ינהגו בהתאם להצהרתם, דרך הפעולה הרציונלית ממשיכה להיות הלשנה הדדית. רק הסכם שהפרתו גוררת סנקציות שיהוו משקל נגד לרווח שבבגידה יבטיח שיתוף פעולה הדדי.
הדילמה ממחישה מצב שאינו נדיר, לפיו שיתוף פעולה יביא תועלת רבה יותר לשני הצדדים מאשר גישה שבה כל צד פועל על דעת עצמו. הנה כמה דוגמאות אקטואליות לנושא זה:
- במדע המדינה משמשת דילמת האסיר להמחשה מצב שבו שתי מדינות נכנסות למירוץ חימוש. לכל מדינה יש שתי אפשרויות: להגדיל את תקציב הביטחון שלה או להגיע להסכם עם יריבתה לפירוק החימוש. בכל מדינה מקנן החשש שיריבתה תפר את ההסכם, ולכן כל אחת מהן נוטה לכיוון של מירוץ חימוש. כל מדינה נראית כפועלת באופן רציונלי, אך התוצאה היא בלתי רציונלית בעליל. דוגמה למרוץ חימוש מסוג זה הוא המלחמה הקרה.
- בתחום הכלכלה, ניתן להוכיח, שכאשר הריבית הנומינלית במשק גדולה מ-0, וכל גורם במשק דואג רק לטובת עצמו, התוצאות עבור המשק כולו אינן אופטימליות. פתרון אפשרי לבעיה זו הוא להוריד את שער הריבית ל-0[1].
[עריכה] דילמת האסיר האלטרואיסט
דילמת האסיר עוסקת באי שיתוף פעולה, ואינה אומרת דבר על מטרתה של הפעולה, שיכולה להיות גם אנוכית (כפי שהיא מוצגת בניסוח המקורי) וגם אלטרואיסטית. כדי לראות זאת נביט בניסוח הבא של הדילמה: נניח כי השוטרים מציעים לכל אחד משני האסירים את העסקה הבאה: אם אחד האסירים יתוודה ויקח את כל האשמה על עצמו, חברו ישוחרר. אם לעומת זאת שני האסירים ישתקו, שניהם יקבלו עונש מאסר על בסיס הראיות שכבר קיימות. אם שני האסירים יתוודו, שניהם יקבלו את אותו עונש, שהוא גדול מהעונש שהיו מקבלים אם היו שותקים, אך קטן מהעונש שהיה מקבל אסיר שהיה מתוודה לבדו:
אסיר ב | |||
מכחיש | מודה | ||
אסיר א | מכחיש | חמש שנים, חמש שנים | אפס שנים, 15 שנים |
מודה | 15 שנים, אפס שנים | עשר שנים, עשר שנים |
בתנאים אלו מתקבלת דילמת האסיר כאשר האסירים מתעניינים איש בתועלת של רעהו, ולא במאסר שהם עצמם יקבלו. זוהי דוגמה למצב שבו מתקבלת דילמת האסיר מפעולה שמונחית מטעמים אלטרואיסטיים.
[עריכה] דילמת אסיר איטרטיבית
כאשר ההחלטה שעל האסירים לקבל אינה חד-פעמית, כמו בדוגמה לעיל, אלא יש להם הזדמנות לחזור על ה"משחק" פעמים רבות האסירים עשויים לנהוג אחרת ולשתף פעולה לצורך קבלת תוצאה טובה יותר מבחינתם. חזרה על הדילמה או במילים אחרות דילמת אסיר איטרטיבית (כלומר כזו שחוזרת על עצמה שוב ושוב), משמשת בסיס למחקרים פסיכולוגיים רבים, שבהם נבחנה התנהגותם של המשתתפים בדגם זה של ה"משחק".
אחד הניסויים המפורסמים בתחום זה הוא הניסוי שערך רוברט אקסלרוד מאוניברסיטת אן-ארבור במישיגן. בניסוי זו התבקשו מומחים ממגוון דיסציפלינות (כלכלה, פסיכולוגיה, מדע המדינה, ביולוגיה, מדעי המחשב ועוד) לשלוח תוכניות מחשב שישחקו זו נגד זו בדילמת אסיר איטרטיבית במשך 200 משחקים לכל זוג תוכניות. התוכנית שתוכרז כזוכה היא זו שתזכה ברווח המצטבר הגבוה ביותר בכל 200 המשחקים.
תוכניות אלה נקטו באסטרטגיות שונות כדי להשיג מטרה זו, ובהן:
- בגידה קבועה: ללא תלות במשחקים קודמים, תוכנית זו בגדה תמיד.
- שיתוף פעולה קבוע: ללא תלות במשחקים קודמים, תוכנית זו שיתפה פעולה תמיד.
- אקראית: התוכנית בוחרת בבגידה או בשיתוף פעולה באופן אקראי.
- מידה כנגד מידה (Tit For Tat): במשחק הראשון התוכנית שיתפה פעולה, ובכל משחק אחר בחרה בדרך שבה בחר היריב במשחק הקודם.
- אסטרטגיות אחרות, מורכבות יותר.
בטורניר שערך אקסלרוד השיגה מידה כנגד מידה את התוצאה הטובה ביותר. יש לציין שגם בטורנירים נוספים שנערכו, לאחר שנודעו תוצאות הטורניר הראשון, עדיין השיגה אסטרטגיה זו את הניקוד הגבוה ביותר. לעומת זאת, תוכניות שהיו בנויות על אסטרטגיות תוקפניות הגיעו להישגים נמוכים. חשוב לציין כי הצלחתה של אסטרגיה מסוימת תלויה באסטרטגיות האחרות. משמע - במידה והתכניות שנשלחו לטורניר היו שונות - לא הייתה מידה כנגד מידה זוכה בטורניר. לא ניתן לכתוב תוכנה או אסטרטגיה שתזכה מול כל אסטרטגיה אחרת.
תחת תנאים מסוימים ההחלטה הרציונאלית היא דווקא לשתף פעולה ולא לבגוד. תנאי יסוד הוא אכיפה של עונש. אכיפה מתקבלת באמצעות קיום משחקים חוזרים אינסופיים או בעלי אופק ארועים לא ידוע, דבר השקול לאופק אין סופי. משום שאם מספר המשחקים ידוע, במשחק שלפני האחרון כדאי לבגוד ואז ניתן להוכיח באינדוקציה לאחור שכדאי לבגוד מהמשחק הראשון. לשם אכיפה צריכים להתקיים תנאים כאלה שהסיכוי למפגש חוזר גבוה מספיק וכן שישנו עונש. העונש גם צריך להיות גבוה מהרווח של הבגידה. בתחומים ביולוגיים, כגון התנהגות בעלי חיים, ניתן לצפות לקיומם של תנאים אלה במקרים רבים ואז ההעדפה היא לשיתוף פעולה על-פני אי שיתוף, מסיבות רציונליות. כאשר ציפור פולה את נוצות חברתה כדי לסלק טפיל (ממקומות שהציפור השנייה אינה יכולה לגשת בעצמה, כגון פדחת הראש), עושה היא זאת כדי לקבל אותו הטיפול בעת צרה. אומנם, "עלות" פליית פדחת הציפור השותפה איננה גדולה, בהשוואה לתועלת שבסילוק טפיל, אבל אין היא זניחה לחלוטין, משום שהסילוק כרוך בהוצאת זמן ואנרגיה.
[עריכה] הבעייתיות בשימוש בדילמת האסיר במציאות
ישנן סיבות אחדות מדוע שימוש בדילמת האסיר אינו יעיל במיוחד על ידי הגוף החוקר:
- ברוב המדינות העונשים לא קבועים מראש ולכן ה"אסיר" לא יכול לדעת בוודאות כי הודאה תיתן לו תוצאה עדיפה.
- ניתן לערער את אמינותו של ה"אסיר" השני בבית המשפט - במיוחד במקרים בהם הוא היה שותף מלא לפשע ומקבל תגמול גדול עבור הודאתו.
- עציר יכול לשנות את טענתו בקלות רבה יותר מ"לא מודה" ל"מודה" מאשר להפך.
- במציאות, בדרך כלל, גם הודאה תגרור עונש. לפיכך, ייתכן ובמהלך החקירה עדיף ל"אסיר" לא להודות.
- שימוש בסחיטת הודאה מה"אסיר" באמצעות דילמת האסיר עלול להחשב בבית המשפט כהודאה שהתקבלה שלא מרצונו החופשי של האסיר, שאינה הודאה קבילה במדינות רבות בעולם המערבי.
- היחסים בין ה"אסירים" אינם חד פעמיים, כלומר יש להתייחס למשחק החוזר.
- העונש על הלשנה עלול להיות חמור מהעונש על העבירה הפלילית - סיבה זו מהווה את הקושי העיקרי של משטרות בעולם במלחמתם בפשע המאורגן ובכנופיות פשע.
[עריכה] לקריאה נוספת
- אילן עמית, הליברליזם ופרדוקס האסירים, מחשבות, דצמבר 1984.
- ריצ'רד דוקינס, הגן האנוכיי, תורגם על ידי עמנואל לוטם, הוצאת דביר, 1989.
- אריאל רובינשטיין, דילמה לוקה בחסר, הארץ, אפריל 1995.
- ויליאם פאונדסטון, דילמת האסיר, הוצאת זמורה ביתן, 2000.
[עריכה] ראו גם