[למעלה: הלוגו של התחרות]
מי שמשכו את מירב תשומת הלב באולימפיאדת המתמטיקה הבינלאומית לנוער (IMO), שננעלה אתמול באוסטרליה, היו לא המתחרים הצעירים, אלא דווקא שני מודלי AI. לראשונה בתולדות התחרות, שני מודלי AI – אחד מבית Google DeepMind והשני מבית OpenAI – זכו להזדמנות להפגין את יכולותיהם בפתרון בעיות מתמטיות ולוגיות מורכבות, אף שלא התחרו בתחרות באופן רשמי. שני המודלים הציגו ביצועים גבוהים מאוד, אשר היו מזכים אותם במדליית זהב. מדובר בשני מודלי "חשיבה" ניסיונים, ושתי החברות לא צפויות לשחרר אותם לציבור.
האולימפיאדה, שמתקיימת מאז 1959, היא תחרות עולמית שנתית למתמטיקה לתלמידי תיכון, שבה משתתפות יותר מ-100 מדינות. כל מדינה שולחת שישה מתחרים, הנבחרים מתוך אלפי מועמדים מקומיים. כל משתתף נדרש להתמודד עם שש בעיות מתמטיות קשות במיוחד, תוך יומיים, שלוש בעיות בכל יום, במשך ארבע שעות וחצי.
הבעיות אינן דורשות ידע אקדמי, אך כן דורשות חשיבה עמוקה, יצירתיות ולוגיקה ברמה גבוהה מאוד. הן עוסקות בנושאים כמו גאומטריה קלאסית, תורת המספרים, קומבינטוריקה, אלגברה מתקדמת, הוכחות בעזרת אינדוקציה או בנייה קונסטרוקטיבית. רוב הפותרים מצליחים לפתור רק חלק מהשאלות. מדליית זהב מוענקת לא רק לזוכה במקום הראשון, אלא למעשה לכ-10% העליונים מבין כ-630 המשתתפים.
במקום הראשון השנה בדירוג הקבוצתי דורגה נבחרת סין, עם ניקוד כולל של 231 מתוך 252, כולל שלושה משתתפים שפתרו את כל 6 השאלות בהצלחה. אחריה דורגה הנבחרת של ארצות הברית. הנבחרת הישראלית הגיעה למקום השישי והמכובד מאוד.
המודל Gemini DeepThink של Google DeepMind השתתף רשמית בתחרות – לא כמתחרה אנושי אלא לצורכי הדגמה – ופתר חמש מתוך שש הבעיות. מדובר בציון שמכניס את המודל ל־10% העליונים של המתחרים – כלומר, רף הזהב. גם המודל של OpenAI עמד באותו רף בדיוק, ופתר חמש מתוך שש שאלות בתנאים דומים.
יש מי שעשויים להמעיט בהישג ולטעון כי מדובר ב"תחרות לנוער". ואכן, הבעיות ב-IMO אינן דורשות כלים אקדמיים, אך כן מסתמכות על חשיבה לוגית נקייה ויצירתיות ברמות הכי גבוהות. גם עבור בני אדם, פתרון מלא של שאלה אחת מתוך שש הוא הישג, ו-5 מתוך 6 זה כבר ביצוע נדיר ברמה עולמית. יתרה מכך, המודלים לא פתרו רק בעיות – הם ניסחו הוכחות בשפה טבעית, ניתחו רעיונות מתמטיים, ויצרו רצף חשיבה דמוי אנושי – מה שנחשב כיום לפסגת היכולות בתחום ה-reasoning. גם צריך לזכור, אמנם המודלים נבנו על בסיס טריליוני מילים ונתונים, אבל הם לא "למדו את התשובות בעל פה". מדובר בבעיות חדשות, שלא פורסמו מראש, והתשובות אליהן אינן מבוססות על זיכרון אלא על חשיבה ויצירתיות.
