המחשב סוגר את "הפער הסמנטי", האנושות תיאלץ לקבל החלטות

28 ינואר, 2012

בסיסי נתונים גדולים ולא מפורמטים כמו רשתות חברתיות ומידע המגיע מריבוי מצלמות, הביאו את יכולת המחשבים להבין תמונות אל נקודת פריצה. בתוך 20 יספקו מערכות המידע יישומים חסרי תקדים, שהאנושות תצטרך להחליט האם לאפשר את קיומן או לא. כך עולה מרב-שיח בהנחיית Techtime שנערך לקראת כנס IMVC 2012

השימוש בבסיסי נתונים גדולים מביא אל סדר היום את המושג "חוכמת ההמון"

IMVC 2012 — משתתפים בפאנל, מימין לשמאל: פאבל קיסילב, טל הסנר, יניב טייגמן, מיכאל צ'רטוק

תחום ראיית המכונה (Machine Vision) נמצא כעת בתחילתו של שלב התפתחות דרמטי כתוצאה מהשימוש בבסיסי נתונים גדולים המרכזים מידע מרשתות חברתיות, מהאינטרנט וממיליוני המצלמות הפזורות בדרכים, ברחובות ובמרכזי הקניות.

בתוך 20 שנה לכל היותר ייסגר הפער הסמנטי (Semantic Gap) בין מחשבים ובין בני האדם בכל הקשור ליכולת להבין תמונות. הדבר יביא להופעת יישומים חדשים ופורצי דרך שיהיו כל-כך מפתיעים ורבי-עוצמה, שהאנושות תגיע לצומת של קבלת החלטת ותיאלץ להכריע האם לאפשר את קיומם או לא.

המסקנה הזו עולה מתוך רב-שיח בהנחיית Techtime שנערך עם כמה מהמומחים המובילים בישראל בתחום ראיית המכונה (Machine Vision).

הדיון נערך לקראת כנס IMVC 2012 בארגון קבוצת טכנולוגיות, ובהובלת ד"ר קובי כהן וד"ר שגיב חן מחברת שגיב-טק. הכנס ייערך ב-9 בפברואר באולם אבניו בקרית שדה-התעופה.

סגירת הפער הסמנטי

בדיון השתתפו שותף-מייסד וה-CTO של חברת Face.com יניב טייגמן. החברה פיתחה טכנולוגיית זיהוי פנים ייחודית שהוטמעה בתשתית של פייסבוק. שותף מייסד וה-CTO של חברת SuperFish מיכאל צ'רטוק. החברה מספקת מנוע לחיפוש תמונות. ד"ר פאבל קיסילב ממעבדות המחקר של יבמ בישראל החוקר את תחום הראייה הממוחשבת, ד"ר אמיר נ. מחברת רפאל וד"ר טל הסנר מהאוניברסיטה הפתוחה, אשר יתן בכנס את הרצאת הסקירה של התחום.

הפער הסמנטי הוא מושג המבטא את ההבדל בין האופן שבו אדם מתאר תמונה באמצעות שפה טבעית עשירה, לבין היציוגים של המחשב. חשוב לזכור שהמושג מתייחס להבדל שבין מחשב לבין אדם, ולא להבדל שבין בני-אדם. אומנם הפערים סמנטיים בין בני-אדם יחידים לבין עצמם, ובין בני-אדם המגיעים מתרבויות שונות, הם בלתי נמנעים, אולם כאשר מחשב יכול לתייג תמונה באמצעות מספר סיווגים שרוב בני-האדם יסכימו עליהם – ניתן לומר שהפער בין האדם למכונה נסגר.

המוח האנושי "ידוע לשימצה"

להערכת מיכאל, הפתרון של בעיית הפער הסמנטי הוא עניין של זמן בלבד. "למרות שלקח זמן עד שהמחשב ניצח את השחמטאי, הוא עשה זאת. בתחום ראיית המכונה יש עבודה המראה שכבר היום המחשב יכול לנצח את האדם בזיהוי פנים: כשמציגים לאדם שתי תמונות פנים שהוא לא מכיר – הוא מפסיד למחשב. "אנחנו נסגור את הפער הסמנטי, ובתוך 20 שנה המחשב יידע להגיד על תמונה כל מה שאדם יודע עליה. כמו שגוגל פתרה את הבעייה ברמת הטקסט, ויבמ פתרה את בעיית הטריוויה באמצעות המחשב ווטסון, בסיסי מידע גדולים יאפשרו לנו לפתור את הבעיה ברמת התמונה".

אמיר העניק להתפתחות הצפויה מימד דרמטי: "כשהפער הסמנטי ייסגר, יתחולל זינוק אדיר. נהיה בנקודת צומת שבה הרבה מאוד אפליקציות יפרצו קדימה והאנושות תהיה בצומת של קבלת החלטות שבה תצטרך להחליט מה לעשות איתן. כבר היום יש לנו מספיק אבני בניין ליצור דברים שעדיין לא מיושמים. בתחום האיבחון הרפואי, למשל, אפשר כעת לתת לרופאים מערכת ייעוץ יעילה, אולם הדבר לא נעשה בגלל מחסום של שמרנות. כשהפער הסמנטי ייסגר, אני חושב שגם השמרנות הזו תיפרץ".

מחשב הוא לא מוח מלאכותי

ד"ר טל הטיל ספק בחזון: "ראייה ממוחשבת לא צריכה לפתור את בעיית הפער הסמנטי. המחשב הוא לא חיקוי של המוח – כמו שמכונה מעופפת היא לא ציפור מלאכותית – אלא מטוס. למערכות שאנחנו מפתחים יש יתרונות מובהקים בהשוואה לבני-אדם, שהם ידועים לשמצה בחוסר היכולת שלהם לזכור מידע ויזואלי לאורך זמן. התשובה לשאלה מתי המחשבים יראו כמונו, היא לדעתי – אף-פעם. לא זה מה שאנחנו מפתחים".

אלא שלמרות המים הצוננים ששפך, הוא מסכים שמתחולל כיום מהלך רחב-היקף המתרחש לא בתחום המצלמות ותוכנות עיבוד התמונה הקלאסיות, אלא הרחק מהן, במרכזי הנתונים הגדולים: "כשיש מעבדים חזקים והרבה מאוד תמונות אפשר להציף את המערכת בהרבה מאוד דוגמאות, ולתת לה למשל ללמוד את הקשרים שבין תמונות פנים לבין אנשים.

המצלמה מסתתרת בדטה-בייס

אמיר: "לפני 10 שנים עוד לא היתה מצלמה דיגיטלית. יש גידול בהיקף הקלט, וכשיש כל-כך הרבה מידע, מתפתחים כיוונים חדשים. הכלים המתימטיים לא השתנו, אלא השימוש בהם. בקהילה נפוץ הפתגם שלפיו 'לימוד מכונה (Machine Learning) הוא תחום שהפך את הבורות לאמנות'. הרבה מהכלים המתימטיים בתחום פותחו לפני עשרות שנים בתחום הססטטיסטיקה. אבל למרות זאת הראינו שבאמצעות הכלים הללו ניתן לעשות דברים חדשים לגמרי.

יניב: "ברשתות חברתיות יש מידע אדיר שיכול לשמש כחומר-גלם למוצר אחר לגמרי. מצלמה בקניון למשל, יכולה לנחש מה הם הצרכים של מבקר אקראי באמצעות שימוש מידע קונטקסטואלי המגיע מרשתות חברתיות. כעת אנחנו עוסקים בפיתוח התחום הזה ביחד עם שותפים".

פאבל מסביר שהשימוש בבסיסי הנתונים הגדולים, המתאפשר כיום בזכות תשתית הענן, מעלה לראש סדר היום את המושג "חוכמת ההמון" (Crowdsourcing): כמות המידע המגיעה מאבזרים כמו הסמארטפון מאפשר לכל אדם להביע את דעתו על מוצרים או נושאים שונים, והמערכת יכולה ללמוד כמות החלטות אדירה של בני-אדם. "זהו כיוון חדש שאליו מתפתח תחום לימוד המכונה: יצירת פתרונות המבוססים על שיפוט אנושי בהיקף גדול, ולא על מודלים פיסיקליים.

"אחת מהתוצאות תהיה כניסה של תחומים חדשים, כמו מדעי החברה והרוח, אל תחום לימוד המכונה. תוצאה אחרת תהיה יישום טכנולוגיות הלימוד החדשות לפיתוח אמצעים בתחום הסייבר-סקיוריטי ולמחקרי בתחום הביו-אינפורמטיקה".

מחשבים מנבאי אוטיזם

יניב: "התוצאה תהיה שהמערכת הממוחשבת תסייע לנו לתקשר עם הסביבה. היא תהיה כלי התקשרות חדש. יישומים בטלפון יבצעו זיהוי של אנשים, וחולים בעלי מוגבלויות יבצעו זיהוי עצמים באמצעות ראייה ממוחשבת. כיום מתנהל אפילו מיזם מהפכני הקושר בין תמונות פנים לבין מחלות. המטרה המיידית היא לזהות אוטיזם בשלבי החיים המוקדמים ביותר באמצעות עיבוד תמונה של ילדים ותינוקות, כאשר אין אף אינדיקציה אחרת לפגיעה".