"זיקוק מודלים" שובר את מחסום הלמידה העמוקה בקצה הרשת
26 יוני, 2025
כתבת מומחה: גישה חדשה של AI Model Distillation מאפשרת להשיג את הבלתי אפשרי: ליישם לימוד עומק המבוסס על מאגרי מידע עצומים - באבזרי קצה חסכוניים מאוד באנרגיה ודלים בעוצמת עיבוד

בתמונה למעלה: הרכבת שרתים במפעל הייפר גלובל בראש העין. צילום: הייפר גלובל
מאת: יואל יעקבסן, CTO חברת הייפר גלובל (HIPER Global)
בעידן שבו מכשירים חכמים מהווים חלק בלתי נפרד מחיינו, היכולת לעבד נתונים ולקבל החלטות בקצה הרשת (Edge) היא קריטית, אולם היא דורשת להריץ מודלי בינה מלאכותית עתירי עיבוד על-גבי מכשירים מוגבלי משאבים כמו טלפונים, מצלמות או מחשבים תעשייתיים. טכניקת "זיקוק מודלים" (Model Distillation) החדשה מסתמנת כפתרון המאפשר לגשר על הפער ולהביא את העוצמה של מודלי ענק אל אבזרי הקצה.
מחשוב קצה (Edge Computing) הוא פרדיגמה טכנולוגית שבה עיבוד המידע מתבצע קרוב למקור יצירתו או למקום הצריכה שלו, ולא בשרתי ענן מרוחקים. לגישה הזו יתרונות מרובים: זמן תגובה קצר, חסכון בעלויות התקשורת, שמירת פרטיות ואבטחה, ואפשרות לשימוש בטכנולוגיה עתירת עיבוד גם באזורים ללא קליטת אינטרנט יציבה. אלא שמודלי למידה עמוקה מודרניים, המצטיינים במשימות כמו זיהוי תמונה או עיבוד שפה טבעית (ובמקרים רבים – שניהם יחד), הם לרוב מפלצות חישוביות.
האנלוגיה המפתיעה של מורה-תלמיד
הם דורשים עוצמת עיבוד גדולה, הרבה מאוד נפח של זיכרון מהיר וצורכים אנרגיה רבה – שלושה משאבים הנמצאים בצמצום חמור במכשירי קצה. הנסיון לאמן מודלים קטנים הדורשים פחות משאבים, על בסיס המידע ששימש לאימון מודלים גדולים, לא הניב תוצאות טובות. כאן נכנסת לתמונה טכניקת זיקוק המודלים – AI Model Distillation, שהוצגה על-ידי זוכה פרס טיורינג, ג'פרי הינטון. הוא מבוסס על אנלוגיה של מורה–תלמיד: בשלב הראשון, מאמנים מודל AI גדול ומורכב במרכז נתונים חזק. המודל הזה, המשמש כ"מורה", מספק איכות גבוהה מאוד אך הוא גדול ומסורבל מכדי לפעול על מכשיר קצה.
בשלב השני מעבירים "ידע רך" למודל "תלמיד". במקום לאמן מודל קטן ("תלמיד") רק על נתוני האימון הגולמיים, אנחנו מאמנים אותו ללמוד מהתובנות העמוקות יותר של מודל המורה. המורה לא רק אומר "זו התשובה", אלא מספק התפלגות הסתברויות מלאה: "אני בטוח ב-95% שזה כלב, אבל יש סיכוי של 4% שזה זאב ו-1% שזה שועל". מידע עשיר זה, המכונה "ידע רך", מלמד את התלמיד על הקשרים והניואנסים בין קטגוריות שונות.
התוצאה היא מודל תלמיד קטן ו"רזה" משמעותית, הדורש פחות כוח חישוב וזיכרון, אך בזכות הלמידה מהמורה, הוא מצליח לשמר רמת דיוק קרובה מאוד לזו של המודל המקורי והגדול. היכולת לזקק מודלים פותחת את הדלת לשילוב AI מתקדם מאוד במכשירים עם יכולת עיבוד צנועה, ומנגישים יכולות AI במכשירים שבעבר לא יכלו לתמוך בהן. בנוסף, מודלים מזוקקים מאפשרים פיתוח מוצרים חסינים לזליגת מידע, מכיוון שהעיבוד מתבצע באופן מקומי לחלוטין.
"תלמיד מצטיין" מגיע לכל מקום
לטכנולוגיה הזו יש שימושים אפשריים רבים: מערכות ממוחשבות רפואיות יכולות לנתח מידע לגבי חולים, לספק לצוות הרפואי ניתוח של המדדים הרפואיים (ובשילוב מודלים מסוג VLM, גם הצלבה עם ניתוח הדמאות רפואיות באיכות הולכת ועולה) ואפילו ולהמליץ על צעדים רפואיים מיידים אם נדרשים. המלצות אלו יכולות להתבצע מקומית על "מחשב קצה" באיזור החולה, מבלי להתבסס על רשת האינטרנט בשביל עיבוד בענן או במידה רבה אפילו על רשת בית החולים. באמצעות Agentic AI אפשר לשלב אישורים של רופאים אנושיים, להזמין בדיקות ולנתח חומר ממאגרי המידע של בית החולים ואפילו ממאגרי מידע חיצוניים כדי לספק תוצאות טובות יותר.
מוצרים לאבטחת מידע יכולים לנתח מידע ודפוסים באמצעות Reasoning AI מקומי כדי לקבל החלטות מקומיות. מכשירים תעשייתיים יכולים לעבוד באופן פשוט בהרבה באמצעות שילוב של מודלים מזוקקים מקומיים המשלבים ראייה (קריאת מצב מסך, ראייה של המצב בתוך המכונה), דיבור (שיחה עם העובד) וניתוח טקסט (שיחה עם העובד בשפה טבעית), כדי לצמצם פערי מיומנות ולהפוך שימוש במכונות לנגיש יותר ואפילו עצמאי. מוצרים תעשייתיים שנסמכו בעבר על חוקיות עדינה ומתוחכמת שפותחה בעמל רב וקשה מאוד לתחזוקה, יכולים להתבסס על AI מקומי חזק מאוד שנבנה באמצעות זיקוק.
כדי להשיג את כל אלו חשובה גם התשתית ותפעול הסביבה. בחירה נבונה במערכת המיחשוב התעשייתי או הרפואי, המאיצים הנכונים שיתאימו למודלים מזוקקים, תשתיות התוכנה הנחוצות והתהליכים הדרושים כדי לאפשר בטיחות, אבטחה ועדכניות תדירה, הם מרכיב חשוב הדורש מקצועיות בפני עצמה.
לסיכום: טכניקת AI Model Distillation אינה רק אופטימיזציה טכנית; היא טכנולוגיית ליבה המאפשרת להעביר את ה"חוכמה" של מודלי הענק גם אל מכשירי הקצה, וסוללת את הדרך לדור הבא של יישומי קצה מבוססי AI יעילים, מהירים ומאובטחים.

אודות החברה:
הייפר גלובל עוסקת במתן פתרונות מחשוב לחברות טכנולוגיות המפתחות מוצרים. החברה פועלת בישראל ובעולם (באמצעות חברות בת בבריטניה ובארה"ב). היא מספקת ללקוחות פתרונות גלובליים. פעילותה כוללת עבודה משותפת עם גופי הפיתוח של הלקוחות והתאמת פתרונות טכנולוגים מורכבים לצורכיהם. בשלבים שלאחר מכן החברה מייצרת את המערכות שתכננה ומספקת אותן לכל מקום נדרש בעולם.
פורסם בקטגוריות: בינה מלאכותית , חדשות , טכנולוגיות מידע
פורסם בתגיות: בינה מלאכותית , הייפר גלובל , לימוד עומק