בתמונה למעלה: הרכבת מערכות מחשב ברצפת הייצור של הייפר גלובל בראש העין. צילום: HIPER Global
מאמר אורח מאת: יואל יעקבסן, ה-CTO של חברת הייפר גלובל
השיח סביב בינה מלאכותית יוצרת (GenAI) נשלט עד 2025 על-ידי מודלי שפה גדולים (LLMs) מונוליטיים ומבוססי ענן, אשר דורשים משאבי מחשוב עצומים. שנת 2025 סימנה נקודת מפנה משמעותית, עם העלייה הדרמטית באיכות וביכולות של מודלים קטנים עד בינוניים, הניתנים להטמעה מקומית. ההתקדמות הזו מאיצה במהירות את המעבר למודל מבוזר ומקומי יותר של GenAI, המספק יתרונות משמעותיים ביעילות, בפרטיות ובעלויות.
הסדק הראשון במבצר "הענן–בלבד" הודגם באופן בולט על-ידי המודלים של DeepSeek. החברה הסינית הציגה בתחילת 2025 מודל בגודל בינוני, אך בעל איכות מפתיעה, שהדגימה את הערך של מתודולוגיות אימון המאפשרות לחרוג מן הצורך במודלים גדולים מאוד. באמצעות למידה מבוססת חיזוקים וזיקוק מודלים, הוכיחה DeepSeek שביצועים מעולים אינם תלויים אך ורק בגודל המודל. בתהליך ה"זיקוק" מעבירים ידע ממודל "מורה" גדול ועתיר משאבים, למודל "תלמיד" קטן ויעיל. הטכניקה הזו מאפשרת לארגונים לשמור על דיוק גבוה תוך קיצוץ דרסטי בעלויות ושיפור משמעותי בביצועי ה-AI, בהם זמני תגובה מהירים וקצב הפקת טקסט גבוה. האיכות שהציגה DeepSeek הדהימה את העולם, והייתה זרז לשיפור המודלים הקטנים והבינוניים בהמשך השנה.
הופעת ה"מודל-מומחה"
התקדמות משמעותית נוספת הייתה התפשטות המודלים הקטנים יותר מסוג "תערובת מומחים" (MoE). מודלי שפה גדולים מסורתיים מפעילים את כל מערך הפרמטרים שלהם עבור כל שאילתה, ולכן התקורה החישובית שלהם גבוהה. לעומתם, ארכיטקטורת MoE מחלקת את המודל לרשתות "מומחים" קטנות וממוקדות. עבור כל קלט נתון, מופעלת רק תת–קבוצה רלוונטית של מומחים אלה. בשנת 2025 עברו כל המודלים הגדולים להתבסס על MoE, ולצדם שוחררו מודלים בינוניים וקטנים איכותיים מאוד, בארכיטקטורה זו. בהטמעה מקומית, השינוי הזה הופך GenAI מתוחכם לנגיש גם ליישומים בעלי משאבים מוגבלים. התוצאה: חיסכון משמעותי בתשתית המחשוב הנדרשת לקבלת תוצאות איכותיות.
במהלך 2025 נרשמה פריצת דרך בגזרת המודלים הקטנים וכיום קיימים מודלים זעירים בגודל של 600 מיליון פרמטרים בלבד, המציגים יכולות חשיבה מרשימות ומספקים ביצועים מעולים בשימוש חכם. גודל כזה מאפשר שימוש מקומי יעיל במחשבים אישיים רגילים, בטלפונים חכמים ועוד. מגמה חשובה נוספת שניצניה נראו כבר בסוף 2024 עם השקת מודל o1 של OpenAI, היא המעבר למודלי חשיבה (Reasoning models). מודלים אלו מבצעים תהליך היסק הכולל בקרה עצמית, המאפשרים לספק תוצאות איכותיות ומדויקות יותר.
עוצמתם המפתיעה של מודלים רב–אמצעיים (Multi-Modal)
במקביל, בשנה האחרונה חלה התפתחות גדולה מאוד בנושא המודלים הרב–אמצעיים (Multi-Modal). הם מטפלים בו–זמנית בטקסט, תמונות, וידאו, קול ודיבור. מודלים כאלו משנים מהיסוד את עולם התוכן ותחומים תעשייתיים ומסחריים רבים, כגון בקרת וידאו בזמן-אמת, ניתוח מציאות על-ידי רובוטים ומוצרים בתחום הרפואי. כולם מתאפשרים הודות להתקדמות זו. ההתקדמות המהפכנית במודלים רב אמצעיים היא מדידה. לאורך שנת 2025, הראו מבחני ביצועים כגון MMMU (מבחן ההבנה הרב–משימתי והרב–אמצעי) שנועד להעריך הבנה עמוקה של מודלים על פני מדיות שונות, שיפורים מדהימים. מודלים אלה הפגינו השנה יכולת להסיק ולייצר מידע בתחומים שונים ברמת דיוק שהייתה בעבר בלתי אפשרית.
הם הוכיחו שמודלים בינוניים וקטנים שהופיעו בסוף השנה, מספקים תוצאות טובות יותר ממודלי הענק שיצאו בתחילתה. היכולת לשלב בצורה חלקה נתונים טקסטואליים, חזותיים ושמיעתיים באופן מקומי, מבלי לשלוח מידע רגיש לספק ענן חיצוני, פותחת אפיקים מסחריים חדשים בסביבות מאובטחות כגון מכשור רפואי, רצפת ייצור ומוצרי אבטחת מידע. סקירת השינוי לאורך השנה מציגה התקדמות נוספת: מבחן MMMU משווה את המודלים גם לביצועי מומחים אנושיים. בעוד שבתחילת השנה לא היו מודלים רב–אמצעיים ברמת מומחה אנושי, הרי שבסוף 2025 דורגו שבעה מודלים ברמה שבין מומחים אנושיים בינוניים לגבוהים. התקדמות מהירה זו מרחיבה משמעותית את ההזדמנויות העסקיות.
המודלים החדשים מייצרים תפנית עסקית
להשלכות המסחריות של מעבר זה ל-GenAI מקומי יש משמעות מהפכנית. ראשית, מודל העלות משתנה באופן מהותי: הפעלת מודלים קטנים ואיכותיים בתשתית מקומית או פרטית מפחיתה משמעותית את התלות בשירותי ענן יקרים. שנית, השמירה על הפרטיות והיכולת לציית לרגולציה ולתקנים ארגוניים משתפרות באופן דרסטי. הדבר מאפשר למידע ארגוני או אישי רגיש להישאר במכשיר או בתוך רשת הארגון. יתרון זה חשוב במיוחד לתעשיות מפוקחות, ועשוי לסייע לארגונים להתמודד עם הרגולציה הגוברת, דוגמת חוק ה-AI החדש של האיחוד האירופי.
למגמה הזו של מודלים קטנים וחזקים יש השפעה עמוקה גם על התחום המתפתח במהירות של בינה מלאכותית סוכנית (Agentic AI), שהפכה לטכנולוגיה מכוננת ב-2025. מוצרי Agentic AI מנהלים משימות מורכבות בפיתוח תוכנה, תפעול, אבטחה ורובוטיקה. הם מסתמכים על יכולת המודל להסיק, לתכנן צעדים ולפעול בדיוק גבוה. נקודת ציון חשובה הייתה הפיכת טכנולוגיית MCP לסטנדרט דה–פקטו. הטכנולוגיה הזו הוכרזה על-ידי חברת Anthropic בנובמבר 2024 במטרה להקל על בניית והפעלת סוכנים, ואומצה במוצרים ארגוניים רבים במהלך השנה.
הגיע עידן המודל הקטן והחכם
הודות ליכולות הסקה מתקדמות של צריכת משאבים נמוכה, GenAI מקומי מאיץ פריסת מערכות סוכנים אמינות ועתירות ביצועים, המציגות עלות הפעלה צפויה ואבטחת מידע גבוהה. שינוי זה קריטי במיוחד לתחום פיתוח התוכנה, שהופך יותר ויותר מבוסס Agentic AI כברירת מחדל. העתיד של GenAI טמון ביכולת לספק אינטליגנציה נגישה ויעילה. ההתקדמות ב-2025 ממודלים חסכוניים ועד ליכולות הרב אמצעיות של ארכיטקטורות MoE מוקטנות, מסמנת עתיד שבו בינה מלאכותית איכותית אינה בהכרח שירות מרוחק, אלא כלי רב עוצמה ופרטי, הפועל בדיוק היכן שהמשתמש זקוק לו. עידן המודל הקטן והחכם הגיע, והוא מבטיח יישום עמוק ומשולב יותר של AI בחיינו המסחריים והטכנולוגיים.

אודות חברה:
הייפר גלובל עוסקת במתן פתרונות מחשוב לחברות טכנולוגיות המפתחות מוצרים. החברה מלווה ומיישמת את תהליך הפיכת הרעיון של הלקוח למוצר מוחשי משלב התכנון ועד להגעה לשוק בזמן. החברה פועלת בישראל ובעולם (באמצעות חברות בנות באנגליה ובארה"ב) ומספקת ללקוחותיה פתרונות גלובליים. הפעילות בתחום זה כוללת עבודה משותפת עם גופי הפיתוח של הלקוחות והתאמת פתרונות טכנולוגים מורכבים בהתאם לצרכיהם. בשלבים שלאחר מכן החברה מייצרת ומספקת את המערכות שתכננה לכל רחבי הגלובוס בהתאם לצרכים העסקיים של לקוחותיה.



