אנבידיה היא עדיין "הגורילה הכי חזקה בשכונה"

בתמונה: אנבידיה משיקה מודל חשיבה לרובוטים דמויי-אדם. מקור: אנבידיה]

מאת חנן זכאי, קבוצת CodeValue 

אתמול בערב יצא לדרך GTC 2025, אירוע המפתחים השנתי של NVIDIA. את האירוע פתח מנכ"ל החברה הואנג ג'נסן במצגת סוחפת, שבה פירט על החידושים הקרובים יותר ופחות שיגיעו לשווקים בשנים הקרובות. לאלו מכם שאין זמן לקרוא נסכם את השורה התחתונה NVIDIA היא עדיין "הגורילה הגדולה בשכונה" שלקחה עסק "משעמם" של חומרה והפכה אותו לאימפריה של חדשנות, כשהיא רוכבת על מהפכת ה AI. המעבדים הכי חזקים בכמויות הכי גדולות במהירויות הכי גבוהות ועם שיתופי הפעולה הנוצצים ביותר. אבל בשורה התחתונה לא ראינו דבר שלא ניתן היה לקרוא עליו בתחזיות שנכתבו לפני הכנס ולראיה גם התגובה הפושרת של המניה, שנמצאת בעיצומו של תיקון קטן אבל עדין משקפת ירידה של מעל 13% משוויה בחודש האחרון.

ובכל זאת מה כן היה שם, מעבר לחשיפה של הפלטפורמות החדשות Blackwell Ultra ו Vera Rubin שכמובן ממשיכות להוביל בממדי כוח ויעילות חישוב. אולם מעבר לשיפור יכולות יצירת מודלי LLM וההרצה שלהם, NVIDIA משקיעה משאבים בפיתוח תוכנות שישפרו את היעילות והשימושיות . כשהפתרונות הבולטים מתוכם הם NVIDIA Dynamo, תוכנה בקוד פתוח, נועדה להאיץ ולהרחיב מודלי חשיבה של AI במפעלי AI, ומתפקדת כ"מערכת ההפעלה של מפעל AI". o משפחת מודלי החשיבה הפתוחה Llama Nemotron נועדה לספק למפתחים וארגונים בסיס מוכן לעסקים ליצירת סוכני AI מתקדמים ו NVIDIA Isaac GR00T N1, מודל בסיס פתוח לרובוטים דמויי אדם,.

מעניין גם היה לראות דרך שיתופי הפעולה שהוכרזו איך מסמנת NVIDIA לשווקים שונים את כיווני החדשנות. כשהמעניינים בשת"פים אלו הם עם ג'נרל מוטורס (GM): GM מאמצת את AI, סימולציה ומחשוב מואץ של NVIDIA כדי לפתח רכבים, מפעלים ורובוטים מהדור הבא . NVIDIA הכריזה גם על NVIDIA Halos, מערכת בטיחות מקיפה לכלי רכב אוטונומיים, כחלק משיתוף פעולה זה. האורות במשרדים של טסלה ומובילאיי, ועוד כמה ענקיות, נשארו אתמול דלוקים עד מאוחר.

חנו זכאי. יח"צ

שיתוף פעולה מענין נוסף הוא עם גוגל DeepMind ודיסני ריסרץ' (Disney Research): NVIDIA בפיתוח מנוע הפיזיקה בקוד פתוח Newton לסימולציית רובוטיקה. כנראה שלכל מי שיש מחשבות ורעיונות על רובוטים שפוגעים באנשים בפארק WESTWORLD, כנראה יחושו פחות מאויימים כשמיקי מאוס יפנה אליהם וישאל לשלומם בעברית.

ואי אפשר לסכם ארוע כזה בלי להתייחס ל"טראומת" DEEPSEEK R3    הסיני שזעזע את עולם ה AI  כמו כל איש מכירות טוב, ג'נסן הדגיש שיעילות אימון ויצירת מודלים טובות יותר יגדילו את כמות השימושים ובהתאם גם את הדרישה למוצרי החברה, שבבסיסה היא נכונה, אבל כמו איש מכירות טוב הוא גם יודע שהקרקע שהוא דורך עליה עדין די "בוצית" ורחוקה מלהיות בטוחה. 

"ב-2025 נראה תנופה בתחום סוכני ה-AI"

[בתמונה: אופיר זמיר, אנבידיה ישראל. יח"צ]

בשבוע הבא, בין ה-17 ל-21 במרץ, ייערך בסן חוזה, קליפורניה, כנס הבינה המלאכותית GTC 2025 של אנבידיה, בהשתתפות כ-900 חברות, ביניהן גם חברות ישראליות רבות. גולת הכותרת, מבחינה תקשורתית, יהיה נאומו המרכזי (keynote) של מייסד ומנכ"ל החברה, ג'נסן הואנג, ביום שלישי בערב שעון ישראל.

יהיה מעניין לראות כיצד משתקף בכנס שלב המעבר שבו מצוי בימים אלה עולם הבינה המלאכותית. אם עד כה זירת ה-AI היתה שמורה בעיקר לחברות הענק, כמו OpenAI, מטא, גוגל ו-xAI, שפיתחו את מודלי הייסוד (foundation models) הגדולים, כעת המיקוד עובר לנגזרות האפליקטיביות של המודלים הגדולים הללו, כדוגמת תחום סוכני ה-AI.

לצד פעילות המו"פ של אנבידיה בישראל, המתבססת בעיקר על חברת מלאנוקס (Mellanox) שנרכשה ב-2019, פועלת כאן גם שלוחה שתפקידה לסייע ללקוחות של אנבידיה בישראל למקסם את השימוש בכלי החומרה והתוכנה שלה. מי שעומד בראש הקבוצה הזו הוא אופיר זמיר, דירקטור בכיר וראש קבוצת ארכיטקטורת AI באנבידיה ישראל. "המרכז שלנו כולל ארכיטקטים ומדעני נתונים ואנחנו עובדים עם חברות , סטארט-אפים וגופי אקדמיה. אנבידיה מציעה כיום את כל החבילה [full stack] בתחום ה-AI ואנחנו מסייעים לחברות כאן למקסם את הכלים הללו לפיתוח שלהן".

הטלטלה של דיפסיק

בחודשים האחרונים, התרחשו לא מעט דרמות בעולם ה-AI. בראשן, חברת דיפסיק (DeepSeek) הסינית – שם בלתי מוכר עד היום – אשר חשפה את מודל החשיבה R1, שאינו נופל בביצועיו מהמודלים המתחרים בשוק, אך אומן באמצעות עשירית מכוחות המחשוב. החשש היה כי ענקיות ה-AI ישקלו מחדש את השקעותיהן העצומות בתשתיות AI, דבר שיפחית את הביקוש לשבבי אנבידיה. מי שניסה בשבועות האחרונים לצנן את תבהלת דיפסיק היה מייסד ומנכ"ל אנבידיה הואנג, שטען שהשוק לא הבין נכון את ההשלכות של המודל של דיפסיק. "המודל של דיפסיק מלהיב במיוחד. השוק מיהר להסיק שתחום ה-AI גמור, שאין צורך במחשוב. להיפך. זה רק יאיץ את אימוץ ה-AI".

זמיר מוסיף כי מודלים כמו דיפסיק אמנם מפגינים התייעלות בשלב אימון המודל, אך זהו רק אחד השלבים שבהן יש צורך במחשוב. "ישנם שלוש רמות שמניעות את הביקוש בשוק ה-AI. עד היום התמקדו באימון המודלים הגדולים: ככל שיש לך יותר מחשוב ויותר דאטה, תוכל לייצר LLM חכם יותר. אבל זה לא המקום היחיד שבו צריך מחשוב. יש את השלב שלאחר האימון (post training), שבו אתה לוקח מודל גדול וממקצע אותו בתחום ידע ספציפי, כמו פיננסים, סייבר או פיתוח תרופות. המישור השלישי הוא מודלי החשיבה, כמו O3 של OpenAI ו-R1 של דיפסיק. אלה הם מודלים שמשקיעים יותר מאמצים בשלב התשובה. הם מפרקים את הבעיה לצעדים ושלבים, יוצרים 'שרשרת מחשבות' – וזה מצריך הרבה יותר עיבוד.

זמיר מתייחס למהפכה הבאה בעולם ה-AI: סוכני ה-AI. אם צ'אט-בוטים כמו ChatGPT יודעים להשיב על שאלות או לפתור בעיות תיאורטיות, סוכני AI יודעים לעשות דברים בעולם הדיגיטלי, כמו לחפש ברשת, להזמין לנו כרטיסי טיסה או לבצע פעולות אדמיניסטרטיביות במערכות המידע של הארגון. באחרונה, חשפה גוגל את ה-Co-Scientist, סוכן מדע שמסייע לחוקרים לבצע מחקרים מדעיים ביעילות מרשימה. "השנה אנחנו נראה תנופה בתחום סוכני ה-AI. הם יציעו יכולות חדשות של אוטומציה בתחומים רבים. זהו עוד יישום שמצריך משאבי מחשוב משמעותיים", העריך זמיר.

ישראל מובילה ב-LLMOps

אנבידיה מסייעת להפרות את האקוסיסטם המקומי באמצעות תוכנית האקסלרציה Inception, שמספקת בין היתר לסטארט-אפים גישה לסביבות הפיתוח שלה. רק בשבוע שעבר נחשף סטארט-אפ חדש בשם Alta, שהשתייך לאקסלרטור ופיתח סוכני AI לעולם השיווק והמכירות. "אם עד לא מכבר, חברות בתחום היו צריכות להקים חוות שרתים ולפתח מודל גדול על בסיס דאטה עצום, הרי שהיום לא צריך להתחיל מאפס, כלומר משלב ה-pre-traingn. חברות מבססות את הפיתוח שלהן על מודל ייסוד קיים, שחלקם זמינים בקוד פתוח, ופשוט מבצעים תהליך של fine-tuning לתחום שאליו מיועד היישום, כמו סייבר, פיננסים או טלקום".

זמיר מצביע על נישה חדשה שמתפתחת בקרב הסטארט-אפים בישראל. "ההייטק הישראלי תמיד הצטיין בתחומי ב-MLOPS, כלומר בפיתוח כלים למפתחים. לאנבידיה היו אפילו רכישות בישראל בתחום זה, למשל של החברות Deci ו-Run:ai. כעת ניתן לזהות מעבר לתחום החדש של LLMOps, כלומר כלים שמפשטים פיתוח של מודלי AI ומאפשרים לעשות ניסויים וסקיילינג, וב-GTC הקרוב יהיו מספר חברות ישראליות בתחום הזה".