מרכז נתונים עם 100,000 מעבדי אנבידיה

חברת האנרגיה הנורבגית Aker ASA הודיעה על הקמת מרכז נתונים תעשייתי חדש לצורכי בינה מלאכותית, בשיתוף עם חברת Nscale Global Holdings ו-OpenAI. המיזם, שיוקם בצפון נורבגיה תחת השם Stargate Norway, יהפוך עד סוף 2026 לאחד ממתקני המחשוב הגדולים באירופה. לפי ההודעה, המתקן יופעל כולו באמצעות אנרגיה הידרואלקטרית מתחדשת, ויכיל כ-100,000 מעבדים של Nvidia. ההשקעה בשלב הראשון נאמדת בכמיליארד דולר, אולם התכונית כוללת אופציה להכפלת ההשקעה עד פי עשרה. השותפות בין Aker ל-Nscale תתבסס על חלוקה שווה, כאשר OpenAI תהיה בתחיל משתמש מרכזי, ובשלב מאוחר יותר ייתכן שתצטרף גם כבעלת מניות.

המתקן יפעל בהספק של 230 מגה-וואט, עם תכנון להרחבה נוספת של 290 מגה-וואט. הוא יתבסס על טכנולוגיות קישוריות מהדור החדש כמו NVLink ורכיבי GB300 Superchips ASA. הקמת המתקן היא מהלך אסטרטגי שעשוי לסמן נקודת מפנה עבור אירופה, שבמשך שנים נותרה מאחור ביחס לארצות הברית וסין בכל הנוגע לתשתיות מחשוב בקנה מידה תעשייתי. בעוד שבארה"ב מוקמים מרכזי עיבוד עצומים על ידי ענקיות כמו מיקרוסופט וגוגל, מדינות אירופה התמודדו עם חסמים של עלויות אנרגיה גבוהות, רגולציה מחמירה ופיצול פוליטי.

תאגיד Aker הנורבגי פועל בתחומי התעשייה, האנרגיה והטכנולוגיה, ומשקיע בשנים האחרונות בתחום התשתיות הדיגיטליות. Nscale Global Holdings היא חברה אמריקאית המתמחה בפיתוח והקמת מרכזי נתונים עתירי ביצועים (HPC), בדגש על יישומי בינה מלאכותית בקנה מידה גדול. אף שנורבגיה איננה חברה מן המניין באיחוד האירופי, היא מציעה מענה לחסמים אלו באמצעות אנרגיה מתחדשת זולה, אקלים קר שמתאים לקירור טבעי, ותמיכה ממשלתית במיזמים טכנולוגיים. המהלך משתלב בשאיפה של האיחוד האירופי להשיג "ריבונות דיגיטלית". כלומר, להקים תשתיות AI עצמאיות בתוך אירופה, לצמצם את התלות בשירותים חיצוניים והבטחת נגישות ליכולות חישוב מתקדמות עבור מוסדות מחקר, חברות מקומיות וממשלות. Stargate Norway עשוי להיות הראשון בסדרה של מתקנים דומים, שיחזקו את מעמד היבשת בתחרות העולמית על השליטה בטכנולוגיות בינה מלאכותית.

דיפלומטיה ושבבים: מנכ"ל אנבידיה מתווך בין המעצמות

כמו בביקור של אישיות ממלכתית, ביקורו המתוקשר בימים אלה בסין של מנכ"ל אנבידיה, ג'נסן הואנג, משלב בין עסקים לפוליטיקה, דיפלומטיה ותרבות. זהו ביקורו השלישי של הואנג בסין בשנתיים האחרונות, והוא מתרחש בדיוק כשהמתח הטכנולוגי בין המעצמות רושם תפנית מפתיעה. במהלך ביקורו השתתף הואנג בכנס אקספו בנושא שרשרת האספקה, ערך פגישות עם בכירים בתעשיית הטכנולוגיה הסינית, ואף נפגש עם נציגים ממשלתיים, בהם סגן שר התעשייה והטכנולוגיה.

ספק אם יש כיום חברה בודדת המשפיעה כל כך על מאזן הכוחות הטכנולוגי בעולם, כמו אנבידיה. החברה מספקת את לב-לבן של תשתיות ה-AI: השבבים שמאפשרים למודלים לרוץ, ללמד את עצמם, לייצר תובנות – ובעתיד, אולי גם לקבל החלטות בשם ממשלות.במסיבת עיתונאים שנערכה בבייג'ינג הוא שיבח בגלוי את ההתקדמות של סין בתחום הבינה המלאכותית: "מודלי ה-AI הסיניים הגיעו לרמה עולמית. זהו הישג יוצא דופן המעיד על עומק ההשקעה, הכישרון והחזון שקיימים כאן," אמר, והוסיף: "AI הוא לא משאב פרטי. זו מהפכה שיכולה לפרוח רק אם תהיה נגישה ומשותפת."

מקונפליקט לממלכתיות: שינוי האווירה בין הביקורים

הביקור הנוכחי של הואנג מהדהד במיוחד על רקע הביקור הקודם שלו בסין, באפריל 2025 – ביקור שנערך כמעט במחשכים. אז, ברקע הסלמה חדה במלחמת הסחר בין סין לארצות הברית, הגיע הואנג לבייג'ינג כדי לנהל שיחות סגורות עם גורמים בכירים, בניסיון לאפשר לאנבידיה להמשיך ולמכור שבבים "מותאמים" לשוק הסיני מבלי לעבור על ההגבלות האמריקאיות.

הביקור ההוא התקיים בזמן שמשרד המסחר האמריקאי החמיר את הרגולציה, והקונגרס פתח בבדיקה נגד החברה בחשד לעקיפת מגבלות היצוא. הסיקור הסיני היה רופף, היחסים היו מתוחים, וההישגים – זמניים. כעת, שלושה חודשים בלבד לאחר מכן, המעמד שונה בתכלית: ביקור ממלכתי, השתתפות בכנס רשמי, מסיבת עיתונאים פתוחה, וחיבוק תקשורתי. Global Times, ביטאון המזוהה עם המשטר, פרסם פרשנות שכותרתה: "ג'נסן הואנג מביא עמו רוח של גישור: לא בין שבבים – אלא בין עולמות".

צעד קדימה בוושינגטון, חצי צעד בבייג'ינג

בשבועות שקדמו לביקור, הממשל האמריקאי אותת על נכונות לחדש חלק מהרישיונות שאיפשרו לאנבידיה למכור שבבי AI מותאמים לסין. מדובר בעיקר בשבב H20 – גרסה מוחלשת של שבבי הדגל – שתוכננה במיוחד לעמוד בתנאי הרגולציה, אך עדיין להציע ביצועים גבוהים לשוק הסיני. מעט לאחר מכן, סין השיבה במחווה מפתיעה: הרגולטור הסיני אישר את המיזוג בין Cadence ל-Ansys – שתי חברות אמריקאיות קריטיות לפיתוח שבבים. מדובר באות נדיר של שיתוף פעולה, דווקא בעידן של חשדנות הדדית.

האינטרס הכלכלי: שוק שהלך והתרחק

מעבר לגשר הדיפלומטי, לביקור של הואנג יש גם תמריץ כלכלי מובהק ואסטרטגי עבור ענקית המעבדים. אנבידיה היא אולי החברה שנפגעה הכי קשה ממדיניות מגבלות הייצוא של הממשל האמריקאי כלפי סין בשנים האחרונות. שורת האיסורים שהחלו ב־2022 מנעו מהחברה למכור את שבביה המתקדמים ביותר – בראשם H100 ו-A100 – לשוק הסיני, שהיה בעבר הלקוח השני בגודלו של החברה אחרי ארה"ב. לפי הערכות אנליסטים, ההגבלות גרעו מיליארדי דולרים מהכנסות החברה.

בתוך החלל שנפער, קמו מתחרות מקומיות, ובראשן Huawei שפיתחה בשנה האחרונה מעבדי AI משלה, כדוגמת Ascend 910B, והחלה לזכות באמון גופי ממשל וחברות ענן סיניות. עבור אנבידיה, מדובר באיום כפול: גם איבוד שוק חיוני, וגם היווצרות תשתית אלטרנטיבית בשוק שבו שלטה כמעט לבדה. המאמצים הנוכחיים למכור לסין גרסאות "מותאמות רגולציה" של שבבים, כמו H20, נועדו לא רק לעקוף מגבלות – אלא לשמור על נוכחות, בטרם תתקבע חלופה אסייתית מלאה.

לא רק יצרנית שבבים, אלא תשתית לאומית

על רקע זה, ביקורו של הואנג בבייג'ינג מתפרש לא רק כמהלך עסקי – אלא כמעט כמהלך מדיני. הוא מגיע אליו לאחר פגישה שקיים מוקדם יותר החודש עם נשיא ארה"ב, דונלד טראמפ, בבית הלבן. בין השניים שוררים יחסים חמים: טראמפ לא הסתיר בעבר את הערכתו לאנבידיה, ואף קידם את החברה כמודל לחדשנות אמריקאית. הקשר הזה בא לידי ביטוי גם בביקורו המתוקשר של טראמפ באבו דאבי ובריאד באביב האחרון – ביקור שבו התלווה אליו גם ג'נסן הואנג, כאורח כבוד. לפי גורמים במשלחת, עצם נוכחותו של מנכ"ל אנבידיה שימשה כאות פומבי לכך שארה"ב פותחת בפני המפרציות את שערי תשתיות ה-AI.

במילים אחרות, שבבי אנבידיה הפכו לאתנן גיאו-טכנולוגי שמעניקה וושינגטון לבעלות בריתה, בתמורה להתחייבות להשקעה, נורמליזציה וגישה למשאבים. לפי דיווחים בתקשורת, במהלך שיחה בין טראמפ להואנג בבית הלבן דנו השניים גם בהשלכות של מגבלות הייצוא מול סין, ואולי אף תיאמו מראש את גבולות המהלך מול בייג'ינג. דבר המחזק את התפיסה שהואנג לא רק עוסק במכירת שבבים, אלא גם בתיווך בין מעצמות.

בין טייוואן לאמריקה – האיש שבא מהאמצע

ג'נסן הואנג הפך לדמות המסמלת את אפשרויות ואת יתרונות הגישור בין המזרח למערב. הוא נולד ב־1963 בטייוואן, ובגיל תשע היגר עם משפחתו לארה"ב. הילד הקטן שהחל את דרכו כשוטף כלים בבית מלון באיידהו, ייסד את אנבידיה והפך למנכ"ל האגדי של החברה שבעשור האחרון היא לא רק חלוצה טכנולוגית, אלא עוגן אסטרטגי של ממש.

בתוך דמותו משתקפים קווי המפגש בין תרבויות, בין שפות ובין תפיסות עולם שונות. הוא מדבר אנגלית שוטפת וסינית מדוברת, מכיר את שוקי המערב ואת רגישויות המזרח, ולפעמים נדמה שהוא עצמו מהווה את המעגל האחד שמכיל שני קטבים. בכנס שנערך בשנגחאי, כשהוא לבוש בחליפת טאנג מסורתית, הוא פנה אל הקהל בשפה המקומית ואמר: "אנחנו לא רק משתפים פעולה – אנחנו לומדים זה מזה. ההצלחה של AI לא תבוא ממונופול, אלא מהפרייה הדדית".

אנבידיה כמעצמה טכנולוגית-פוליטית

בעידן שבו תשתיות בינה מלאכותית הן משאב לאומי, אנבידיה – באמצעות דאטה סנטרים, שיתופי פעולה ותכנון שבבים – הופכת לשחקן גיאופוליטי. אין זה מקרה שהיא שותפה להקמת מרכזי AI בכל העולם: בערב הסעודית, הודו, יפן ואירופה. לכל מדינה חשובה היום הגישה לחומרה שתשפיע על הבינה – ואיתה, על העתיד.

סימני הפשרה: סין מאשרת את מיזוג סינופסיס-אנסיס, אנבידיה חוזרת למכור בסין

רשות השוק הממשלתית של סין (SAMR) הודיעה אתמול (ב') על מתן אישור מותנה לחברת סינופסיס (Synopsys) האמריקאית לרכישת חברת Ansys, במסגרת עסקה בשווי של כ‑35 מיליארד דולר שנחתמה לפני יותר משנה. האישור מצד הרגולטור הסיני מסיר את המכשול האחרון להשלמת העסקה, וזאת לאחר שהרשויות בארצות הברית, בריטניה והאיחוד האירופי כבר נתנו אור ירוק.

את האישור מצד הרגולטור הסיני לא ניתן לנתק מההקשר הגיאו-פוליטי בין שתי המעצמות. האישור המותנה ניתן לאחר שארצות הברית הקלה בתחילת החודש את הגבלות היצוא על תוכנות לתכנון שבבים, הגבלות שהעמידו בספק את המשך פעילותן של ספקיות כמו סינופסיס וקיידנס בסין.

כאמור, האישור שניתן מותנה במספר דרישות מצד הרשות הסינית לסינופסיס, ובכלל זה שמירה על חוזים קיימים מול לקוחות סיניים, כולל תנאי מחיר ושירות, המשך אספקת מוצרי EDA (תכנון אוטומציה אלקטרונית) לשוק הסיני באופן הוגן וללא הפליה, וכן קיום הסכמי תאימות בין המערכות ושימורם על פי בקשה מצד לקוחות. הרשות הסינית דרשה גם ביצוע מינימלי של פירוקים (divestitures), איסור על חבילה מאולצת של מוצרים, ודגש על תאימות לתוכנות מתחרות כמו קיידנס.

הסיניות מסתערות על ה-H20

הלילה (בין שני לשלישי), עדכנה אנבידיה כי היא הגישה בקשה לקבלת רישיון עבור מכירת מעבדי NVIDIA H20 בסין, וכי בממשל האמריקאי עדכנו כי הרישיון יינתן.

מייסד ומנכ"ל אנבידיה, ג'נסן הואנג, מבקר בימים אלה בסין, וצפוי לנכוח ביריד טכנולוגי חשוב ולקיים מסיבת עיתונאים. זהו הביקור השני השנה של הואנג בסין, ונראה כי הוא ממצב את עצמו כמתווך חשוב בין המדינות וכצינור להעברת מסרים בין המנהיגים.

הואנג גם עדכן את לקוחות החברה כי אנבידיה הגישה בקשות לרישוי על מנת לחזור ולמכור את המעבד הגרפי NVIDIA H20. הממשל האמריקאי עדכן את אנבידיה כי הרישיונות יינתנו, והחברה מקווה להתחיל במשלוחים בקרוב. ברויטרס דווח היום כי ישנו ביקוש עצום בקרב ספקיות הענן וחברות ה-AI הסיניות למעבדי H20 של אנבידיה.

לבסוף, חשף הואנג מעבד גרפי חדש מסדרת NVIDIA RTX PRO העומד באופן מלא בדרישות הרגולציה ו"מתאים במיוחד לבינה מלאכותית של תאומים דיגיטליים עבור מפעלים חכמים ולוגיסטיקה".

Dell סיפקה שרתים ראשונים מבוססי Blackwell Ultra

חברת Dell הודיעה השבוע כי השלימה את אספקת מערכת השרתים GB300 NVL72 הראשונה בעולם, המבוססת על מעבדי העל החדשים של אנבידיה מדגם Blackwell Ultra. המערכת נמסרה לחברת CoreWeave, אחת השחקניות הבולטות כיום בעולם הענן בהיותה ספקית של שירותי עיבוד ייעודיים לבינה מלאכותית. זהו ציון דרך עבור קורוויב, שמקדימה בכך את ענקיות הענן כמו גוגל, אמזון ומיקרוסופט.

המערכת שנמסרה כוללת 72 יחידות GPU מסוג Blackwell Ultra ו־36 מעבדי Grace ARM, משולבים בארון שרתים אחוד (Rack-Scale) מדגם PowerEdge XE9712, המיועד לקירור נוזלי. מדובר בארכיטקטורה עתירת ביצועים, המספקת מעל 1.1 אקזאפלופס (ExaFLOPS) לעיבוד הסקה (Inference) מדויק ומהיר בפורמט FP4 – ומאפשרת מהירויות תגובה חסרות תקדים בהרצת מודלים גנרטיביים.

זהו גם ביטוי נוסף לשיתוף פעולה ההדוק בין דל לאנבידיה, שצבר תאוצה בשנתיים האחרונות. דל, כספקית חומרה ותשתיות IT , לקחה על עצמה את האתגר לבנות מערכת אינטגרטיבית שלמה הכוללת GPU, CPU, אחסון, תקשורת וקירור – ולספק אותה ללקוח כמוצר שלם, מותאם ונבדק מראש (Turnkey System). המערכת מבוססת על רשתות NVLink מהדור החמישי וחיבורים פנימיים בקצב של עד 130TB/s – שמנצלים עד תום את פלטפורמת Blackwell של אנבידיה.

קורוויב מצידה, ממשיכה לבסס את מעמדה כשחקנית מפתח בענן ה-AI. החברה, שהוקמה ב־2017, מפעילה עשרות מרכזי נתונים המוקדשים ל-GPUs בלבד, ומספקת שירותים לסטארטאפים בתחום מודלים גנרטיביים, תעשיית הסרטים, ביוטכנולוגיה, מסחר כמותי ועוד. היא נחשבת כיום לצרכנית GPU הגדולה ביותר מחוץ לענקיות הטכנולוגיה – והייתה הראשונה להתחייב לרכישת מערכות מבוססות GB200 ו-GB300 בקנה מידה רחב. בקורוויב מדגישים כי המערכת החדשה מאפשרת מהירות תגובה גבוהה פי 10, יעילות אנרגטית טובה פי 5, וביצועים גבוהים פי 50 בהרצת מודלים לעומת הדור הקודם – תוצאה ישירה של הארכיטקטורה הריכוזית והקירור המתקדם.

[מקור תמונה: Dell]

 

הכנסות חטיבת הקישוריות של אנבידיה זינקו ל-5 מיליארד דולר

חברת אנבידיה (Nvidia) דיווחה הלילה על הכנסות שיא בפעם השביעית ברציפות. ככל שפעילותה בתחום מרכזי הנתונים מתרחבת, כך גם גדלות ההכנסות ממוצרי הקישוריות, המפותחים במרכז של אנבידיה בישראל, על בסיס הטכנולוגיה של מלאנוקס (Mellanox). ברבעון הראשון הסתכמו ההכנסות מחטיבת הקישוריות ב-5 מיליארד דולר – גידול של 63% לעומת הרבעון הקודם. יש לציין כי מדובר בגידול גבוה משמעותית מהגידול הרבעוני בכלל הכנסות החברה, שצמחו ב-12% ל-44.1 מיליארד דולר.

אפשר לחלק את חטיבת הקישוריות של אנבידיה לשני חלקים עיקריים: רכיבי הקישוריות ממשפחת NVLink, המחברים בין מעבדי ה-GPU באותו מארז או ארון שרתים, ורכיבי קישוריות מבוססי הפרוטוקולים איתרנט ואינפיניבנד, המחברים בין שרתים בתוך מרכז הנתונים. כיום, שתי הקטגוריות הללו מפותחות בישראל. ההכנסות ברבעון הראשון ממכירות הדור החמישי של ה-NVLink, שפותח כחלק מפלטפורמת Blackwell, הסתכמו במיליארד דולר. הגידול הזה משקף את הביקוש האדיר לשבב הבלאקוול, שמכירותיו היוו לא פחות מ-70% ממכירותיה של אנבידיה בתחום מרכזי הנתונים.

גם מתגי האיתרנט Spectrum-X, שפותחו עוד במסגרת מלאנוקס, זוכים לביקוש מוגבר על רקע הגידול בנפח של מרכזי הנתונים. לדברי אנבידיה, ההכנסות ממכירת המתגים צפויות להגיע השנה ל-8 מיליארד דולר. "האימוץ בקרב חברות הענן והאינטרנט, כדוגמת מיקרוסופט, CoreWeave, אורקל ו-xAI, הינו גדול. ברבעון האחרון הצטרפו גוגל ומטא לרשימת הלקוחות של המתגים הללו", סיפר מייסד ומנכ"ל החברה, ג'נסן הואנג, בשיחת הוועידה לאחר פרסום הדו"ח.

הואנג תיאר מירוץ חימוש של ממש בקרב ענקיות הטכנולוגיה. לדבריו, חברות הענן הגדולות (hyper-scalers) פורסות בממוצע מדי שבוע כ-1,000 ארונות שרתים חדשים מדגם NVL72, שכל אחד מהם כולל 72 מעבדי בלאקוול – כלומר כ-72 אלף מעבדי בלאקוול נוספים, בכל שבוע. מיקרוסופט, למשל, צפויה לפרוס מאות אלפי מעבדי בלאקוול, בעיקר לטובת צרכי העיבוד של OpenAI. החברה כבר החלה לשלוח דוגמיות של הדגם Blackwell Ultra, שצפוי להכיל כ-50% יותר זיכרון (HBM) וכך לשפר את יעילות ההסקה (inference). באחרונה השיקה אנבידיה מתגי איתרנט ואינפיניבנד המבוססים על טכנולוגיית סיליקון פוטוניקס, שגם כן פותחו בישראל וצפויים לתרום לחיסכון באנרגיה בתפעול מרכזי נתונים.

מעבדי Xeon 6 במערכות ה-AI של אנבידיה

חברת אינטל הכריזה בסוף השבוע על שלושה דגמים חדשים של מעבדי משפחת Xeon 6, המבוססים על ליבות ביצועים (P-Cores). היא מסרה שאחד מהם, המעבד Xeon 6776P נבחר על-ידי חברת אנבידיה לשמש כמעבד הראשי (head node) במערכת הבינה המלאכותית החדשה שלה, DGX B300, המבוססת על ארכיטקטורת Blackwell. המערכת מיועדת להתמודד עם עומסי עבודה כבדים, כמו אימון והסקת מודלים גדולים.

המעבדים החדשים כוללים את טכנולוגיית Priority Core Turbo – PCT המאפשרת להאיץ את מהירות העבודה של 8 ליבות נבחרות, ממהרות שעון של 3.9 גה"ץ, למהירות שעון של 4.6 גה"ץ. ההאצה מתבצעת במועדים נבחרים, כמו למשל ברגעים הקריטיים של העבודה דוגמת תהליך הכנת הנתונים (data preprocessing), טעינת מודלים וניהול תורי משימותבמערכות בינה מלאכותית, כאשר CPU לא מספיק מהיר, הוא פשוט ממתין ולמעשה לא עושה דבר. ההאצה נועדה למנוע את תופעת ההשהיה הזו.

"תפקידו של מעבד ה-Xeon כ-head node הוא קריטי במערכות AI, אמרה קרין אייבשיץ סגל, סגנית נשיא תאגידית ומנהלת זמנית של קבוצת מרכזי הנתונים באינטל.  בנוסף לטכנולוגיית PCT, המעבדים כוללים עד 128 ליבות P-Core, תמיכה בזיכרון מהיר העובד בקצב של עד 5,200MT/s, כולל MRDIMM, RDIMM ו-CXL, הגדלה של 20% במספר נתיבי ה-PCIe ותמיכה בהאצת חומרה לחישובי מטריצות (AMX).

אנבידיה מגדילה את מרכז המו"פ בתל אביב

בתמונה למעלה: עמית קריג, סגן נשיא בכיר ב-NVIDIA ומנהל מרכז הפיתוח של אנבידיה בישראל

חברת אנבידיה מרחיבה את משרדיה בתל אביב, ומוסיפה אליהם 10 קומות נוספות במגדל רובינשטיין בתל אביב, בנוסף ל-8 הקומות שהיא תופסת כיום. החברה מסרה שלאחר השלמת ההתרחבות, ישתרעו משרדיה על שטח של כ-22,000 מ"ר. במרכז המורחב יהיו כ-1,200 פינות עבודה לצד מעבדות מחקר בינה מלאכותית וחלל כנסים ואירועים. במקום יוקם מתחם הסעדה שיופעל על-ידי קבוצת מחניודה בהובלת השף אסף גרניט. האתר יחל לפעול במתכונת מלאה עד סוף השנה, ויתמוך בהרחבת פעילות המחקר והפיתוח של אנבידיה בישראל.

חברת אנבידיה היא אחת המעסיקות הפרטיות הגדולות במשק. מאז רכשה את חברת מלאנוקס בשנת 2020, היא הכפילה את מספר עובדיה בישראל וכיום היא מעסיקה כ-4,500 עובדים בתל-אביב, יקנעם, תל-חי, מבוא כרמל, רעננה ובאר שבע. מרכז הפעילות הגדול ביותר הוא מתקן מלאנוקס לשעבר ביוקנעם. המרכז בתל אביב הוא השני בגודלו. החברה מסרה שהיא מגייסת עובדים וכעת יש לה כמה מאות משרות פתוחות במשרדיה ביקנעם, תל אביב, רעננה, באר שבע ותל חי.

"אנחנו ממשיכים להעמיק את ההשקעה שלנו בישראל, מתוך אמונה בהון האנושי וביכולת שלו להוביל חדשנות עולמית", סגן נשיא בכיר להנדסת תוכנה ומנהל מרכז המחקר והפיתוח של אנבידיה בישראל, עמית קריג. "הרחבת המרכז בתל אביב תאפשר לנו לגייס עובדים נוספים ולקדם בישראל חדשנות בתחום הבינה המלאכותית".

בתוך משרדי אנבידיה בתל אביב. צילום: אנבידיה
בתוך משרדי אנבידיה בתל אביב. צילום: אנבידיה

 

סעודיה ו-AMD מקימות חוות AI בהשקעה של 10 מיליארד דולר

בתמונה למעלה: מנכ"לית AMD ליסה סו, ונסיך הכתר הסעודי מוחמד בין סלמן

קרן ההשקעות הלאומית של סעודיה, Public Investment Fund – PIF, הכריזה על הקמתה של חברת שירותי הבינה המלאכותית החדשה, HUMAIN, אשר תספק תשתיות חומרה ותוכנה במזרח התיכון ובכל העולם. החברה תקים מרכזי עיבוד ליישומי AI במספר אתרים בעולם, שבהם ירוץ המודל הלשוני ALLAM, שהוא מודל ה-LLM הראשון בעולם המותאם במיוחד לשפה הערבית ולתרבות הערבית. בין השאר, הוא מתוכנן להבנת דיאלקטים ערביים שונים, להתייחס לערכים תרבותיים מקומיים ולהכיר את הייחוד של קהילות ערביות שונות.

הקרן הוקמה על-ידי ממשלת בסעודיה כבר בשנת 1971 במטרה לבצע השקעות בסעודיה ובעולם. בשנת 2015 הוגדרו מטרותיה מחדש והיא קיבלה תפקיד מרכזי בקידום אסטרטגיית Vision 2030, שנועדה לבנות תשתיות שיבטיחו את כלכלת סעודיה ללא תלות בנפט. מדובר בפרוייקט מדינתי המנוהל על-ידי בית המלוכה. כיום יו"ר הקרן הוא יורש העצר וראש הממשלה, הנסיך מוחמד בין סלמן בין עבדול-עזיז אל סעוד. מיד לאחר ההכרזה על השקת החברה, הודיעה AMD על חתימת הסכם עם HUMAIN להקמת חוות שרתים ליישומי בינה מלאכותית בהשקעה כוללת של כ-10 מיליארד דולר.

מדובר בחוות שרתים אשר מחשבי ה-AI שבתוכה יגיעו להספק כולל של 500 מגה-ואט בתוך 5 שנים. היא מתוכננת לספק שירותים כבר ב-2026, ותסתמך על אנרגיה שתספק מדינת סעודיה. תשתית המחשבים של החווה תתבסס כולה על מעבדי ותוכנות AMD, בהם מעבדי ה-GPU ממשפחות AMD Instinct ו-AMD EPYC, מאיצי התקשורת AMD Pensando, מעבדי AMD Ryzen וסביבת התוכנה AMD ROCm. במקביל, החברה מתכננת להקים חוות נוספות בעולם, כולל בארה"ב.

גם אנבידיה מצטרפת לפרוייקט

לא נמסרו פרטים על המבנה העסקי של חברת HUMAIN, אולם מנכ"לית AMD, ד"ר ליסה סו, אמרה שהשותפות כוללת השקעה של AMD במיזם הזה: "ההשקעה שלנו ב-HUMAIN היא אבן-דרך בקידום תשתיות AI גלובליות". במקביל להכרזה הזו, הודיעה חברת אנבידיה (NVIDIA) שהתקיימה פגישה בין הנסיך מוחמד בין סלמן ובין מנכ"ל אנבידיה ג'נסן הואנג, אשר התלווה לנשיא טראמפ בביקורו בסעודיה. השניים סיכמו על השתתפותה של אנבידיה בפרוייקט ה-AI של HUMAIN.

בשלב הראשון, החברה תרכוש 18,000 מחשבי-על מסוג GB300 Grace Blackwell אשר יקושרו ביניהם ברשת InfiniBand מהירה. חברת HUMAIN גם תתקין את ענן NVIDIA Omniverse הראשון בסעודיה, כדי לספק יכולות תאומים דיגיטליים (digital twins) של אובייקטים פיסיים. אנבידיה גם חתמה על הסכם עם רשות המידע והבינה מלאכותית הסעודית (SDAIA) לפריסה של 5,000 מעבדי GPU ממשפחת Blackwell, לשימוש על-ידי רשויות מקומיות ומשרדים ממשלתיים.

אנבידיה ישראל פיתחה טכנולוגיית אבטחה ל"מפעלי AI"

חברת אנבידיה תכריז מחר על מערכת אבטחה אשר פותחה במרכז הפיתוח של החברה בישראל, המיועדת לספק הגנה על תשתיות בינה מלאכותית מאסיביות, שקיבלו את הכינוי AI Factories. הכוונה למרכזי נתונים במימדים עצומים, המנתחים כמויות גדולות של מידע במטרה להפיק ממנו תובנות בעלות ערך. מערכת האבטחה החדשה, NVIDIA DOCA Argus, רצה על-גבי מעבד הסטת העומסים הישראלי NVIDIA BlueField וסביבת התוכנה DOCA, ומזהה איומים בזמן אמת, במהירות גבוהה פי 1,000 מהמקובל כיום בשוק.

מעבדי ההאצה האלה הם מרכיב מרכזי בתשתיות AI Factories ומסייעים לספק להם יכולות תקשורת מהירות. מכיוון שמערכת ההגנה רצה על מעבדי ההסטה, פעילותה אינה תלויה בסוג השרת, במשאבי השרת או בכים המותקנים בשרת המארח. כלומר, היא מערכת אבטחה שיכולה לפעול בכל סביבה של מחשוב בינה מלאכותית. חברת אנבידיה מסרה שהיא מקימה בימים אלה מפעל AI עבור חברת סיסקו, אשר יתבסס על הארכיטקטורה שלה ועל מערכת האבטחה החדשה.

וואווי מנצלת את ההזדמנות בשוק ה-AI הסיני

בתמונה למעלה: מעבד הבינה המלאכותית Ascend 910 של וואווי. צילום: וואווי

לאחר שממשל טראמפ הורה בשבוע שעבר לאנבידיה להקפיא את המשך אספקת מעבד ה-H20 לסין, כחלק ממלחמת הסחר בין שתי המעצמות, יצרנית השבבים הסינית וואווי (Huawei) מתכוונת להיכנס אל תוך הוואקום ולהתחיל כבר בחודש הבא באספקת מעבד AI חדש, מדגם 910C, ללקוחות בסין – כך לפי דיווח בלעדי אתמול (ב') ברויטרס. בעקבות הדיווח, ירדה אתמול מניית אנבידיה בשיעור נוסף של 4.5%, וזאת בנוסף לירידה שנרשמה בערך המניה בשבוע שעבר לאחר הדיווח על איסור הייצוא לסין. בסך הכול, מנייתה של אנבידיה איבדה כבר 30% מאז תחילת השנה. באחרונה ביקר מייסד ומנכ"ל אנבידיה, ג'נסן הואנג, בסין, ככל הנראה על רקע ההשפעה של המתיחות הבין-מעצמתי על עסקי החברה.

ה-910C של וואווי למעשה מחבר בין שני שבבי הדור הקודם, 910B, במארז מיוחד. כך, לדברי המקורות ששוחחו עם רויטרס, ה-910C מספק יכולות עיבוד וזיכרון גבוהים פי שניים, וביצועיו שקולים למעבד הדור הקודם, H100, של אנבידה, הידוע גם בשם Hopper.

בשנים האחרונות הנתח של אנבידיה בשוק ה-AI בסין מתמעט בעקביות. תחילה, הדבר נבע מהקשחה מתמדת במגבלות הייצוא של מעבדים מתקדמים לסין, דבר שחייב את אנבידיה לייצר מעבדים חלופיים ייעודיים עבור השוק הסיני, שניחנים ביכולות נמוכות יותר כדי לעמוד במגבלות הייצוא. הדבר יצר הזדמנות עבור השחקנית המקומית הראשית בתחום, חברת וואווי, שמפתחת מעבדי AI למרכזי נתונים ותופסת נתח גדל והולך בשוק המקומי. אם ב-2021 אנבידיה החזיקה בכ-25% משוק מרכזי הנתונים הסיני, ב-2023 חלקה הצטמצם לכדי 4% בלבד.

בשבוע שעבר הודיע ממשל טראמפ לאנבידיה כי יהיה עליה לקבל רישיון מיוחד כדי להמשיך ולשווק את ה-H20 לשוק הסיני. הלכה למעשה, ההוראה מקפיאה לפי שעה את המשך פעילותה של אנבידיה בסין, לפחות עד שיפשירו היחסים בין שתי המעצמות. בעקבות כך, הודיעה אנבידיה כי היא תמחק כ-5.5 מיליארד דולר משווי מלאיה, בשל אי-יכולתה לספק הזמנות קודמות עבור ה-H20 מהשוק הסיני. אם בעבר השוק הסיני תרם כ-20%-25% מההכנסות של אנבידיה בתחום מרכזי הנתונים, ברבעון הרביעי של 2024 חלקה ירד לאחוזים ספורים.

השבב שמתחרה באנבידיה

ה-Ascend 910B של וואווי – שכאמור עליו מתבסס ה-910C – הוא מאיץ AI המיועד לאימון והרצה של מודלי AI במרכזי נתונים, ומהווה חלופה מתוצרת סינית למאיץ ה-AI של אנבידיה, H100. לפני מספר חודשים הצהיר בכיר בוואווי, בכנס שבבים בסין, כי ה-Ascend 910B מציג ביצועים ברמה של 80% בהשוואה ל-H100 של אנבידיה באימון מודלי שפה גדולים (LLM), ועולה על ה-H100 ב-20% בביצוע משימות מסוימות, כך לטענתו. חברות ענן סיניות כמו Baidu ו-Tenscnt הצטיידו במאיץ של וואווי.

רשמית, וואווי מייצרת את ה-Ascend 910B אצל קבלנית הייצור הסינית SMIC. עם זאת, בתקשורת בדרום קוריאה דווח לפני מספר חודשים כי SMIC מתקשה לייצר את השבבים הללו, בשל מחסור בציוד מתקדם על רקע המגבלות האמריקאיות, וכי 4 מתוך 5 שבבי Ascned 910B מיוצרים עם פגמים.

אנבידיה מחקה 5.5 מיליארד דולר בעקבות מגבלה חדשה של הממשל האמריקאי על ייצוא לסין

חברת אנבידיה (Nvidia) הודיעה אתמול (ג'), בדיווח לרשות לניירות ערך בארצות הברית (SEC), כי תיאלץ למחוק הכנסות בהיקף של 5.5 מיליארד דולר, וזאת על רקע החלטתו של הממשל בארצות הברית להקשיח את ההגבלות על מכירת שבבים מתקדמים לסין. בעקבות הדיווח, מנייתה של אנבידיה נופלת במסחר המקדים היום (ד') בשיעור של יותר מ-5%.

לפי הדיווח ב-SEC, הממשל האמריקאי עדכן את אנבידיה בשבוע שעבר כי יהיה עליה לקבל רישיון מיוחד כדי להמשיך לייצא לסין את שבבי ה-H20, שהם הגרסה המותאמת שאנבידיה פיתחה לשוק הסיני על בסיס שבבי Hopper, הדור שקדם לשבב ה-Blackwell. לפי הדיווח, הממשל האמריקאי תלה את המגבלה החדשה בחשש כי השבבים הללו ישמשו את הסינים כדי לבנות "מחשב-על".

בתחילת השבוע עדכן הממשל את אנבידיה כי הדרישות בקבלת רישיון יהיו בתוקף "עד להודעה חדשה".  בעקבות כך, אנבידיה החליטה למחוק משווי המלאי שלה סחורה בשווי של 5.5 מיליארד דולר, שיועדה לשוק הסיני, לאור העובדה כי כעת החברה לא יודעת להעריך מתי תוכל לספק את ההזמנות הללו, אם בכלל.

ה-HGX H20 הוא גרסה ייעודית שפיתחה אנבידיה עבור השוק הסיני, שהחברה השיקה בחודש נובמבר 2023, כחודש לאחר שהממשל האמריקאי החמיר את מגבלות הייצוא. ה-HGX H20 מתבסס על מעבד ה-AI H100 ("הופר"), אך הוא מציע יכולות עיבוד מופחתות של 296 טרה פעולות לשנייה (TPLOPS).

בשנה שעברה דווח כי אנבידיה מפתחת, בשיתוף המפיצה שלה בסין Inspur, גרסה מותאמת למעבד ה-AI החדש ביותר שלה, Blackwell, וכי בכוונתה להשיקה בסין ברבעון השני של 2025. בדומה לגרסאות מותאמות קודמות של אנבידיה לשוק הסיני, המעבד צפוי להציע יכולות עיבוד נמוכות יותר, שלכאורה לא יאפשרו לסין לרתום אותו לצורך פיתוח יישומים צבאיים שיסכנו את הביטחון הלאומי של ארצות הברית. על רקע מלחמת הסחר המסלימה בין ארצות הברית לסין, ישנו סימן שאלה האם אנבידיה כלל תוכל להמשיך ולמכור את מאיצי ה-AI לשוק הסיני כל עוד המתיחות בין שתי המעצמות בעינה.

הצהרת כוונות: אנבידיה שחררה את הפיתרון של Run:ai בקוד-פתוח

[בתמונה למעלה: מייסדי חברת Run:ai רונן דר (מימין) ועמרי גלר. קרדיט: Run:ai]

לאחר שהשלימה בתחילת השנה את המיזוג עם Run:ai, אנבידיה מבצעת מהלך משמעותי ראשון עם הטכנולוגיה של החברה הישראלית: היא השיקה היום (ג'), בקוד פתוח, את KAI Scheduler, כלי לניהול עומסי עבודה של בינה מלאכותית בתשתיות מחשוב-על, שזוהי למעשה טכנולוגיית הליבה של Run:ai.

הפיתרון ניתן כעת להורדה בעמוד של אנבידיה ב-Github תחת רישיון Apache 2.0, שהוא רישיון מאוד מתירני אשר יאפשר לארגונים, סטארטאפים, מעבדות מחקר ומפתחים להשתמש בקוד באופן חופשי, לשנותו ואפילו להפיץ את התוצרים באופן מסחרי, תוך מתן קרדיט למקור. 

KAI Scheduler היא פלטפורמת "תזמור" (orchestration), המאפשרת לנצל באופן מיטבי את משאבי העיבוד של תשתית ה-AI לצורך ביצוע משימות AI כמו אימון, ניסוי או הסקה. הפלטפורמה יודעת למפות את משאבי ה-GPU וה-CPU הזמינים ולהקצות את המשאבים הפנויים למשימות שעל הפרק. "תזמור" הוא היבט קריטי בניצול יעיל וחסכוני של תשתיות AI, שמתמודדות עם עומסים גדולים, מורכבים ודינמיים יותר ויותר בעידן ה-GenAI וסוכני AI. הפיתרון של Run:ai מתממשק עם כל סוג של מקבצי (cluster) מעבדים המנוהלים תחת קוברנטיס, בין אם אלה מעבדים של אנבידיה או של יצרניות אחרות.

בפוסט בבלוג מנו באנבידיה את היתרונות של KAI בהשוואה לפתרונות מקבילים בשוק, ובכלל זה יכולת לנהל באופן דינמי את ביקושי ה-GPU המשתנים, צמצום זמני המתנה למחשוב, הקצאת משאבים כדי להבטיח זמינות, והתממשקות חלקה עם כלי AI ומסגרות עבודה שונות. "KAI מחשב באופן רציף את הדרישות, מקצה מכסות ומגבלות בזמן אמת – ומתאים באופן אוטומטי את משאבי העיבוד הדרושים למשימות שעל הפרק. הגישה הדינמית הזו מבטיחה הקצאה יעילה של משאבי GPU, ללא צורך בהתערבות ידנית מצד המנהלים", נכתב בבלוג.

Run:ai נרכשה על ידי אנבידיה ב-700 מיליון דולר. התוכנה של Run:ai מיועדת להוות מרכיב משמעותי באקוסיסטם של אנבידיה ולאפשר ללקוחות החברה למקסם את התועלת שהם מפיקים מתשתיות החומרה שלה. ניהול נכון של משימות ה-AI, באמצעות פיתרון כמו זה של Run:ai, שנחשבת לחלוצה בתחום, יכול למקסם תפוקה ולהפחית עלויות שימוש. שחרוור חלק מהטכנולוגיה של Run:ai בקוד-פתוח, אף שהוא מתממשק גם עם מעבדים של חברות מתחרות, הינו מהלך שנועד לחזק את האקוסיסטם של אנבידיה בקהילת הקוד-פתוח ולאפשר למשתמשים שונים לרתום ולהתאים את הפיתרון למקרי בוחן מגוונים.

 

Bluewhite חשפה מערכת נהיגה אוטונומית לטרקטורים

חברת Bluewhite Robotics הישראלית, המפתחת טרקטורים אוטונומיים לתחום החקלאות החכמה וחוות אוטונומיות, חשפה בכנס המפתחים GTC של אנבידיה, מערכת נהיגה אוטונומית חדשה עבור טרקטורים, GEN 4, המתבססת על פלטפורמת המחשוב המשובצת AGXOrin לכלים אוטונומיים. המחשב מיועד להריץ מודלי AI עבור מערכות ראיית-מכונה ומספק יכולות עיבוד של 258 טרה-פעולות-בשנייה (TOPS). לדברי Bluewhite, החברה עובדת בשיתוף פעולה עם אנבידיה על הפתרון המשולב.

החברה פיתחה ערכת אוטומציה להתקנה על-גבי טרקטורים המעניקה להם יכולת תנועה, ניווט וביצוע פעולות חקלאיות במטע באופן אוטונומי. הערכה כוללת חבילת חיישני LiDAR, מצלמות אופטיות, תוכנת ניהול והימנעות ממכשולים, חיישני לחץ למניעת פגיעה בצמחייה ומערכות חירום ושליטה מרחוק. סמנכ"ל המו"פ של החברה, תומר אגם, הסביר כי שילוב המעבדים של אנבידיה משפר את יכולת קבלת ההחלטות והלמידה בשטח. "אנחנו מאמנים מודולי AI בקנה מידה שלא נראה בעבר בתחום החקלאות, תוך ביצוע סימולציות של סביבות חקלאיות מורכבות".

המערכת האוטונומית של Bluewhite צברה למעלה מ-75,000 שעות נסיעה אוטונומית – כולן בשטח, בפעילות מסחרית עם חקלאים, במטעים, כרמים ופרדסים, במגוון רחב של גידולים כגון שקדים, ענבי יין, פיסטוקים, הדרים ותפוחים.. ברמה המסחרית, מוקד פעילות החברה הינו בארצות הברית, בעיקר בקליפורניה ובמדינת וושינגטון. כיום, הפתרון מותקן על צי קיים של טרקטורים (aftermarket). החברה משתפת פעולה עם CNH, יצרנית הטרקטורים הבינלאומית בעלת המותגים New Holland ו-Case IH, במטרה להנגיש את הפתרון האוטונומי ללקוחות דרך רשת ההפצה שלהם ובהמשך להטמיע אותו בטרקטורים בשלב הייצור. Bluewhite הוקמה ב-2017 על ידי בן אלפי, יאיר שחר ואבירם שמואלי. היא גייסה עד היום כ-89 מיליון דולר.

אנבידיה השיקה מודל פעולה וחשיבה לרובוטים דמויי-אדם

חברת אנבידיה (Nvidia) הכריזה בכנס GTC, שמתקיים בימים אלה בסן חוזה, על השקת NVIDIA Isaac GR00T N1, מודל AI בסיסי, בקוד פתוח, שיקנה מיומנויות בסיסיות ויכולות חשיבה (Reasoning) לרובוטים דמויי אדם (Humanoids).

Isaac GR00T N1 הוא המודל הראשון בסדרה של מודלים הניתנים להתאמה אישית מלאה, אשר אנבידיה מתכוונת לאמן ולשחרר למפתחי רובוטים, כדי לסייע להם בהאצת פיתוח של רובוטים המיועדים תחילה לתעשיות שבהן ישנו מחסור הולך וגובר בכוח אדם.

המודל החדש כולל ארכיטקטורת מערכת-כפולה, כהשראה מהמודעות האנושית (Human Cognition). "מערכת-1" הינה מודל שחושב במהירות, ומדמה רפלקסים ואינטואיציה אנושיים. "מערכת-2" היא מודל שחושב באיטיות עבור קבלת החלטות שיטתית ומכוונת, והוא מונע באמצעות מודל שפה ויזואלי (Vision Language Model – VLM). מערכת 2 חושבת על הסביבה ועל ההוראות שהיא קיבלה, על מנת לתכנן את הצעדים הבאים. מערכת 1, מנגד, מתרגמת את התוכניות האלו לתנועות מדויקות וממושכות של הרובוט, זאת לאחר שאומנה על גבי דאטה של הדגמות אנושיות וכמויות עצומות של דאטה סינתטי שהופק באמצעות NVIDIA Omniverse.

לפי אנבידיה, מודלי GR00T מסוגלים לעבור בקלות בין משימות נפוצות—כמו תפיסה, תזוזה והנעת אובייקטים עם זרוע אחת או יותר—או לבצע משימות רב-שלביות הדורשות קונטקסט ארוך בשילוב מיומנויות כלליות. 

בנוסף, חשפה אנבידיה גם פלטפורמות סימולציה חדשות, בהן Isaac GR00T Blueprint ליצירת דאטה-סינתטי וכן מנוע פיזיקה חדש בשם Newton—בפיתוח משותף עם Google DeepMind ו-Disney Research—המיועד עבור פיתוח רובוטים.

שיתוף פעולה עם GM בפיתוח בינה מלאכותית לדור הבא של הרכבים ומפעלי הייצור

עוד חשפה אנבידיה ב-GTC 2025, כי היא משתפת פעולה עם General Motors, יצרנית הרכב הגדולה ביותר בארה״ב, בפיתוח הדור הבא של הרכבים, מפעלי הייצור והרובוטים. החברות יעבדו יחד כדי לבנות מערכות בינה מלאכותית המונעות באמצעות פלטפורמות המחשוב המואץ NVIDIA Omniverse ו-NVIDIA Cosmos, על מנת לאמן מודלי בינה מלאכותית של מפעלי ייצור עבור אופטימיזציה של תכנון מפעלים ורובוטים. 

בנוסף, GM הודיעה כי תשתמש בפלטפורמת המחשוב לרכב NVIDIA DRIVE AGX עבור מערכות סיוע נהג עתידיות ומתקדמות בפיתוחה, כמו גם עבור פיתוחים לשיפור הבטיחות בנסיעה. מערכת זו תבוסס על NVIDIA Blackwell, כמו גם מערכת ההפעלה NVIDIA DriveOS. 

אנבידיה היא עדיין "הגורילה הכי חזקה בשכונה"

בתמונה: אנבידיה משיקה מודל חשיבה לרובוטים דמויי-אדם. מקור: אנבידיה]

מאת חנן זכאי, קבוצת CodeValue 

אתמול בערב יצא לדרך GTC 2025, אירוע המפתחים השנתי של NVIDIA. את האירוע פתח מנכ"ל החברה הואנג ג'נסן במצגת סוחפת, שבה פירט על החידושים הקרובים יותר ופחות שיגיעו לשווקים בשנים הקרובות. לאלו מכם שאין זמן לקרוא נסכם את השורה התחתונה NVIDIA היא עדיין "הגורילה הגדולה בשכונה" שלקחה עסק "משעמם" של חומרה והפכה אותו לאימפריה של חדשנות, כשהיא רוכבת על מהפכת ה AI. המעבדים הכי חזקים בכמויות הכי גדולות במהירויות הכי גבוהות ועם שיתופי הפעולה הנוצצים ביותר. אבל בשורה התחתונה לא ראינו דבר שלא ניתן היה לקרוא עליו בתחזיות שנכתבו לפני הכנס ולראיה גם התגובה הפושרת של המניה, שנמצאת בעיצומו של תיקון קטן אבל עדין משקפת ירידה של מעל 13% משוויה בחודש האחרון.

ובכל זאת מה כן היה שם, מעבר לחשיפה של הפלטפורמות החדשות Blackwell Ultra ו Vera Rubin שכמובן ממשיכות להוביל בממדי כוח ויעילות חישוב. אולם מעבר לשיפור יכולות יצירת מודלי LLM וההרצה שלהם, NVIDIA משקיעה משאבים בפיתוח תוכנות שישפרו את היעילות והשימושיות . כשהפתרונות הבולטים מתוכם הם NVIDIA Dynamo, תוכנה בקוד פתוח, נועדה להאיץ ולהרחיב מודלי חשיבה של AI במפעלי AI, ומתפקדת כ"מערכת ההפעלה של מפעל AI". o משפחת מודלי החשיבה הפתוחה Llama Nemotron נועדה לספק למפתחים וארגונים בסיס מוכן לעסקים ליצירת סוכני AI מתקדמים ו NVIDIA Isaac GR00T N1, מודל בסיס פתוח לרובוטים דמויי אדם,.

מעניין גם היה לראות דרך שיתופי הפעולה שהוכרזו איך מסמנת NVIDIA לשווקים שונים את כיווני החדשנות. כשהמעניינים בשת"פים אלו הם עם ג'נרל מוטורס (GM): GM מאמצת את AI, סימולציה ומחשוב מואץ של NVIDIA כדי לפתח רכבים, מפעלים ורובוטים מהדור הבא . NVIDIA הכריזה גם על NVIDIA Halos, מערכת בטיחות מקיפה לכלי רכב אוטונומיים, כחלק משיתוף פעולה זה. האורות במשרדים של טסלה ומובילאיי, ועוד כמה ענקיות, נשארו אתמול דלוקים עד מאוחר.

חנו זכאי. יח"צ

שיתוף פעולה מענין נוסף הוא עם גוגל DeepMind ודיסני ריסרץ' (Disney Research): NVIDIA בפיתוח מנוע הפיזיקה בקוד פתוח Newton לסימולציית רובוטיקה. כנראה שלכל מי שיש מחשבות ורעיונות על רובוטים שפוגעים באנשים בפארק WESTWORLD, כנראה יחושו פחות מאויימים כשמיקי מאוס יפנה אליהם וישאל לשלומם בעברית.

ואי אפשר לסכם ארוע כזה בלי להתייחס ל"טראומת" DEEPSEEK R3    הסיני שזעזע את עולם ה AI  כמו כל איש מכירות טוב, ג'נסן הדגיש שיעילות אימון ויצירת מודלים טובות יותר יגדילו את כמות השימושים ובהתאם גם את הדרישה למוצרי החברה, שבבסיסה היא נכונה, אבל כמו איש מכירות טוב הוא גם יודע שהקרקע שהוא דורך עליה עדין די "בוצית" ורחוקה מלהיות בטוחה. 

אנבידיה ישראל פיתחה מתגי סיליקון פוטוניקס

אתמול (ג') במסגרת GTC, כנס המפתחים השנתי של אנבידיה, חשפה החברה מתגי סיליקון פוטוניקס (Silicon Photonics) למרכזי נתונים. אלה הם שבבי הסיליקון פוטוניקס הראשונים של אנבידיה והם ישולבו בפלטפורמות האיתרנט (Spectrum-X) והאינפיניבנד (Quantum-X). מתגי הסיליקון פוטוניקס ישולבו על גבי אותו מעגל משולב (ASIC) לצד שבבי האיתרנט והאינפיניבנד בטכנולוגיה הקרויה Co-Packaged Optics (CPO), שבה אורזים יחדיו רכיבים אלקטרוניים ורכיבים אופטיים.

המתגים החדשים פותחו על ידי אנבידיה ישראל, וזוהי אבולוציה נוספת של הטכנולוגיה של חברת מלאנוקס (Mellanox) שנרכשה על ידי אנבידיה ב-2019 ומהווה את ליבת המרכז הישראלי של ענקית השבבים. עוד בהיותה חברה עצמאית, מלאנוקס ניסתה לפתח טכנולוגיית קישוריות המבוססת על סיליקון פוטוניקס, ולשם כך גם רכשה את חברת  Kotura האמריקאית, שפעלה בתחום. ואולם, בתחילת 2018, כחלק מתהליך של התייעלות, הודיעה כי היא מפסיקה את פעילותה בתחום.

טכנולוגיית סיליקון פוטוניקס, המתבססת על שימוש באמצעים אופטיים כדי להעביר מידע, אמורה לאפשר תעבורת נתונים מהירה ויעילה יותר. מתגי הסיליקון פוטוניקס החדשים אמורים להוות תשתית תקשורת לסוג חדש של מרכזי נתונים עצומים בגודלם, אשר מנכ"ל ומייסד החברה ג'נסן הואנג הגדיר אתמול בנאום הפתיחה בתור "מפעלי בינה מלאכותית".

"מפעלי בינה מלאכותית הם סוג חדש של מרכזי נתונים בקנה מידה גדול באופן קיצוני, ויש להמציא מחדש את תשתית הרשת כדי לעמוד בקצב. על ידי שילוב סיליקון פוטוניקס ישירות במתגים, אנבידיה מנפצת את המגבלות הישנות של רשתות בקנה מידה גדול, ופותחת את השער למפעלי בינה מלאכותית של מיליון מעבדים גרפיים", הסביר הואנג.

מתגי הסיליקון פוטוניקס החדשים יאפשרו ל"מפעלי בינה מלאכותית" לחבר מיליוני GPUs על פני מספר אתרים, תוך הפחתה דרסטית בצריכת האנרגיה ובעלויות התפעול. לדברי אנבידיה, המתגים משלבים חידושים אופטיים עם פי ארבעה פחות לייזרים כדי לספק פי 3.5 יעילות בצריכת החשמל, Signal Integrity (איכות אות) גבוהה פי 63, עמידות רשת טובה פי 10 בקנה מידה גדול, ופריסה מהירה פי 1.3 בהשוואה לשיטות תקשורת מסורתיות.

מתגי Spectrum-X Photonics מגיעים במספר תצורות: גרסת 128 פורטים בקצב העברת נתונים של 800 גיגה-ביט לשנייה או 512 פורטים בקצב של 200 גיגה-ביט לשנייה ורוחב פס כולל של 100 טרה-ביט לשנייה. וכן בתצורה של 512 פורטים בקצב 800 גיגה-ביט לשנייה, או 2,048 פורטים בקצב של 200 גיגה-ביט לשנייה, עם רוחב פס כולל של 400 טרה-ביט לשנייה. 

עוד נמסר מאנבידיה כי על מנת לפתח ולייצר את שבבי הסיליקון פוטוניקס ולדאוג לשרשרת אספקה מיטבת, נעשו שיתופי פעולה והמצאות משותפות עם  מגוון חברות וארגונים, בהם TSMC, Coherent, Corning Incorporated, Foxconn, Lumentum ו-SENKO. 

נאום הפתיחה (keynote) אמש של מייסד אנבידיה ב-GTC:

"ב-2025 נראה תנופה בתחום סוכני ה-AI"

[בתמונה: אופיר זמיר, אנבידיה ישראל. יח"צ]

בשבוע הבא, בין ה-17 ל-21 במרץ, ייערך בסן חוזה, קליפורניה, כנס הבינה המלאכותית GTC 2025 של אנבידיה, בהשתתפות כ-900 חברות, ביניהן גם חברות ישראליות רבות. גולת הכותרת, מבחינה תקשורתית, יהיה נאומו המרכזי (keynote) של מייסד ומנכ"ל החברה, ג'נסן הואנג, ביום שלישי בערב שעון ישראל.

יהיה מעניין לראות כיצד משתקף בכנס שלב המעבר שבו מצוי בימים אלה עולם הבינה המלאכותית. אם עד כה זירת ה-AI היתה שמורה בעיקר לחברות הענק, כמו OpenAI, מטא, גוגל ו-xAI, שפיתחו את מודלי הייסוד (foundation models) הגדולים, כעת המיקוד עובר לנגזרות האפליקטיביות של המודלים הגדולים הללו, כדוגמת תחום סוכני ה-AI.

לצד פעילות המו"פ של אנבידיה בישראל, המתבססת בעיקר על חברת מלאנוקס (Mellanox) שנרכשה ב-2019, פועלת כאן גם שלוחה שתפקידה לסייע ללקוחות של אנבידיה בישראל למקסם את השימוש בכלי החומרה והתוכנה שלה. מי שעומד בראש הקבוצה הזו הוא אופיר זמיר, דירקטור בכיר וראש קבוצת ארכיטקטורת AI באנבידיה ישראל. "המרכז שלנו כולל ארכיטקטים ומדעני נתונים ואנחנו עובדים עם חברות , סטארט-אפים וגופי אקדמיה. אנבידיה מציעה כיום את כל החבילה [full stack] בתחום ה-AI ואנחנו מסייעים לחברות כאן למקסם את הכלים הללו לפיתוח שלהן".

הטלטלה של דיפסיק

בחודשים האחרונים, התרחשו לא מעט דרמות בעולם ה-AI. בראשן, חברת דיפסיק (DeepSeek) הסינית – שם בלתי מוכר עד היום – אשר חשפה את מודל החשיבה R1, שאינו נופל בביצועיו מהמודלים המתחרים בשוק, אך אומן באמצעות עשירית מכוחות המחשוב. החשש היה כי ענקיות ה-AI ישקלו מחדש את השקעותיהן העצומות בתשתיות AI, דבר שיפחית את הביקוש לשבבי אנבידיה. מי שניסה בשבועות האחרונים לצנן את תבהלת דיפסיק היה מייסד ומנכ"ל אנבידיה הואנג, שטען שהשוק לא הבין נכון את ההשלכות של המודל של דיפסיק. "המודל של דיפסיק מלהיב במיוחד. השוק מיהר להסיק שתחום ה-AI גמור, שאין צורך במחשוב. להיפך. זה רק יאיץ את אימוץ ה-AI".

זמיר מוסיף כי מודלים כמו דיפסיק אמנם מפגינים התייעלות בשלב אימון המודל, אך זהו רק אחד השלבים שבהן יש צורך במחשוב. "ישנם שלוש רמות שמניעות את הביקוש בשוק ה-AI. עד היום התמקדו באימון המודלים הגדולים: ככל שיש לך יותר מחשוב ויותר דאטה, תוכל לייצר LLM חכם יותר. אבל זה לא המקום היחיד שבו צריך מחשוב. יש את השלב שלאחר האימון (post training), שבו אתה לוקח מודל גדול וממקצע אותו בתחום ידע ספציפי, כמו פיננסים, סייבר או פיתוח תרופות. המישור השלישי הוא מודלי החשיבה, כמו O3 של OpenAI ו-R1 של דיפסיק. אלה הם מודלים שמשקיעים יותר מאמצים בשלב התשובה. הם מפרקים את הבעיה לצעדים ושלבים, יוצרים 'שרשרת מחשבות' – וזה מצריך הרבה יותר עיבוד.

זמיר מתייחס למהפכה הבאה בעולם ה-AI: סוכני ה-AI. אם צ'אט-בוטים כמו ChatGPT יודעים להשיב על שאלות או לפתור בעיות תיאורטיות, סוכני AI יודעים לעשות דברים בעולם הדיגיטלי, כמו לחפש ברשת, להזמין לנו כרטיסי טיסה או לבצע פעולות אדמיניסטרטיביות במערכות המידע של הארגון. באחרונה, חשפה גוגל את ה-Co-Scientist, סוכן מדע שמסייע לחוקרים לבצע מחקרים מדעיים ביעילות מרשימה. "השנה אנחנו נראה תנופה בתחום סוכני ה-AI. הם יציעו יכולות חדשות של אוטומציה בתחומים רבים. זהו עוד יישום שמצריך משאבי מחשוב משמעותיים", העריך זמיר.

ישראל מובילה ב-LLMOps

אנבידיה מסייעת להפרות את האקוסיסטם המקומי באמצעות תוכנית האקסלרציה Inception, שמספקת בין היתר לסטארט-אפים גישה לסביבות הפיתוח שלה. רק בשבוע שעבר נחשף סטארט-אפ חדש בשם Alta, שהשתייך לאקסלרטור ופיתח סוכני AI לעולם השיווק והמכירות. "אם עד לא מכבר, חברות בתחום היו צריכות להקים חוות שרתים ולפתח מודל גדול על בסיס דאטה עצום, הרי שהיום לא צריך להתחיל מאפס, כלומר משלב ה-pre-traingn. חברות מבססות את הפיתוח שלהן על מודל ייסוד קיים, שחלקם זמינים בקוד פתוח, ופשוט מבצעים תהליך של fine-tuning לתחום שאליו מיועד היישום, כמו סייבר, פיננסים או טלקום".

זמיר מצביע על נישה חדשה שמתפתחת בקרב הסטארט-אפים בישראל. "ההייטק הישראלי תמיד הצטיין בתחומי ב-MLOPS, כלומר בפיתוח כלים למפתחים. לאנבידיה היו אפילו רכישות בישראל בתחום זה, למשל של החברות Deci ו-Run:ai. כעת ניתן לזהות מעבר לתחום החדש של LLMOps, כלומר כלים שמפשטים פיתוח של מודלי AI ומאפשרים לעשות ניסויים וסקיילינג, וב-GTC הקרוב יהיו מספר חברות ישראליות בתחום הזה".

אנבידיה מכרה שבבי Blackwell ב-11 מיליארד דולר ברבעון 4

על רקע ירידות השערים החדות בוול-סטריט השבוע, המשקיעים נשאו עיניים הלילה לדו"ח של אנבידיה (Nvidia), בתקווה שענקית השבבים תשיב את האופטימיות לשווקים. כשכובד הציפויות הללו על כתפיה, אנבידיה שוב הצליחה להתעלות מעל כל התחזיות המוקדמות – והוכיחה ששוק ה-AI עדיין בתנופה מלאה. החברה דיווחה על הכנסות של 39.3 מיליארד דולר ברבעון הרביעי של 2024 – גבוה ב-12% מהרבעון הקודם וב-78% מהרבעון המקביל ב-2023, ומעל לתחזיות המוקדמות של 38.5 מיליארד דולר. גם הרווח למניה (EPS) היה גבוה משמעותית מהתחזיות – 0.89 דולר לעומת תחזית ל-0.71 דולר.

תחום מרכזי הנתונים הניב לאנבידיה את מירב ההכנסות: 35.6 מיליארד דולר, עלייה של 16% בהשוואה לרבעון קודם. בשנת 2024 כולה הסתכמו הכנסותיה ב-130.5 מיליארד דולר, גבוה ב-14% מ-2023.

זהו הדו"ח המלא הראשון שבו אנבידיה מספקת נתונים על היקף המכירות של מעבד ה-AI החדיש ביותר שלה, ה-Blackwell. בשיחת הוועידה שלאחר פרסום הדו"ח חשף מנכ"ל החברה ג'נסן הואנג כי החברה מכרה שבבי בלאקוול בהיקף של 11 מיליארד דולר. "מכירות הבלאקוול התעלו מעל הציפיות שלנו. זוהי ההשקה המסחרית המהירה ביותר של מוצר בתולדות החברה, ללא תקדים במהירות ובהיקף. אנחנו מאיצים את הייצור כדי לעמוד בביקוש הלקוחות". לדברי הואנג, התצורה הנפוצה שבה לקוחות החברה עושים שימוש בבלאקוול היא במקבצים של 100 אלף יחידות.

יותר מכול חיכו בשוק לתחזית לרבעון הבא, וגם זו התעלתה על המצופה, כשאנבידיה צופה ברבעון הראשון של 2025 הכנסות של 43 מיליארד דולר. מייסד ומנכ"ל אנבידיה אמר: "תחום ה-AI מתקדם במהירות האור. הגל הבא יהיה בדמות סוכני AI ורובוטיקת AI, שיחוללו מהפכה בתעשיות הגדולות ביותר".

סילביה ג'בלונסקי, מנכ"לית חברת תעודות הסל האמריקאית Defiance ETFs אמרה ל-Techtime לאחר פרסום הדו"ח: אנבידיה ניפצה את התחזיות בכל הפרמטרים, ובעיקר הציגה תחזית מבטיחה לרבעון הבא. אנבידיה נמצאת בעמדה ייחודית, נהנית מביקוש בלתי נגמר, הלקוחות עומדים בתור לקנות כל שבב שהיא מוציאה. המנכ"ל אומר שהביקוש לשבב החדש, ה-Blackwell, מדהים וכי הם מגבירים את הייצור – זה סימן מאוד אופטימי. אנבידיה היא הברומטר של תחום ה-AI, וכשהיא בתנופה, זה אומר שכל התחום בתנופה".

הדרמה שקדמה לדו"ח

בחודשים האחרונים, מאז הדו"ח האחרון של אנבידיה, התרחשו לא מעט דרמות בעולם ה-AI. בראשן, לפני כחודש, שחברת דיפסיק (DeepSeek) הסינית – שם בלתי מוכר עד היום – חשפה את מודל החשיבה R1, שאינו נופל בביצועיו מהמודלים המתחרים בשוק, אך אומן באמצעות עשירית מכוחות המחשוב.

החשש היה כי ענקיות ה-AI ישקלו מחדש את השקעותיהן העצומות בתשתיות AI, דבר שיפחית את הביקוש לשבבי אנבידיה, שמנייתה צנחה ב-17% ביום שבו השיקה דיפסיק את R1. אך עד כה היחידה שאולי מאותתת בכיוון הזה היא מיקרוסופט, שהשבוע דווח כי ביטלה מספר חוזים להקמת מרכזי נתונים, וגם מנכ"ל החברה סטאיה נאדאלה התבטא לאחרונה על כך שמוטב להמתין כי יישומי ה-AI יניבו תשואה לפני פריסה של תשתית נוספת.

מנגד, אפל השבוע הכריזה על השקעה של חצי טריליון דולר ב-4 שנים בבניית מפעלים ומרכזי נתונים בארצות הברית, ובחודש שעבר היו אלה OpenAI וסופטבנק שהכריזו על תוכנית "סטארגייט" לבניית מרכזי AI בחצי טריליון דולר. כמו כן, בשבוע שעבר השיקה חברת xAI של אילון מאסק את מודל החשיבה Grok 3, שאומן באמצעות מחשב-על שכלל 100 אלף מעבדי אנבידיה.

מי שניסה בשבועות האחרונים לצנן את תבהלת דיפסיק היה מייסד ומנכ"ל אנבידיה הואנג, שטען שהשוק לא הבין נכון את ההשלכות של המודל של דיפסיק. "המודל של דיפסיק מלהיב במיוחד. השוק מיהר להסיק שתחום ה-AI גמור, שאין צורך במחשוב. להיפך. זה רק יאיץ את אימוץ ה-AI".

ענקיות ה-AI הכריזו על פרויקט Stargate בחצי טריליון דולר

בתמונה למעלה: שבב הבלאקוול של אנבידיה. ענקית השבבים תהיה ספקית חומרה מרכזית לפרויקט

ענקיות ה-AI הכריזו אתמול על פרויקט רחב היקף להשקעה של חצי טריליון דולר בהקמת תשתיות AI ברחבי ארצות הברית. לשם כך תוקם חברה משותפת (Joint Venture) בשם Project Stargate. מי שיובילו את הפרויקט יהיו חברות OpenAI, אורקל וענקית הטכנולוגיה וההשקעות היפנית סופטבנק. מטרת העל של הפרויקט: יצירת בינה מלאכותית אוטונומית (AGI).

סטארגייט תהיה בבעלות משותפת של OpenAI, סופטבנק, אורקל וחברת MGX. השותפות המרכזיות הן סופטבנק, שתהיה אחראית על הצד הפיננסי, ו-OpenAI שתהיה אחראית על הצד התפעולי. ספקי החומרה והתוכנה המרכזיים לתוכנית בתחילת הדרך יהיו אנבידיה, Arm, מיקרוסופט, ו-OpenAI. עבודות להקמת פרויקט ראשון בטקסס כבר החלו, ובמיזם בוחנים אתרים נוספים.

ההשקעה הכוללת של 500 מיליארד דולר צפויה להתפרס על פני תקופה קצרה יחסית של 4 שנים, כאשר 100 מיליארד דולר יוקצו כבר ברמה המיידית לפרויקטים. לדברי היזמים, "התשתית הזו תבטיח את עליונותה של ארצות הברית בתחום הבינה המלאכותית, תייצר מאות אלפי מקומות עבודה בארצות הברית – ותניב ערך כלכלי עצום לעולם כולו". מי שיהיו אחראיות על ניהול תשתית המחשוב העצומה הזו יהיו OpenAI, אנבידיה ואורקל.

לצד השותפות המרכזיות, הפרויקט צפוי להוליד אקוסיסטם שלם שממנו יהנו חברות רבות בתחומים מגוונים. "אנחנו רוצים לייצר קשרים עם חברות הקשורות לתחום התשתית למרכזי נתונים, מאנרגיה וקרקעות ועד בנייה, ציוד ועוד", נכתב בהודעה.

האוטו-טק הישראלי מאמץ את Nvidia Drive

חברת אנבידיה הכריזה היום (ג'), במסגרת יריד CES בלאס וגאס, כי חברות הרכב טויוטה, אורורה (Aurora) וקונטיננטל (Continental) אימצו את פלטפורמת המחשוב הייעודית של אנבידיה לעולם הרכב, Nvidia Drive AGX. במקביל, שתי חברות אוטו-טק ישראליות, ארבה ואינוויז, הודיעו גם כן על אימוץ פלטפורמת הרכב של ענקית השבבים.

בעקבות המומנטום של החברה בשוק האוטומוטיב, אנבידיה הצהירה כי היא צופה כי הכנסותיה מתחום הרכב בשנת 2026 הפיסקאלית יגיעו ל-5 מיליארד דולר. ברבעון האחרון הכנסותיה של החברה בשוק הרכב עמדו על 449 מיליון דולר בלבד, כך שמדובר בצפי לגידול משמעותי בהכנסות. 

במסגרת שיתופי הפעולה החדשים, טויוטה, שהיא יצרנית המכוניות הגדולה בעולם, תבנה את הדור הבא של רכביה על גבי Nvidia Drive, ואילו אורורה וקונטיננטל יפתחו משאיות אוטונומיות המונעות על בסיסה. Nvidia Drive היא פלטפורמת המחשוב של אנבידיה לכלי-רכב. היא כוללת חומרה ותוכנה וערכות פיתוח המאפשרות ליצרניות רכב לפתח מערכות נהיגה ומערכות בידור-מידע לרכב. על בסיס התשתית הזו יצרניות רכב בונות מערך של חיישנים ופונקציונאליות הייעודי לדגמיהן. יחידת המחשוב הראשית של המערכת היא מערכת-על-שבב Orin, המספקת 254 טרה פעולות לשנייה (TOPS). לדברי אנבידיה, ניתן לבסס על ה-Orin מערכות נהיגה אוטונומית עד רמה 5. החברה גם מציעה את הדור הבא, Thor, שמתבסס על ארכיטקטורת בלאקוול, ומאפשר גם להריץ יישומי GenAI. הפלטפורמה מתבססת על מערכת הפעלה ייעודית של אנבידיה.

זו אחת מפלטפורמות המחשוב לרכב הנפוצות ביותר, ובין היצרניות שהטמיעו אותה בדגמיהם ניתן למנות את טויוטה, וולוו, מרצדס-בנץ, זיקר ולי הסיניות, חברות EV כמו ריוויאן ולוסיד וגם המכונית האוטונומית של אמזון Zoox.

במסגרת דברים שנשא אתמול ב-CES אמר מנכ"ל אנבידיה ג'נסן הואנג: "מהפכת הרכבים האוטונומיים כבר כאן, ועולם הרכב יהיה לאחת מתעשיות ה-AI והרובוטיקה הגדולות ביותר. אנבידיה מביאה עימה שני עשורים של ניסיון בפיתוח מערכות מחשוב לרכב, מומחיות בבטיחות, ואת פלטפורמת CUDA AV, על מנת לחולל מהפכה בתעשיית הרכב המוערכת בטריליוני דולרים".

גם האוטו-טק הישראלי מאמץ את אנבידיה

אתמול (ג') הכריזה גם אינוויז (Innoviz) כי תדגים ב-CES את הסינרגיה בין פלטפורמת ה-LiDAR שלה ל-NVidia Drive AGX. אינוויז תבצע הדגמות חיות כיצד מתפקדת תוכנת החישה מבוססת ה-LiDAR שלה על גבי המערכת-על-שבב של אנבידיה לרכב, Orin. כאמור, Orin הוא מחשב מרכזי לרכב שמיועד להוות תשתית חומרה למערכות נהיגה אוטונומית עד רמה 5.

לדברי אינוויז, יכולות העיבוד של Orin מעצימות את יכולות העיבוד בזמן-אמת, מאפשרות להריץ AI ובכך משפרות את הבנת הסביבה ואת סיווג, זיהוי והמעקב אחר האובייקטים. מנכ"ל החברה, עומר כילף, הסביר: "השימוש בפלטפורמת Orin של אנבידיה מאפשר לנו להציע שילוב עוצמתי של חיישן LiDAR מתקדם ותוכנת חישה, המאפשר ליצרניות רכב להתקדם ממערכות ADAS ברמה 2 ועד נהיגה אוטונומית מלאה ברמה 5". הביתן של אינוויז צפוי להציג גם שני דגמים מסחריים שבהם מוטמע החיישן שלה, ה-BMW i7 וה-ID Buzz של פולקסוואגן. מניית החברה, שמצויה במומנטום חיובי בשבועות האחרונים, הגיבה להודעה בחיוב ונעלה אמש בעלייה של 10% במסחר בנסד"ק.

גם ארבה רובוטיקס (Arbe), שפיתחה מכ"ם תמונה ברזולוציה גבוהה, הכריזה ב-CES על שיתוף פעולה עם אנבידיה בתחום הרכב האוטונומי. ארבה תציג בכנס פתרון משותף, המתבסס על שבב המכ"ם של החברה ועל פלטפורמת Nvidia Drive AGX, אשר מסייע למערכות חישה ברכב למפות את הנתיב הפנוי לנסיעה בכביש.

מיפוי הנתיב הפנוי (free space mapping) הוא נדבך מהותי בכל מערכת נהיגה, ועליו מתבסס היכולת של הרכב לזהות מכשולים, להבדיל בין חלל ריק לחלל עמוס, ולתכנן את תוואי הנסיעה בהתאם, בדומה לאופן שבו נהג אנושי סוקר את הכביש מלפנים ומכוונן את ההגה בהתאם לתזוזת כלי הרכב ותוואי הכביש. לדברי ארבה, השימוש בפלטפורמת המחשוב של אנבידיה מאפשרת ליישם במהלך המיפוי יכולות של בינה מלאכותית, והודות לכך לשפר את מהימנות היישום, שכאמור הוא הכרחי לכל מערכת נהיגה אוטונומית.

התאימות בין המכ"ם של ארבה עם Nvidia Drive, והדגמת הביצועים הגבוהים, עשויות לקדם את אימוץ המכ"ם של ארבה בקרב יצרניות רבות יותר, שירצו להוסיף לחישת המצלמות חישת מכ"ם עוצמתית.

ארבה ואנבידיה מציגות פתרון משותף למיפוי נתיב הנסיעה

מנייתה של חברת ארבה רובוטיקס (Arbe) זינקה אתמול (ב') ב-52% במסחר בנסד"ק, וזאת לאחר שהכריזה על שיתוף פעולה עם אנבידיה (Nvidia) בתחום הרכב האוטונומי. ארבה הכריזה על פתרון משותף, המתבסס על שבב המכ"ם של החברה ועל פלטפורמת המחשוב לרכב של אנבידיה, Nvidia Drive AGX, אשר מסייע למערכות חישה ברכב למפות את הנתיב הפנוי לנסיעה בכביש. ארבה תדגים את הפתרון המשותף במהלך כנס CES, שייפתח היום בלאס ווגאס.

מיפוי הנתיב הפנוי (free space mapping) הוא נדבך מהותי בכל מערכת נהיגה, ועליו מתבסס היכולת של הרכב לזהות מכשולים, להבדיל בין חלל ריק לחלל עמוס, ולתכנן את תוואי הנסיעה בהתאם, בדומה לאופן שבו נהג אנושי סוקר את הכביש מלפנים ומכוונן את ההגה בהתאם לתזוזת כלי הרכב ותוואי הכביש. לדברי ארבה, השימוש בפלטפורמת המחשוב של אנבידיה מאפשרת ליישם במהלך המיפוי יכולות של בינה מלאכותית, והודות לכך לשפר את מהימנות היישום, שכאמור הוא הכרחי לכל מערכת נהיגה אוטונומית.

למעשה, ארבה מציגה את יישום המיפוי כמרכיב משלים, אך הכרחי, במערכות חישה מבוססות מצלמות. כאן גם טמון הפוטנציאל בשיתוף הפעולה עם אנבידיה. פלטפורמת Nvidia Drive היא פלטפורמת המחשוב הייעודית שפיתחה אנבידיה לכלי-רכב. היא כוללת מעבדים ותוכנה המהווים תשתית עבור יצרניות לפיתוח מערכות נהיגה ומערכות בידור-מידע לרכב. האימוץ של הפטפורמה של אנבידיה בשוק הוא מאוד נרחב, ובין היצרניות שהטמיעו אותה בדגמיהם ניתן למנות את טויוטה, וולוו, מרצדס-בנץ, זיקר ולי הסיניות, חברות EV כמו ריוויאן ולוסיד וגם המכונית האוטונומית של אמזון Zoox. כעת, התאימות בין המכ"ם של ארבה עם Nvidia Drive, והדגמת הביצועים הגבוהים, עשויות לקדם את אימוץ המכ"ם של ארבה בקרב יצרניות רבות יותר, שירצו להוסיף לחישת המצלמות חישת מכ"ם עוצמתית.

ארבה פיתחה ערכת שבבי מכ”ם לרכב המבוססים על טכנולוגיית Frequency Modulated Continuous Wave, שבה מתבצע שידור רציף של אותות בתדר משתנה (Chirp signal), והמרחק של האובייקטים מחושב בהתאם להפרשי התדר והמופע (פאזה) בין האותות המשודרים והאותות הנקלטים. בשנה שעברה חשפה את המכ”ם Lynx, אשר כולל 288 ערוצי קליטה ושידור וטווח גילוי של 260 מטר. הוא ישולב בחליפת מכ”ם הכוללת ארבע יחידות שונות ומעניקה כיסוי מכ”מי של 360°.

בחודש יוני דיווחה ארבה על שתי זכיות תכנון עם יצרניות רכב, ויש לה גם שיתוף פעולה נרחב עם ספקית המערכות לרכב (Tier-1) הסינית HiRain.

דל תטמיע את הפתרון של Run:ai בשרתי ה-AI שלה

[בתמונה למעלה: מייסדי חברת Run:ai רונן דר (מימין) ועמרי גלר. קרדיט: Run:ai]

חברת Run:ai וחברת Dell הודיעו על הרחבת שיתוף הפעולה ביניהן. כעת תשתית ה-AI של דל, Dell AI Factory, תכלול את תוכנת ניהול משאבי העיבוד של Run:ai. בחודש אפריל חתמה אנבידיה על הסכם לרכישת Run:ai תמורת 700 מיליון דולר, ואולם עסקת המיזוג טרם צלחה את המשוכות הרגולטוריות ויש סימן שאלה לגבי השלמת העסקה. Run:ai פיתחה טכנולוגיה מבוססת קוברנטיס (Kubernetes) לניהול עומסי העבודה בתשתיות מחשוב-על ליישומי בינה מלאכותית (AI).

Dell AI Factory היא תשתית מקצה-לקצה לארגונים עבור אימון והרצה של יישומי AI. התשתית כוללת שרתים עם מעבדי אנבידיה, כונני אחסון, פתרונות קישוריות, מסופי עבודה וממשק משתמש. כעת החבילה הזו תכלול גם את פלטפורמת ניהול משאבי העיבוד של Run:ai.

זהו הסכם משמעותי עבור Run:ai, וזאת בהיותה של דל אחת הספקיות המובילות בשוק של תשתיות AI, יש לה שיתוף פעולה הדוק עם אנבידיה, ובין לקוחותיה ספקיות שירותי ענן, גופים ממשלתיים וארגונים. זוהי דריסת רגל בשוק שצומח במהירות. הכנסותיה של דל מחטיבת שרתי ה-AI צפויות, לפי אתר barrons, להגיע ל-8 מיליארד דולר ב-2024 ולגדול ל-10 מיליארד דולר ב-2025. שוק שרתי ה-AI הכללי צפוי לגדול מ-91 מיליארד דולר ב-2024 ל-190 מיליארד דולר ב-2026 – קצב גידול שנתי של 45%.

מנכ"ל ומייסד שותף של Run:ai, עמרי גלר, אמר כי מדובר בציון דרך חשוב בצמיחה של החברה. "באמצעות שיתוף הפעולה עם דל, ארגונים מקבלים פתרון מאוחד, שכולל תשתית מובילה ותוכנת 'תזמור' מתקדמת. האינטגרציה הזו מפשטת את הדרך לחדשנות בתחום ה-AI, ומאפשרת לארגונים להתמקד בתוצאות ולא במורכבות התשתית".

גם באנבידיה הגיבו לשיתוף הפעולה. "האימוץ הגובר של AI מחייב גישה חדשה לניהול תשתית החומרה. שיתוף הפעולה הזה, הנתמך על ידי פתרונות המחשוב המואץ של אנבידיה, מסייע לארגונים לבנות תשתיות AI ולבצע סקיילינג בהתאם לצרכיהם המשתנים".

בחודש אוגוסט דווח באתרים Politico ו-Financial Times כי רשות התחרות האמריקאית בוחנת את עסקת המיזוג בין אנבידיה ל-Run:ai, וזאת מחשש שצירוף הטכנולוגיה של Run:ai לסל המוצרים של אנבידיה יחזק את מעמדה "המונופוליסטי" של אנבידיה בתחום ה-AI. לפני כחודש דווח כי גם האיחוד האירופי בודק את חוקיות העסקה.

הטמעת שירותים מבוססי בינה מלאכותית הוא תהליך מורכב אשר צריך להתמודד עם פיצול עומסי העבודה בין הענן, מחשבי הקצה (Edge AI), ועד לתשתיות של מרכזי נתונים עצמאיים (On-Premises). הטכנולוגיה של Run:ai מאפשרת ללקוחות ארגוניים לנהל ולייעל את תשתיות המחשוב שלהם, בין אם הן נמצאות ב-Data Center בבעלות החברהבענן או בסביבה היברידית.

אנבידיה חושפת מחשב-על קומפקטי ל-AI ב-249 דולר

חברת אנבידיה (NVIDIA) חושפת מחשב-על קומפקטי חדש עבור מפתחי בינה מלאכותית, סטודנטים ויוצרים, שמציע ביצועי GenAI משופרים בכרבע מהמחיר של סמארטפון מתקדם. ערכת המפתחים החדשה NVIDIA Jetson Orin Nano Super מאפשרת, בין היתר, ליצור צ'אטבוטים מבוססי מודלי שפה גדולים (LLMs) עם יכולת RAG לאיחזור מידע, לבנות סוכני בינה מלאכותית לניתוח תמונות וסרטונים, ולפתח רובוטים מבוססי בינה מלאכותית. מחשב העל הקומפקטי יימכר החל מהיום במחיר של 249 דולר בלבד – מחשב העל הנגיש ביותר לעידן הבינה המלאכותית היוצרת.

לדברי אנבידיה, Jetson Orin Nano Super מציג שיפור של פי 1.7 בביצועי הסקה (Inference), זינוק של 70% בביצועים ל-67 INT8 TOPS, וגידול של 50% ברוחב הפס של הזיכרון ל-102GB/s לעומת הדור הקודם. הביצועים המשופרים של ערכת המפתחים Jetson Orin Nano Super תציג ביצועים משודרגים למגוון מודלי בינה מלאכותית יוצרת פופולריים ומודלי ה-Transformer לראייה ממוחשבת, לרבות מודלים של עליבאבא, גוגל, OpenAI, מיקרוסופט, מטא, Hugging Face וכמובן אנבידיה עצמה. 

ערכת המפתחים מורכבת מ-System-on-Module (SoM) עם 8GB ו-Reference Carrier Board, שמהווים פלטפורמה אידיאלית ליצירת אבות טיפוס של יישומי בינה מלאכותית למחשוב קצה (edge). ה-SoM כולל GPU של אנבידיה בארכיטקטורת Ampere עם ליבות טנסור ומעבד CPU מבוסס ARM עם 6 ליבות, שמאפשר להריץ מספר יישומי AI במקביל. הוא יכול לתמוך בעד ארבע מצלמות, עם רזולוציה וקצבי פריימים גבוהים יותר בהשוואה לגרסאות הקודמות.

על הערכה החדשה ניתן להריץ מגוון יישומי בינה מלאכותית של אנבידיה, כמו למשל NVIDIA Isaac ליישומי רובוטיקה, NVIDIA Metropolis ליישומי ראייה ממוחשבת ו-NVIDIA Holoscan לעיבוד נתוני חיישנים. ניתן להפחית את זמני הפיתוח בעזרת תוכנת Omniverse Replicator NVIDIA ליצירת דאטה סינתטי, ובעזרת NVIDIA TAO Toolkit לכוונון-עדין (Fine-tuning) של מודלי AI שאומנו מראש מתוך קטלוג NGC. 

בנוסף, מעבדת NVIDIA Jetson AI מציעה תמיכה מיידית במודלים מתקדמים מקהילת הקוד הפתוח, ומספקת הדרכות קלות לשימוש. מפתחים יכולים גם לקבל תמיכה והשראה ממפתחים אחרים בקהילת Jetson. השותפים באקוסיסטם של Jetson מציעים תוכנות AI ומערכות נוספות, וכלי פיתוח תוכנה מגוונים, ויכולים גם לסייע בכל הקשור למצלמות וחיישנים, Carrier boards ושירותי עיצוב למוצרים.

עדכוני התוכנה הזמינים ל-Jetson Orin Nano Super החדש ישפרו גם את ביצועי הבינה המלאכותית היוצרת עבור מפתחים שכבר יש ברשותם ערכות Jetson Orin NX ו-Orin Nano.

Jetson Orin Nano Super זמין לרכישה באמצעות השותפים הגלובליים של אנבידיה.

סין החליטה לחקור מחדש את עסקת מלאנוקס-אנבידיה

במה שנראה כצעד נוסף במלחמת השבבים המסלימה שבין סין וארצות הברית, פירסמה רשות התחרותיות הסינית הודעה קצרה ובה היא מודיעה על פתיחת חקירה נגד חברת אנבידיה (NVIDIA), בחשד שהיא הפרה את החוקים של סין בנושא מונופולים. לפי ההודעה, עילת החקירה היא העיסקה שבה רכשה חברת אנבידיה את מלאנוקס הישראלית בשנת 2020 תמורת כ-6.9 מיליארד דולר. סין היתה המדינה האחרונה שאישרה את העיסקה, אבל כעת היא משתמשת בה כדי לנגח את אנבידיה. על-פי ההודעה, הרשות החליטה לחקור מחדש את האישור שניתן לפני ארבע שנים לביצוע העיסקה.

החקירה כמובן לא יכולה לבטל את המיזוג בין מלאנוקס ואנבידיה, אולם עשויה לעלות לאנבידיה ביוקר: על-פי החוק בסין, הקנס על מונופולים יכול להגיע לעד 10% מהמכירות השנתיות של החברה הניקנסת. במקרה של אנבידיה מדובר בקנס של כמיליארד דולר, לאור העובדה שמכירותיה בסין בשנת 2023 הסתכמו בכ-10.3 מיליארד דולר. סין כבר הוכיחה שהיא לא מהססת לנצל את הסעיף הזה: בשנת 2015 היא קנסה את קואלקום בסכום של 975 מיליון דולר, שהיה שווה-ערך לכ-8% ממכירותיה בסין בשנת 2013.

מכת-נגד לאיסור הייצוא האמריקאי

למרות שהרשויות בסין לא מוסרות מידע נוסף על החקירה שהוצאה מהנפטלין, העיתון China Daily רמז על קשר ישיר בינה לבין מלחמת הסחר עם ארה"ב, ועל האיסור שארה"ב הטילה על מכירת שבבים מתקדמים לסין. הוא ראיין את פרופ' דנג פנג מהפקולטה למשפטים באוניברסיטת בייג'ין, אשר הסביר שאנבידיה מסרבת למכור לחברות סיניות סוגים מסויימים של מעבדי GPU ופתרונות תקשורת מהירים שפותחו במלאנוקס, למרות שהתחייבה לא להפלות לרעה את הלקוחות הסיניים.

פנג אמר שהעילה המשפטית מבחינת סין מבוססת על הטענה ש"המהלך שנקרא בארה"ב בשם 'בקרת ייצוא' (export control) אינו סיבה מוצדקת להפרת ההתחייבויות של אנבידיה. ואם היא לא יכולה לעמוד בהתחייבויותיה, עליה לספק לפחות פיצוי כלשהוא או אלטרנטיבה שיאפשרו למזער את ההשפעות השליליות של בקרת הייצוא". לאחר ההודעה הסינית ירדה מניית אנבידיה בכ-3.7% בבורסת נסד"ק, וכעת היא נסחרת לפי שווי חברה של כ-3.4 טריליון דולר.

ראוי לציין שבגלל מעמדה הדומיננטי בשוק (לפי ההערכות בתעשייה, אנבידיה מחזיקה בכ-84% משוק ה-GPU העולמי), היא מתמודדת עם חקירות נוספות של גופי שמירה על התחרותיות. האיחוד האירופי שלח לאחרונה שאלון לחברות בתעשייה כדי לבדוק האם צריך לפתוח נגדה בחקירה על מונופול בתחום מעבדי ה-GPU, ומשרד המסחר בארה"ב החל לבדוק טענות דומות נוספות. אולם החקירות האלה נובעות מסיבות שונות לחלוטין, ואינן קשורות למאבק הבין גושי.

תגובת חברת אנבידיה ל-Techtime: “אנבידיה מובילה בזכות יכולותיה, כפי שמשתקף בביצועים של המוצרים שלנו ובערך שאנו מעניקים ללקוחות. לקוחות יכולים לבחור בכל פתרון שהם מוצאים לנכון. אנו עובדים קשה כדי לספק את המוצרים הטובים ביותר בכל אזור בעולם ומכבדים את ההתחייבויות שלנו בכל מקום שבו אנו פועלים. אנחנו שמחים לענות על כל שאלה שעשויה להיות לרגולטורים לגבי פעילותנו״.

אנבידיה סיפקה 13 אלף מעבדי בלאקוול ברבעון

הלילה (בין רביעי לחמישי) שוב עקפה חברת אנבידיה (Nvidia) את התחזיות של האנליסטים ושל עצמה, כאשר דיווחה על התוצאות הכספיות לרבעון השלישי. הכנסותיה של ענקית השבבים ברבעון השלישי של שנת הכספים 2025 (שהסתיים באוקטובר 2024) הסתכמו בכ-35.1 מיליארד דולר, שהוא נתון שיא אשר מציג צמיחה של 17% בהשוואה לרבעון הקודם, וצמיחה של 94% בהשוואה לרבעון המקביל אשתקד. מירב הפעילות של אנבידיה כיום הוא בתחום מרכזי הנתונים, ותחום זה היה אחראי ברבעון ה-3 למכירות של כ-30.8 מיליארד דולר – עלייה של 17% בהשוואה לרבעון הקודם ו-112% בהשוואה לרבעון המקביל אשתקד.

ההכנסות מתחום הגיימינג, שהוא תחום הפעילות המקורי של החברה, הם כעשירית מהמכירות, והסתכמו בכ-3.3 מיליארד דולר בלבד (15% צמיחה בהשוואה לרבעון המקביל אשתקד). החברה צופה כי הצמיחה המואצת תימשך גם ברבעון הבא, שבו היא מקווה להגיע להיקף מכירות של כ-37.5 מיליארד דולר. באשר למאיץ ה-AI החדש, Blackwell, החברה ניסתה אתמול להרגיע את הלקוחות לאחר שבחודשים האחרונים התפרסמו דיווחים על בעיות טכניות שנתגלו במעבר לייצור סדרתי אצל חברת TSMC הטאיוואנית. אנבידיה עידכנה שהיא השלימה בהצלחה את ההתאמות הנדרשות, ושהמעבד נמצא כעת בייצור סדרתי מלא.

במהלך הרבעון השלישי שלחה אנבידיה כ-13 אלף דוגמאות של המעבד החדש לכל לקוחותיה המרכזיים. החברה מעריכה כי מכירות בלאקוול ברבעון הרביעי יהיו גבוהות מכפי שצפתה בתחילה. "הביקוש לבלקוול מרקיע שחקים ואנחנו עושים את כל המאמצים כדי להיענות להזמנות מצד לקוחותינו", אמר מייסד ומנכ"ל אנבידיה, ג'נסן הואנג. למרות התוצאות הטובות הדו"ח לא השפיע מהותית על מניית החברה בנסד"ק, מכיוון שכמו שהגדירו זאת מספר אנליסטים, "אנבידיה עקפה את התחזיות – אבל לא את הציפיות". כיום החברה נסחרת לפי שווי שוק של כ-3.58 טריליון דולר.

Israel-1 נכנס לדירוג TOP500 של מחשבי על

בתמונה למעלה: פרט מתוך ישראל-1. צילום: NVIDIA

מחשב העל הישראלי, Israel-1, מדורג במקום ה-34 ברשימת TOP500 של מחשבי העל המהירים בעולם, שנחשפה השבוע בכנס למחשוב עתיר ביצועים (SC24) באטלנטה, ג׳ורג׳יה. המחשב הוכרז בתערוכת Computex 2023 כתבנית לבניית מחשביעל המבוססים על שימוש בפלטפורמת התקשורת NVIDIA Spectrum-X שפותחה בישראל. הוא משמש למחקר ופיתוח פנימיים בחברת אנבידיה ולעבודה עם שותפים. בנובמבר 2023 הודיעה אנבידיה על השלמת השלב הראשון בהקמתו, וזמינותו לעבודה.

אשכול המחשבים (Cluster) של ישראל-1 שהוגש לדירוג TOP500 מורכב מ-117 מערכות HGX H100 שסופקו על-ידי חברת Dell Technologies אשר כוללות 936 מעבדים גרפיים (GPU) מדגם H100 80GB. האצת העיבוד והסטת העומסים מתבצעת על-ידי פלטפורמת התקשורת Spectrum-X, הכוללת את מתגי האיתרנט Spectrum-4 ואת שבבי BlueField-3 SuperNIC. בנוסף, המחשב כולל 256 מערכות HGX H100 עם 2,048 מעבדים גרפיים מדגם H100 80GB ובהם יותר מ-34 מיליון ליבות CUDA וכמיליון ליבות Tensor מהדור הרביעי, 2,560 שבבי BlueField-3 DPU ו-SuperNIC, ועשרות מתגי Spectrum-4.

בהמשך, מחשב העל המקומי צפוי להיות זמין לשימוש באקוסיסטם הישראלי במסגרת שירות NVIDIA DGX Cloud, המספק תשתית AI באמצעות הענןפלטפורמת Spectrum-X שפותחה באנבידיה ישראל, מיוצגת כעת ברשימת TOP500 על-ידי שתי מערכות: המחשב Israel-1 והמחשב GMO GPU Cloud של ספקית שירותי הענן היפנית GMO. סגן נשיא אנבידיה לקישוריות (Networking), גלעד שיינר, אמר שישראל-1 ישמש כמנוע צמיחה וחדשנות ויסייע להציב את ישראל בחזית מהפיכת הבינה המלאכותית. ״אנחנו מצפים בכיליון עיניים לראות את התגליות והחידושים שהוא יסייע להביא לעולם״.

AMD השיקה מאיץ AI מתחרה לבלקוול של אנבידיה

בתמונה למעלה: מנכ"לית AMD, ליסה סו, בהשקת המוצרים החדשים. מקור: AMD

חברת AMD חשפה בסוף השבוע מאיץ AI חדש למרכזי נתונים, שאמור להתחרות בשבב Blackwell שהשיקה אנבידיה לפני מספר חודשים. על-סמך מבדקים שערכה AMD, השבב החדש שלה מציג ביצועים גבוהים יותר מהבלקוול בכמה פרמטרים.

עם זאת, בעוד אנבידיה התהדרה בעת השקת בלקוול ברשימת לקוחות מרשימה, שכללה חברות כמו מיקרוסופט, מטא ואמזון, שהזמינו מראש את השבב, AMD הציגה רשימה קצת פחות זוהרת של לקוחות ראשונים, שכללה חברות כמו דל, HP, לנובו, Eviden, סופרמיקרו וג'יגהבייט. לפי ההערכות, אנבידיה חולשת על כ-90%-95% משוק ה-GPU למרכזי נתונים. כעת, הבלקוול והמאיץ החדש של AMD יוצאים לשוק במקביל, וב-AMD מקווים לנגוס מעט מנתח השוק של אנבידיה. בשוק גם יעקבו לראות האם התחרות בתחום תביא את אנבידיה, שמוכרת את שבביה בשולי רווח של כ-75%, להוריד מחירים.

המאיץ החדש, Instinct MI325X, מיועד לאימון מודלי יסוד (foundation model) של בינה מלאכותית יוצרת (GenAI) והרצת המודלים הללו ("הסקה"). הוא כולל זיכרון רחב-פס מהדור השלישי (HBME3) בקיבולת של 256 ג'יגה-בייט ומספק רוחב-פס של 6 טרה-בייט לשנייה. על פניו, מדובר ברוחב-פס ובקיבולת נתונים הגבוהים פי 1.3 ו-1.8, בהתאמה, מהביצועים של הבלקוול של אנבידיה. לפי המבדקים של AMD, השבב שלה מסוגל עוצמת עיבוד מקסימלית גבוהה פי 1.3 מביצועי השיא של בלקוול.

להערכת AMD, קיבולת הזיכרון הגבוהה של השבב החדש מאפשרת לו להריץ בפועל (הסקה) מודלי שפה גדולים כמו Lamma של מטא, במהירות גבוהה פי 1.4 מאשר בלקוול של אנבידיה. אינדיקציה נוספת לנחישות AMD להתחרות באנבידיה בשוק שבו היא שולטת ברמה כמעט מונופוליסטית, היא הצהרתה שבשנתיים הקרובות היא תשיק עוד שני דורות של מאיצי AI: בשנת 2025 תשיק את המאיץ MI350 ובשנת 2026 את המאיץ MI400.

תחרות מול אינטל בעולם ה-CPU

ברבעון השני של 2024 הסתכמו מכירותיה של AMD בתחום מרכזי הנתונים בכ-2.8 מיליארד דולר, כמעט פי שניים מהיקפן ברבעון המקביל אשתקד. מתוך הסכום זה, כמיליארד דולר הגיעו ממכירת מאיצי AI, והיתר ממעבדים מרכזיים (CPU) למרכזי נתונים, שוק שבו AMD מתחרה ישירות מול אינטל ומחזיקה להערכתה, בכ-34% מהשוק. בשבוע שעבר השיקה AMD את הדור החמישי של EPYC, משפחת מעבדי ה-CPU שלה למרכזי נתונים. המעבד מיועד להתחרות במעבד Xeon 8592 של אינטל. הוא מגיע בתצורות שונות בעלות 8-192 ליבות. במקביל היא הכריזה על מעבד נוסף שיתחרה באינטל: Ryzen AI PRO 300 התומך ביישומי AI ויתחרה ב-Core Ultra 9 שאינטל השיקה בשבוע שעבר.

אנבידיה חשפה כלים לפיתוח רובוטים דמויי-אדם

בתמונה למעלה: אימון רובוט דמוי-אדם לביצוע מטלות אנושיות. צילום: אנבידיה

חברת אנבידיה (NVIDIA) חשפה חבילה של תוכנות ועידכונים שנועדו לסייע בפיתוח דור חדש של רובוטים דמויי-אדם (Humanoid Robots), ולשלב אותם בקוויי ייצור. "הגל הבא במהפכת הבינה המלאכותית הוא רובוטיקה", אמר מנכ"ל ומייסד אנבידיה, ג'נסן הואנג. "אחד מהכיוונים המרגשים ביותר בתחום הזה הוא של רובוטים דמויי-אדם". החברה הכריזה על חבילה של מיקרושירותים ותשתיות תוכנה (NVIDIA NIM Microservices) לאימון וסימולציה של רובוטים.

המיקרו-שירותים האלה הן למעשה תוכנות בינה מלאכותית שאומנו מראש, זמינות בקונטיינרים ומאפשרות למפתחים לצמצם את משך ההטמעה של יישומים שונים. בתחום הרובוטים, המיקרו-שירותים החדשים זמינים בפלטפורמת NVIDIA OSMO, שהיא שירות תזמור (Orchestration) מבוסס ענן המאפשר לתזמר תהליכי עבודה בסביבות מרובות רובוטים על-גבי משאבי מחשוב מבוזרים, בין אם הם נמצאים אצל הלקוח (On-Prem) או בענן.

תאימות לתקן OpenUSD

השירות מאפשר להפעיל מספר גדול של רובוטים הפועלים ביחד, וכולל גם תוכנה מבוססת סימולציה ובינה מלאכותית לתהליכי אימון של רובוטים, המבוססת על חיקוי תנועה של בני אדםתהליך האימון כולל שימוש בהקלטות מכשירי מחשוב מרחבי (Spatial Computing) מופעלים מרחוק, כמו למשל משקפי Apple Vision Pro המסייעים למפתחים להקנות מיומנויות וכישורים לרובוטים דמויי-אדם. לצד השירותים האלה השיקה אנבידיה את שירות MimicGen NIM, מאפשר לייצר בסיס נתונים סינתטי של תנועת הרובוטים במרחב, על בסיס ההקלטות. השירות מאפשר לייצר משימות וסביבות סימולציה בתקן OpenUSD, שהוא תקן אוניברסלי לפיתוח סימולציות ולעבודה שיתופית בתלתממד.

במקביל, החברה הכריזה על תוכנית Humanoid Robot Developer Program, המעניקה גישה מוקדמת לפיתוחים החדשים של אנבידיה ולגרסאות האחרונות של פלטפורמות הרובוטיקה NVIDIA Isaac Sim, NVIDIA Isaac Lab, Jetson Thor ו-Project GR00T. בין החברות שהצטרפו לתוכנית: בוסטון דיינמיקס, Mentee, Field AI ועוד. ההכרזות בוצעו במסגרת כנס הגרפיקה הממוחשבת SIGGRAPH המתקיים בימים אלה בדנבר, קולורדו.

אנבידיה רוצה למכור לסין, ארה"ב מהדקת את החרם

חברת אנבידיה (Nvidia) מחפשת דרכים יצירתיות להגדיל את מכירותיה בתחום מרכזי הנתונים בסין, וזאת חרף המגבלות המחמירות של הממשל האמריקאי, האוסרות מכירה של טכנולוגיות מתקדמות בתחום הבינה המלאכותית למעצמה היריבה.

לפי דיווח בסוכנות הידיעות רויטרס, אנבידיה מפתחת בימים אלה, בשיתוף המפיצה שלה בסין Inspur, גרסה מותאמת למעבד ה-AI החדש שלה, Blackwell, והיא תושק בסין ברבעון השני של 2025. בדומה לגרסאות מותאמות קודמות של אנבידיה לשוק הסיני, המעבד צפוי להציע יכולות עיבוד נמוכות יותר, שלכאורה לא יאפשרו לסין לרתום אותו לצורך פיתוח יישומים צבאיים שיסכנו את הביטחון הלאומי של ארצות הברית.

הממשל האמריקאי החל עוד ב-2022 להטיל מגבלות על מכירה לסין של שבבים מתקדמים וטכנולוגיות מתקדמות לייצור שבבים. עבור אנבידיה, ברמה העסקית, זוהי מכה משמעותית, וזאת לאור העובדה כי ב-2022 סין היתה אחראית לכרבע ממכירותיה בתחום מרכזי הנתונים. בתגובה, אנבידיה מנסה לשמר את נתח השוק שלה בסין באמצעות פיתוח גרסאות "סיניות" למעבדיה החדישים.

עם זאת, המאמצים הללו של אנבידיה מגיעים בעיתוי לא מיטבי, כאשר נושא מלחמת הסחר מול סין מהווה נושא מרכזי במערכת הבחירות בארצות הברית, כאשר גם הדמוקרטים וגם הרפובליקנים מציגים קו נוקשה. בבלוג הטכנולוגי המוכר Tom's Hardaware, מדווחים כי בית ההשקעות Jefferies העריך במכתב ללקוחות כי ארצות הברית תחמיר בקרוב את מגבלות המכר, כך שאנבידיה לא תוכל למכור יותר לשוק הסיני את המעבד הגרפי HGX H20.

ה-HGX H20 בעצמו הוא גרסה ייעודית שפיתחה אנבידיה עבור השוק הסיני, שהחברה השיקה בחודש נובמבר 2023, כחודש לאחר שהממשל האמריקאי החמיר את מגבלות הייצוא. ה-HGX H20 מתבסס על מעבד ה-AI הנוכחי של אנבידיה, H100, אך הוא מציע יכולות עיבוד מופחתות של 296 טרה פעולות לשנייה (TPLOPS).

לפי הדיווח, הממשל אמור להתכנס בחודש אוקטובר כדי לדון במגבלות הייצוא, וייתכן כי מה שיוביל לאיסור על מכירת ה-HGX H20 הוא מרכיבי הזיכרון העוצמתיים שכולל המעבד: 96 ג'יגה-בייט של זיכרון רחב-פס מתקדם (HBM3). אלמנט זה הופך את המעבד לעוצמתי יותר הלכה למעשה בהשוואה למעבד ה-AI שפיתחה וואווי הסינית, שלכאורה מציע מהירות עיבוד גבוהה יותר במונחי TOPS. לפי ההערכה של בית ההשקעות ג'פריז, איסור כזה עשוי להוביל לאובדן מכירות בהיקף של 12 מיליארד דולר עבור אנבידיה.

[מקור תמונה עליונה: אנבידיה]

קרנות רוכשות מעבדי אנבידיה כדי לפתות חברות סטארט-אפ

התקשורת הפיננסית בארצות הברית מדווחת על תופעה חדשה ומפתיעה בעולם ההון-סיכון. לפי הדיווחים, מספר קרנות הון-סיכון (VC) החלו לבנות באופן עצמאי שרתי נתונים עם אלפי, ולעיתים עשרות אלפי, מעבדים גרפיים (GPU) של אנבידיה, וזאת במטרה למשוך אליהן חברות סטארט-אפ בתחום ה-GenAI.

לפי דיווח ב-CNBC, קרן ההון-סיכון Andreessen Horowitz (ידועה גם בשם a16z) מקליפורניה, הצטיידה בתקופה האחרונה בעשרות אלפי מעבדים גרפיים של אנבידיה, בהשקעה של מאות מיליוני דולרים, וזאת כדי למשוך אליה סטארט-אפים בתחום ה-AI. אנדריסן-הורוביץ' נחשבת לקרן ההון-סיכון הגדולה בארצות הברית, עם נכסים מנוהלים בהיקף של 42 מיליארד דולר. היא משקיעה בסטארט-אפים בשלבים מוקדמים וגם בחברות צמיחה, ובתקופה הנוכחית שמה דגש על תחום הבינה המלאכותית.

לפי הדיווח ב-CNBC, באמצעות משאבי העיבוד שברשותה מעוניינת אנדריסן-הורוביץ' למשוך חברות סטארט-אפ לפורטפוליו שלה. לשיטתה של הקרן, כיום קשה יותר להשיג גישה למשאבי עיבוד חדישים מאשר להון, ועל כן הגישה שהקרן תספק לסטארט-אפים בתחום ה-GenAI, שזקוקים למשאבי עיבוד כחלק מתהליכי המו"פ, תסייע לה לסגור איתם עסקאות.

"נכס פיננסי" מסוכן

ועם זאת, שימוש זה ב-GPU כ"נכס פיננסי" נושא סיכון כמו כל השקעה פיננסית, וזאת במידה ומחירי ה-GPU יירדו דרמטית. זהו התרחיש שמפניו מזהיר דיוויד קאן, אנליסט בקרן ההון-סיכון Seuoia Capital. בנייר עמדה תחת הכותרת "AI ושאלת 600 מיליארד הדולר", מעלה קאן תהיות עד כמה בר-קיימא המודל העסקי שעומד מאחורי ההצטיידות המאסיבית של חברות במעבדי אנבידיה. לפי החישוב שהוא מציג, אנבידיה אמורה למכור עד סוף השנה מעבדים וחומרה למרכזי נתונים בהיקף של כ-150 מיליארד דולר. לכך יש להוסיף סכום נוסף של כ-150 מיליארד דולר בעבור עלויות תפעוליות, כדוגמת מבנים, מערכות גיבוי ועבור צריכת אנרגיה. אותן חברות שרוכשות את המעבדים ירצו בסופו של דבר לגבות כסף בעבור שירותי ה-AI שהן מפתחות.

מהנחה ששולי הרווח המבוקשים יהיו 50%, הוא הגיע לסכום השקעה משוער של כ-600 מיליארד דולר, כאשר לפי ההערכות בתעשייה ההכנסות הצפויות מההשקעה הזו יסתכמו לכל היותר בכ-100 מיליארד דולר. הוא הזהיר שהמחסור בהיצע ה-GPU שאיפיין את שנת 2023 והעלה את מחירם, שכך במידה רבה. "חברות הסטארט-אפ התקשרו לכל מי שיכלו כדי להשיג גישה למעבדי GPU. היום החשש הזה התפוגג. אנשים מהתעשייה מדווחים שדי פשוט לרכוש מעבדים בזמני אספקה סבירים".

אנבידיה משיקה בימים אלה מעבד חדש לשרתי נתונים, B100, שיהיה בעל ביצועים גבוהים פי 2.5 מקודמו, H100, ויהיה יקר רק ב-25%. קאן צופה כי מעבד זה יסמן את הגל המאסיבי האחרון של הצטיידות במעבדי אנבידיה בקרב ארגונים. הוא סיכם: "אל לנו ללכת שבי אחר האשליה שמפמפמים בעמק הסיליקון, ואשר התפשטה בכל המדינה, ולפיה כולנו נתעשר במהרה אם רק נצבור מלאים של מעבדים גרפיים. שהם המשאב החשוב היחיד".