אנבידיה מחזירה את ה-CPU למרכז, אבל דוחקת את אינטל לשוליים

מאת: יוחאי שויגר

אנבידיה חשפה אתמול (ב') בכנס GTC לראשונה את התצורה המלאה של פלטפורמת Vera Rubin, שהיא הדור הבא של תשתיות בינה מלאכותית שנועד לתמוך בעידן הסוכנים (Agentic AI). בניגוד לדורות קודמים שהתבססו על שרתים בודדים, Rubin מוצגת כמערכת שלמה בתצורת rack-scale, שבה מספר ארונות ייעודיים פועלים יחד כסוג של “מפעל AI” מלא.

הארכיטקטורה כוללת מספר סוגים של מסדים (racks), שכל אחד מהם אחראי על שכבה אחרת במערכת: GPU racks מבוססי Rubin מבצעים את החישובים הכבדים דוגמת אימון מודלים והסקה בזמן אמת, CPU racks מנהלים את סביבת העבודה, הסוכנים השונים והלוגיקה התפעולית, מסדי האיחסון (storage racks) מנהלים את משאבי הזיכרון וההקשר (context) של מודלים גדולים, ומסדי קישוריות (networking racks) מחברים את כל המערכת באמצעות תשתיות תקשורת מהירות. לצד אלה משולבים גם מאיצי הסקות ייעודיים המיועדים להאיץ את תהליך הפקת התשובות.

ה-CPU חוזר למרכז הבמה

אחד מהחידושים הבולטים בארכיטקטורה בא לידי ביטוי במסד Vera CPU rack: ארון ייעודי המכיל מאות מעבדים ונועד להתמודד עם עומסי העבודה החדשים של סוכני AI. בעולם ה-AI המסורתי, עיקר העומס היה על ה-GPU, בעוד שה-CPU שימש כרכיב תומך. אך בעידן הסוכנים, חלק גדול מהפעילות עובר דווקא ל-CPU: הרצת קוד, הפעלת כלים, ניהול תהליכים, בדיקות תוצאה וסימולציות. בכל מסד מותקנים עד 256 מעבדי Vera. הוא יכול להריץ עשרות אלפי סביבות CPU במקביל, כאשר כל סביבה פועלת באופן עצמאי.

המעבד עצמו מבוסס על 88 ליבות נפרדות בעלות רוחב פס גבוה של עד עד 1.2 טרה־ביט לשנייה. אחד ההיבטים הקריטיים כאן הוא החיבור הישיר שבין ה-CPU ל-GPU באמצעות NVLink, שמאפשר שיתוף נתונים במהירות גבוהה. המשמעות היא שה-CPU כבר אינו רק “מנהל” את ה-GPU, אלא חלק אינטגרלי מהחישוב עצמו.

התפקיד החדש של אינטל

במקביל להכרזה של אנבידיה, הודיעה חברת אינטל שמעבדי Xeon 6 שלה נבחרו לשמש כמעבקים המארחים (Host CPU) במערכות DGX Rubin NVL8 של אנבידיה. מדובר בשרתים הכוללים 8 מעבדי GPU ומהווים את יחידת הבסיס של המערכת.במערכות האלו אחרי מעבד Xeon אחראי על ניהול ה-GPU, תזמון משימות והזרמת נתונים. היתרונות המרכזיים של Xeon בהקשר זה הם תמיכה בנפחי זיכרון גדולים במיוחד, רוחב פס גבוה ותאימות רחבה לתשתיות קיימות.

המעבד תומך בנפח זיכרון של עד 8 טרה-בייט המאפשר טיפול במודלי AI גדולים ובמטמוני KV cache גדולים בתהליך ההסקה. אינטל שילבה בו את טכנולוגיית הזיכרון החדשה MRDIMM המספקת רוחב פס מהיר פי 2.3 בהשוואה לדור הקודם, ואת טכנולוגיית Priority Core Turbo להקצאת ליבות ייעודיות למשימות תזמור קריטיות, ואת טכנולוגיית האבטחה Intel TDX. היא מספקת הגנה והצפנה של זיכרון ומצב ה-CPU בסביבות AI, כך שמודלים ומידע רגיש נשמרים מוגנים גם בזמן העיבוד עצמו. קבוצות הפיתוח של אינטל בישראל המתמחות באבטחת חומרה, וירטואליזציה ופתרונות Confidential Computing למרכזי נתונים ול-AI מילאו תפקיד מרכזי בפיתוח טכנולוגיית TDX.

עם זאת, בארכיטקטורה החדשה של Rubin, תפקיד זה הופך לחלק קטן יותר מהתמונה הכוללת. המעבר מ-Blackwell ל-Rubin ממחיש היטב את השינוי: בדור הקודם, מערכות AI התבססו בעיקר על שרתים מסוג DGX או HGX, שבהם כל יחידה כללה GPU של אנבידיה לצד מעבד CPU (לרוב של אינטל). כלומר, ה-Xeon היה רכיב מרכזי כמעט בכל שרת. בפלטפורמת Rubin, לעומת זאת, המערכת כבר אינה מבוססת על אוסף של שרתים זהים, אלא על מערך הטרוגני של מסדים ייעודיים בעלי תפקידים שונים.

ה-Vera CPU rack הופך לשכבה שמריצה את הסוכנים ואת הלוגיקה של המערכת כולה, בעוד שמעבדי Xeon נותרים בעיקר בתפקיד ה-host במערכות NVL8. במילים אחרות, אינטל עדיין נמצאת בתוך המערכת — אך כבר אינה מהווה את הבסיס שלה. התמונה הכוללת מתבהרת: אנבידיה ממשיכה במסע הארוך המיועד להביא אותה למצב שבו היא מחזיקה בשליטה מלאה בכל תשתיות הבינה המלאכותית: מה-GPU דרך ה-CPU ועד לרשת ולאחסון.

ראוי לציין שלמרות שהיא ששיתוף הפעולה עם אינטל הוא ארוך טווח ואסטרטגי, החברה בונה במקביל אלטרנטיבה פנימית שמציבה אותה בעמדה חזקה יותר לאורך זמן. יותר מזה, הפלטפורמה החדשה מעצבת מחדש את מבנה מרכזי הנתונים. המעבר משרתים כלליים לתשתיות ייעודיות ל-AI שבהן גם המעבד המרכזי מותאם לעידן הסוכנים, עשוי להגדיר מחדש את לא רק את מבנה "מפעל ה-AI", אלא גם את חלוקת התפקידים בין ענקיות השבבים.

נאום הפתיחה אמש של מנכ"ל אנבידיה ג'נסן הואנג ב-GTC:

אינטל השלימה את השקת משפחת מעבדי Xeon 6

חברת אינטל הכריזה על השלמת ההשקה של משפחת המעבדים החדשה, Xeon 6, אשר כוללת האצת AI מובנית ומיועדת לשרתים חזקים במרכזי נתונים גדולים ובמערכות טלקום. בכך הגשימה אינטל את המהלך שהחל בחודש יוני 2024 עם השקת המעבד החזק ביותר במשפחה, Xeon 6900E הכולל עד 144 ליבות ביצועים, נמשך בספטמבר 2024 עם השקת מעבדי Xeon 6900P הכוללים 128 ליבות ביצועים (P-cores), והושלם כעת עם השקת המשפחה המלאה. ההכרזה החדשה נערכת ערב תערוכת MWC 2025 שתיפתח ב-3 במרץ בברצלונה. החברה מסרה שהמעבדים החדשים כבר מותקנים בכ-500 שרתים, חלקם זמין וחלקם עדיין בפיתוח, של חברות דוגמת אנבידיה, אריקסון, נוקיה, מיקרוסופט, Dell, סיסקו, ATַ&T, סמסונג ועוד. 

המשפחה החדשה כוללת מעבדים אשר הותאמו במיוחד עבור תעשיית התקשורת (טלקום), החל ממעבדים חזקים המותאמים ליישומי רשתות גישה מרכזיות (RAN) ורשתות גישה וירטואליות (vRAN) המנהלים כיום את רוב תעבורת ה-5G, ועד למעבדים המצויים בקצות הרשת ומנהלים יישומי אבטחה ומדיה. בין השאר, הם כוללים את מאיץ המדיה החדש, Intel Media Transcode Accelerator, שלהערכת החברה מזרז פי 14 את מהירות עיבוד אותות הווידאו והתוכן. 

ההכרזה הנוכחית אינה של מעבד חדש, אלא של משפחת מעבדים מלאה. היא כוללת את מעבדי Xeon 6700P/6500P בעלי 86 ליבות למרכזי נתונים, בינה מלאכותית ומחשוב עתיר ביצועים (HPC). הגרסה הזו נועדה להתחרות ישירות במעבדי AMD EPYC. מעבדי Xeon 6 SoC, תוכננו לשימוש ברשתות vRAN ועיבוד בקצות הרשת (Edge) ומבצעים מטלות ניתוח נתונים ולימוד מכונה ישירות מהמעבד בלא צורך במאיץ חיצוני. אחד משוקי היעד שלהם הוא מתן תמיכה לכרטיסי עיבוד של חברת אנבידיה. 

המנכ"לית הזמנית של קבוצת דטה סנטר ובינה מלאכותית, המשמשת גם כמנכ"לית משותפת של אינטל ישראל, קרין אייבשיץ סגל, אמרה שמעבדי Xeon 6 החדשים, "מהווים קפיצת מדרגה משמעותית ביכולות המחשוב".

אבטחה ותקשורת ישראליות לנתוני ה-AI בענן

במסגרת ההשקה, מציגה אינטל את טכנולוגיית Intel TDX Connect, שלצוותי הפיתוח בישראל יש תפקיד מרכזי בפיתוחה. טכנולוגיית TDX Connect מרחיבה את השימוש בסביבת ביצוע מאובטחת (Trusted Execution Environment) לכל אורך שרשרת העיבוד, מהמעבד הראשי ועד מאיצי בינה מלאכותית, ובכך מאפשרת הגנה מקיפה יותר על נתונים רגישים. הטכנולוגיה מאפשרת תקשורת מאובטחת ומהירה במיוחד בין המעבד למאיצים, ומבטיחה שהמידע הרגיש יישאר מוגן בכל שלבי העיבוד. כך למשל, חברות יכולות להריץ מודלים של AI על נתונים רפואיים או פיננסיים בלי לחשוש מדליפות מידע.

הצוות הישראלי שפיתח את TDX Connect
הצוות הישראלי שפיתח את TDX Connect

מרכז הפיתוח של אינטל בישראל עומד מאחורי שני מוצרי Ethernet חדשים המוצגים בתערוכה: Intel Ethernet E830 ו-Intel Ethernet E610. שניהם נבנו כדי לענות על צורכי עולם הבינה המלאכותית, ולספק תעבורה מהירה ויעילה יותר שיכולה להתמודד עם כמויות הנתונים הגדולות שיישומי AI דורשים במרכזי נתונים וברשתות תקשורתה-E830 מגיע עם אפשרויות שונות – ממתאמים פשוטים שמעבירים 25 גיגהביט לשנייה ועד ליכולות חזקות יותר, כמו העברת 200 גיגהביט לשנייה בנתיב אחד או 8 נתיבים של 25 גיגהביטה-E610 מתמקד בחיסכון: הוא מפחית את צריכת החשמל בכ-50%שני המוצרים מיוצרים בטכנולוגיית N7 של TSMC.