אנבידיה הכריזה על ארכיטקטורת Blackwell למחשבי AI

19 מרץ, 2024

מעבדי ה-GPU החדשים מיוצרים בתהליך 4 ננומטר של TSMC, ומורכבים בטכנולוגיית חיבור ישירה שבה כל שני מעבדים (GPU Dies) מחוברים ישירות אחד אל השני. חשפה מחשב על חדש: DGX SuperPOD

חברת אנבידיה (NVIDIA) חשפה את ארכיטקטורת NVIDIA Blackwell המיועדת להאיץ את הביצועים של מחשבים או יישומי בינה מלאכותית המתמודדים עם מטלות אימון (Training) והסקה (Inference) למודלי שפה גדולים (LLMs). להערכת החברה, הארכיטקטוורה מאפשרת לעבד מודלים הכוללים עד 10 טריליון פרמטרים. היא מסרה שבין החברות שהחליטו לאמץ את הארכיטקטורה נמנות גם מיקרוסופט, אמזון, גוגל, Meta, ו-OpenAI. מנכ"ל NVIDIA, ג'נסן הואנג, אמר במהלך ההכרזה: "בינה מלאכותית יוצרת היא הטכנולוגיה המגדירה את זמננו".

ארכיטקטורת Blackwell היא דור המשך לארכיטקטורת NVIDIA Hopper שהושקה לפני שנתיים ומבוססת על האצת הביצועים של מעבדי ה-GPU ואימוץ טכנולוגיית תקשורת פנים חדשה. מעבדי ה-GPU החדשים מיוצרים בתהליך 4 ננומטר של TSMC ומורכבים בטכנולוגיית חיבור ישירה שבה כל שני מעבדים (GPU Dies) מחוברים ישירות אחד אל השני במארג תקשורת העובד במהירות של 10 טרה-בייט לשנייה, ומתפקדים כ-GPU אחד בעל 208 מיליארד טרנזיסטורים.

הארכיטקטורה מונעת על-ידי טכנולוגיית קישוריות הפנים NVLink מהדור החמישי, שפותחה בחלקה בישראל. היא מספקת תקשורת דו-כיוונית בין המעבדים בקצב של עד 1.8 טרה-בייט לשנייה, ומאפשרת לחקר עד 576 מעבדי GPU לצורך יצירת מערך עיבוד שלם, המאפשר להתמודד עם מודלי שפה מורכבים. ביחד עם חשיפת הארכיטקטורה, החברה הכריזה על מחשב על חדש, DGX SuperPOD, אשר מבוסס על ארכיטקטורת Blackwell.

במהלך 2024 ייצאו מחשבים מבוססי Blackwell

אבני הבניין המרכזיות של המחשב הם מעבדי Grace Blackwell החדשים. אחד מהם הוא השבב NVIDIA GB200, אשר מבוסס על חיבור שבב-אל-שבב של GPU מדגם B200 Tensor Core ומעבד CPU מדגם NVIDIA Grace. החיבור הישיר הוא בעל מהירות העברת נתונים של 900 ג'יגהבייט לשנייה, ומספק שיפור של עד פי 30 בביצועים בהשוואה ל-NVIDIA H100 עבור הסקה במודלי שפה גדולים, והפחתה של עד פי 25 בצריכת האנרגיה.

השבבים האלה מותקנים במסד GB200 NVL72, המשמש כאחד מאבני הבניין של מחשב DGX SuperPOD. המסד כולל 72 שבבי Blackwell GPUs ו-36 שבבי Grace CPU, המחוברים האחד לשני באמצעות טכנולוגיית NVLink. הוא מצוייד במערכת קירור נוזלי ובשבבי DPU מדגם NVIDIA BlueField-3 המספקים האצה של רשת התקשורת. המערכת כולה פועלת במתכונת של GPU מאוחד עם זכרון של עד ל-30 טרהבייט, ועוצמת עיבוד של עד 1.4 אקסהפלופס.

כל מחשב DGX SuperPOD מכיל 8 או יותר מערכות DGX GB200 המסוגלות להגיע עד לאלפי שבבי GB200 המחוברים עם NVIDIA Quantum InfiniBand. לטובת יצירת זיכרון משותף עצום שיניע את מודלי הבינה המלאכותית מהדור הבא, לקוחות יכולים לחבר עד 576 יחידות של Blackwell GPus ב-8 מערכותDGX GB200 המחוברות עם NVLink. כמו כן, הדור הרביעי לפרוטוקול SHARP המפותח בישראל, מספק עד ל-14.4 טרהפלופס של יכולות עיבוד ברשת (In-Network Compute), עוצמה גדולה פי 4 בהשוואה לדור הקודם.

חברות הענן יצטיידו ב-Blackwell

החברה מסרה שבמהלך 2024 יהיו זמינים מחשבים ושירותים מבוססי Blackwell על-ידי חברות רבות, בהן חברות הענן AWS, Google Cloud, Microsoft Azure ו-Oracle, שותפות הענן של אנבידיה Applied Digital, CoreWeave, Crusoe, IBM Cloud ו-Lambada. במקביל, ייצאו לשוק שרתים מבוססי Balckwell על-ידי סיסקו, דל טכנולוגיות, HPE, לנובו ו-Supermicro.

סגןנשיא בכיר ל-Networking ב-NVIDIA, גלעד שיינר, אמר שלישראל יש תרומה חשובה לפיתוח הטכנולוגיות החדשות הן משום שטכנולוגיות הנטוורקינג מפותחות בישראל והן משום שמרכזי הפיתוח הישראלים של אנבידיה אחראים על פיתוח מעבדי ה-DPU של החברה ומעבדי ה-CPU שלה – החל מרמת תכנון השבב וכלה ברמת החומרה והתוכנה. כיום אנבידיה מעסיקה כ-3,500 עובדים בישראל, המהווים כ-13% מעובדי החברה העולמית.

Share via Whatsapp

פורסם בקטגוריות: חדשות