מלאנוקס הכניסה ארבעה מתאמים למחשב DGX של אנבידיה

25 אוקטובר, 2017

המחשב מבוסס על מעבדים גרפיים ומיועד למשימות בינה מלאכותית. כרטיסי התקשורת של מלאנוקס מאפשרים למחשבי DGX-1 לתקשר אחד עם השני בקצב של עד 200Gb/s ולספק השהייה נמוכה מאוד של 0.6μs בלבד

NVIDIA DGX Computer with Mellanox Adapters

המחשב המקבילי החדש של אנבידיה לפיתוח תוכנות בינה מלאכותית, DGX, מגיע לשוק ביחד עם ארבעה כרטיסי תקשורת של חברת מלאנוקס המצויים בתוך המארז של המחשב. הכרטיסים מסוג ConnectX-4 EDR 100Gb/s InfiniBand HCA, מקשרים בין המחשב למערך הזיכרון בטכנולוגיית GPUDirect RDMA שפותחה במסגרת שיתוף פעולה בין מלאנוקס לבין חברת אנבידיה.

המחשב DGX-1 של אנבידיה הוא אחד מהמוצרים החשובים של החברה: זהו מחשב המבוסס על מעבדים גרפיים (GPU) ומיועד למשימות בינה מלאכותית, ובעיקר לאימון רשתות מיחשוב נוירוניות במשימות למידה עמוקה (Deep Learning). לצד מחשב DGX אשר מבצע את עבודת המיחשוב המאסיבית של תהליך הלימוד, הוציאה חברת אנבידיה גם את סדרת מחשבי Jetson שהם מחשבים קטנים ופשוטים יותר אשר מריצים בנקודות הקצה את ההסקות (Inferences) שהופקו בתהליך הלימוד שנעשה במחשבים החזקים דוגמת DGX.

שיתוף הפעולה בין מלאנוקס ואנבידיה נמשך מספר שנים וקשור בין השאר למשקלם הגובר של מעבדי GPU במרכזי מיחשוב על. מערכים של מחשבי GPU מוקמים כדי לבצע משימות עתירות חישוב שיש בהן יתרון למקביליות, דוגמת חישובי דינמיקה של נוזלים, הדמיות מולקולריות, משימות בינה מלאכותית תובעניות וכדומה. מכיוון שמדובר במחשבים מרובי ליבות המטפלים בו-זמנית בכמויות גדולות של מידע, הם מקושרים באמצעות פרוטוקול InfiniBand המהיר.

אלא שהביצועים של מערכי מחשבים כאלה נתקלו בצוואר בקבוק של התקשורת: כדי לקשר ביניהם היה צורך להעביר את המידע דרך מעבד ה-CPU המנהל את המערך, והדבר כלל העתקת המידע בחוצץ מיוחד בזיכרון לפני העברות האלה. טכנולוגיית GPUDirect RDMA התגברה על הבעיה באמצעות שימוש במעבדי ConnectX של מלאנוקס המספקים מעבר ישיר העוקף את ה-CPU ומקשר במהירות את מחשבי ה-GPU הנמצאים במערך (Cluster).

GPUDirect connection

עבור אנבידיה, המחשב החדש הוא בעל חשיבות אסטרטגית, ומיועד להביא אותה לחברה המובילה את תחום המחשבים הייעודיים למערכות בינה מלאכותית. מדובר במחשב הכולל 8 שבבי Tesla V100 אשר מריצים 40,960 ליבות CUDA, כוללים מעבד אינטל Xeon בעל 20 ליבות, מצויידים בזיכרון פנימי של 128GB ומגיעים לעוצמת עיבוד של 960TFLOPS. להערכת אנבידיה, מדובר בעוצמת עיבוד של כ-250 שרתים סטנדרטיים.

הכרטיסים של מלאנוקס מאפשרים למחשבי DGX-1 לתקשר אחד עם השני בקצב של עד 200Gb/s ולספק השהייה נמוכה מאוד של 0.6μs בלבד. למעשה, הכרטיסים עמדו מאחורי היכולת של אנבידיה לבצע את פרוייקט מחשב העל SaturnV Machine Learning Supercomputer שבמסגרתו היא חיברה 124 מערכות DGX באמצעות כרטיסי הקישוריות של מלאנוקס. התוצאה: מחשב על ה-28 בעוצמתו בעולם.

Mellanox ConnectX-4 EDR
כרטיס ConnectX-4 100Gb/s InfiniBand של מלאנוקס
Share via Whatsapp

פורסם בקטגוריות: חדשות , מחשבים ומערכות משובצות , תקשורת