השבב של מלאנוקס הפך לאסטרטגיית מרכזי הנתונים של אנבידיה

בתמונה למעלה: כרטיס מיחשוב מבוסס BlueField-2 DPU של אנבידיה

הטכנולוגיה של חברת מלאנוקס קיבלה מעמד מיוחד בכנס המפתחים השנתי (GTC  2020) של חברת אנבידיה המתקיים השבוע, בעקבות ההכרזה על משפחה חדשה של שבבי BlueField, אשר מוגדרים מחדש על-ידי אנבידיה כמעבדים מסוג חדש, ייעודיים למרכזי נתונים, בשם DPU – Data Processing Unit. אנבידיה שילבה את השבבים ביחד עם תוכנת DOCA, וביחד היא מגדירה את השילוב כפתרון הראשון בעולם המבוסס אל ארכיטקטורת מרכז נתונים בשבב (Data Center Infrastructure On a Chip).

"ה-Data Center הפך ליחידת המחשוב החדשה", מייסד ומנכ"ל אנבידיה, ג'נסן הואנג. "וה-DPU הוא מרכיב קריטי במרכזי נתונים מודרניים". טכנולוגיית בלופילד פותחה במלאנוקס לפני כשנתיים במטרה להריץ כרטיסי רשת מהירים (SmartNIC). השבב מהווה מערכת שלמה על-גבי שבב הכוללת את שבב בקרת התקשורת ConnectX, מעבדי ARM מרובי-ליבות, ממשקי תקשורת ל-PCIe ,Ethernet ו-InfiniBand בקצבים של עד 200Gbps, ויכולת גישה מהירה מרוחקת לזיכרון (Remote Direct Memory Access) המקצרת את זמני ההשהייה במרכזי נתונים, ומאפשרת ניהול של מערכי זיכרון מבוססי מוליכים למחצה (NVMe).

במסגרת המהלך, אנבידיה הכריזה על משפחת BlueField 2, הכוללת בינתיים שני מעבדים: מעבד BlueField-2 DPU הכולל את שבב הקישוריות החדש של מלאנוקס, ConnectX-6 Dx, ומעבד BlueField-2X DPU, הכולל מעבדי GPU של אנבידיה בארכיטקטורת Ampere, לצורך ביצוע מטלות אנליטיקה ומעקב של בסיס הנתונים, המבוססות על בינה מלאכותית (AI).

מבחן השוק צפוי ב-2021

פלטפורמת DOCA מספקת פתרון לבניית יישומי תקשורת, אבטחה, אחסון וניהול של מרכז הנתונים, באמצעות DPU ממשפחת BlueField. כלומר השילוב של תוכנת DOCA מאפשר להשתמש בכרטיסים מבוסס בלופילד לפתח יישומי מרכז נתונים מלאים. להערכת אנבידיה, יחידת BlueField 2 DPU אחת בלבד מסוגלת לספק את שירותי תשתית הניתנים היום ממרכז נתונים מלא הכולל עד 125 ליבות CPU, ועל-ידי כך לשחרר את ליבות ה-CPU הקריטיות להרצת יישומים ארגוניים אחרים.

למעשה, אנבידיה לוקחת את הרעיון המקורי של מלאנוקס של הרחבת הפונקציות המנוהלות על-ידי מעבדי-עזר, צעד אחד קדימה, ומכריזה עליו כעל ארכיטקטורה חדשה של מרכזי נתונים. בהכרזה אתמול היא דיווחה שמספר יצרניות גדולות כבר התחייבו לשלב את המעבדים החדשים בשרתים הארגוניים שלהן, בהן: דל, ASUS, פוג'יטסו, Atos, לנובו, GIGABYTE, Supermicro, Quanta ו-H3C. במקביל, יצרניות תוכנה גדולות הכריזו על תמיכה בשבב. בהן: VMWare, RedHat, Canonical ו-Check Point.

ה-NVIDIA BlueField 2 DPU זמינים להדגמה כבר כעת, וצפויים להגיע במערכות החדשות של יצרניות שרתים מובילות החל משנת 2021. מערך ה-NVIDIA BlueFIeld 2X DPU נמצא בפיתוח מתמשך כיום, וצפוי להפוך זמין החל משנת 2021.

לייטביטס-לאבס של אביגדור וילנץ גייסה 50 מ' ד'

חברת Lightbits Labs מכפר-סבא יצאה היום משלב הפעילות החשאית ודיווחה שמאז הקמתה לפני כשנתיים היא גייסה 50 מיליון דולר משותפות אסטרטגיות גדולות, ובהן DellEMC, סיסקו ו-Micron. מדובר ביוזמה החדשה של אביגדור וילנץ, מייסד גלילאו ואנפורנה שנמכרו למארוול ולאמזון, המשמש כיו"ר החברה. המייסדים הנוספים של לייטביטס-לאבס הם המנכ"ל ערן קירצנר לשעבר ראש תחום פתרונות האחסון של PMC-Sierra שנימכרה למיקרוסמי בתחילת 2016, והטכנולוגי הראשי מולי בן יהודה, לשעבר המדען הראשי של Stratoscale.

החברה פיתחה רעיון מהפכני לשיפור זמני התקשורת בין מערכי הזכרון הבלתי נדיפים מסוג SSD במרכזי הנתונים, לבין המעבדים, אשר מקצר משמעותית (50%) את זמני ההשהייה. הרעיון הביא לניסוח התקן החדש NVMe/TCP באמצעות קבוצת העבודה התעשייתית NVM Express, כאשר לייטביטס מובילה את ניסוח התקן שאושר בסוף 2018. למעשה, ארכיטקט התוכנה הראשי של החברה, שגיא גרימברג, נחשב למנסח הראשי של תקן NVME/TCP.

באמצעות יצירת פרוטוקול תקשורת חדש, התקן מאפשר קישור מהיר בין התקני הזיכרון לבין השרתים והמעבדים במרכז הנתונים, על-גבי תשתית תקשורת ה-IP הקיימת. הפרוטוקול חוסך השקעות עצומות הדרושות לצורך בניית קווי תקשורת ייעודיים בין הזיכרונות לבין המעבדים. כעת לייטביטס-לאבס היא גם החברה הראשונה המספקת לו פתרונות.

היום (ג') היא הכריזה על המוצרים הראשונים שלה עבור התקן החדש: כרטיס PCIe להאצת הביצועים מדגם LightField (בתמונה למעלה) ותוכנת LightOS המתחברת אל תשתיות מרכז הנתונים ומנהלת את התקשורת עם התקני האחסון. הכרטיס מותאם לעבודה מול תוכנת LightOS ומבטיח קצב העברת נתונים של עד 200Gbps. הוא מבצע חלק מפעולות החישוב הנעשות כיום בשרת האחסון, ועל-ידי כך מסיט ממנו עומסים, וכולל אמבצעי אבטחה דוגמת איסוף נתונים בזמן אמת המאפשרים להתגבר על תקלות בזכרון (SSD failures) בלא שהמשתמש מרגיש בכך, ובלא צורך להעביר את המידע הזה אל המעבד.

הפרדת המעבדים מהזכרונות

המטרה העיקרית של הטכנולוגיה היא להפריד בין הפעילות של המעבדים לפעילות של מערכי הזיכרון. על-ידי כך ניתן לשדרג בנוחיות כל אחד מהם בנפרד בלא תלות בשני, בהתאם לצורך, ולבצע שינויים בחומרה בכל אחד מהצדדים האלה של מרכז הנתונים, בהתאם לשינויים טכנולוגיים וצרכים עסקיים בלתי צפויים. למעשה, הפתרון החדש מיועד להתחרות בטכנולוגיית הקישוריות RDMA הוותיקה יותר (Remote Direct Memory Access).

טכנולוגיית RDMA נועדה להתמודד עם צוואר הבקבוק של התקשורת בין המעבדים ומערכי הזיכרון באמצעות מתן גישה ישירה למחשב אל הזיכרון של מחשב אחר, בלא מעורבות של מערכת ההפעלה. להערכת חברת לייטביטס-לאבס, הפתרון הזה נכשל ולא מספק מענה הולם, מכיוון שגם הוא דורש התקנת חומרה בהיקף רחב שתנהל אותו. מעניין לציין, שהמשקיעות האסטרטגיות בחברה הן גם חברות בפורום RDMA, המגדיר ומקדם את התקן המתחרה.

החברות המהפכניות של אביגדור וילנץ: Habana Labs, Annapurna