הבאנה לאבס מכריזה מלחמה על ה-GPU

חברת הבאנה לאבס (Habana Labs) מקיסריה ותל אביב הכריזה על מעבדי הבינה המלאכותית החדשים שלה: מעבד Gaudi 2 לאימון רשתות נוירוניות ומעבד Greco המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בפגישה עם איתן מדינה, מנהל העסקים הראשי של חברת הבאנה לאבס, הוא סיפר שהמעבדים החדשים מיוצרים בחברת TSMC בתהליך של 7 ננומטר וצורכים הספק של עד 600W ללא צורך בקירור נוזלים.

חברת הבאנה לאבס הוקמה בשנת 2016 על-ידי דוד דהן ורן חלוץ, יוצאי חברת פריימסנס שנמכרה לאפל ב-2013 תמורת 345 מיליון דולר. בסוף 2019 היא נמכרה לאינטל תמורת כ-2 מיליארד דולר וכיום מעסיקה כ-900 עובדים. היא הפכה לאחת מאבני הבניין החשובות של אינטל בתחום הבינה המלאכותית. לדברי מדינה, המעבדים מיועדים לשוק הצומח של רשתות עומק (DL) בבמרכזי נתונים. "כיום תופס ה-DL כ-75% מפעילות הבינה המלאכותית בענן. להערכתנו, ככל שגדל המשקל ה-DL בשרתים, כך גובר הצורך בהבאנה: אומנם מעבדי GPU יעילים בעיבוד משימות מעורבות, אולם בתחום רשתות העומק הנוירוניות יש עדיפות להבאנה".

מעבד Gaudi 2 כולל גם מנוע עיבוד מדיה משולב עבור מדיה דחוסה, כדי להוריד עומס מהמערכת המארחת. קיבולת זיכרון שלו הוכפלה פי שלושה ל-96 ג'יגה-בייט עם רוחב פס של 2.45 טרה-בייט/לשנייה. השבב כולל 24 ממשקי גישה לרשת מסוג 100GbE RoCE RDMA, המאפשרים הגדלה והרחבה באמצעות חיבור רשת סטנדרטי, המצמצם את התלות של הלקוח בממשקי תקשורת קנייניים. המעבד מופיע עם תוכנת SynapseAI, אשר תומכת במודלים לאימון על Gaudi 2 והסקת מסקנות בכל פלטפורמה, כולל מעבדי Xeon של אינטל, Greco של הבאנה או Gaudi 2 בעצמו.

איתן מדינה. הבאנה יעילה יותר מ-GPU
איתן מדינה. הבאנה יעילה יותר מ-GPU

ההכרזה כוללת גם שרת בינה מלאכותית 12 Gaudi 2 Training Server אשר פותח על-ידי חברת Supermicro ומתוכנן להגיע השנה לשוק. במקביל, חברת DataDirect Networks תספק מארז שלם הכולל את שרת Supermicro X12 ביחד עם פתרון האחסון שלה, DDN AI400X2, לאחר שעבר התאמה לפעולה הדדית. אחת מההצלחות החשובות של הבאנה היא שחברת AWS התקינה בענן שלה את דרייבר (Instance) הבינה המלאכותית Amazon EC2 DL1, שהוא הראשון שאינו תומך במעבדי GPU. אפילו חברת מובילאיי כבר מבצעת עבודות עיבוד באמצעותו.

מעבד Gaudi החדש מאפשר לאינטל להתחרות בחברת אנבידיה בתחום החזק ביותר שלה – מעבדי GPU ליישומי בינה מלאכותית. אפילו תוכנת SynapseAI של הבאנה מעניקה למפתחים אפשרות לעבוד עם תוכנות שאינן תוכנות של אנבידיה. בתדרוך לכתבים ישראלים, אמרה סנדרה ריברה, סגנית נשיא בכירה באינטל ומנכ"לית קבוצת הדאטה סנטר והבינה המלאכותית, שהשקת מעבדי הבאנה החדשים "היא דוגמה מצוינת לאופן שבו אינטל מיישמת את אסטרטגיית הבינה המלאכותית שלה – מהענן ועד לאבזרי הקצה. "מעבד Gaudi 2 מסייע לאמן עומסי לימוד מעמיק גדולים ומורכבים במהירות וביעילות".

"סדק ראשון בחומה של אנבידיה". AWS מאמצת את מעבדי הבאנה לאבס

חברת AWS (נמצאת בבעלות אמזון), הנחשבת לספקית שירותי המחשוב בענן הגדולה ביותר בעולם, הכריזה שהיא תשלב את מעבדי הבינה המלאכותית גאודי (Gaudi) של חברת הבאנה לאבס (Habana Labs) מקיסריה, בשרתים חדשים אשר ייכנסו ב-2021 אל שירות המחשוב האלסטי (Elastic Compute Cloud – Amazon EC2) שהיא מספקת ללקוחות. מנכ"ל AWS, אנדי ג'סי, אמר שהטכנולוגיה של הבאנה מעניקה חיסכון של עד 40% בעלויות השימוש ב-EC2 במטלות בינה מלאכותית בהשוואה למצב כיום, שבו תוכניות ה-AI מיושמות באמצעות מעבדים גרפיים.

למעשה, הוא רמז שהפתרון של הבאנה לאבס יעיל יותר מאשר מעבדי ה-GPU של אנבידיה, המשמשים לאימון רשתות נוירוניות בענן של AWS. מנהל השיווק והמכירות של הבאנה לאבס, איתן מדינה, אמר שמבחינת הבאנה לאבס והחברה-האם אינטל, "ההכרזה הזאת היא רגע מכונן. כיום המנוע המרכזי לאימון רשתות נוירוניות הוא המעבד הגרפי (GPU). לאמזון יש יותר מ-50% מהשוק הזה, ועד היום היא השתמשה רק בשרתים המבוססים על מעבדי GPU של אנבידיה. ההחלטה להציג ללקוחות שרתים המבוססים על מעבד גאודי של הבאנה לאבס – היא הסדק הראשון בחומה של אנבידיה".

אסטרטגיית XPU של אינטל

חברת הבאנה לאבס פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow. ביוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא יעיל פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).

בחודש דצמבר 2019 היא נירכשה על-ידי אינטל תמורת כ-2 מיליארד דולר. העיסקה בוצעה במסגרת אסטרטגיה כוללת של אינטל לעבור מיצרנית הממוקדת במעבדי CPU, ליצרנית הממוקדת בתחום שהיא מגדירה כ-XPU: מגוון ארכיטקטורות מחשוב כמו CPU, GPU, FPGA ועוד, המאפשרות לספק פתרון אופטימלי לכל יישום. זאת בהתאם לתפישה החדשה של מחשוב הטרוגני. מעבדי הבאנה מיוצרים בחברת TSMC. החברה הודיעה שהדור הבא של המעבדים, Gaudi2, ייוצר בתהליך 7 ננומטר של TSMC.

סכימה של שרת בינה מלאכותית המבוסס על מעבדי גאודי, מעבדי CPU וממשקי איתרנט
סכימה של שרת בינה מלאכותית המבוסס על מעבדי גאודי, מעבדי CPU וממשקי איתרנט

בעקבות העיסקה, אינטל ביצעה מהפך באסטרטגיית הבינה המלאכותית שלה וזנחה את הטכנולוגיה של חברת נירוונה (Nervana) שאותה היא רכשה ב-2016 תמורת כ-350-400 מיליון דולר, ומתמקדת בטכנולוגיה של הבאנה לאבס. חברת הבאנה לאבס ממשיכה לפעול מקיסריה כחברה עצמאית הנמצאת בבעלות אינטל. מאז העיסקה הצטרפו אליה עובדים מחברת אינטל, וכיום היא מעסיקה כ-650 עובדים, בהשוואה לכ-180 עובדים בזמן רכישתה.

מעבד וערכת פקודות ייעודיים

השרת ש-AWS מתכננת להשיק מיועד למטלות אימון של רשתות נוירוניות המבוססות על כמות גדולה מאוד של נתונים. הוא כולל 8 כרטיסי האצה של הבאנה לאבס, אשר מבוססים על מעבד שתוכנן מהיסוד למימוש רשתות נוירוניות. בכך הוא שונה מפתרון ה-GPU של אנבידיה, שתוכנן עבור יישומים גרפיים והתגלה בדיעבד כיעיל מאוד ליישום רשתות נוירוניות. הכרטיס של החברה מספק גם מענה לתקשורת מהירה בתוך מרכזי המחשוב וכולל 8 מתאמי תקשורת מהירים (NIC).

מדינה: "הארכיטקטורה שלנו מבוססת על מעבדים וערכת פקודות ייעודיים לרשתות נוירוניות. למעשה, AWS מכריזה על שרת חדש שבו כרטיסי גאודי יבואו במקום 8 כרטיסי GPU של אנבידיה". השרתים יספקו ללקוחות עוצמת עיבוד של 1200 תמונות בשניה לפי מודל ResNet-50 של תוכנת TensorFlow, המשמש כמדד להשוואת הביצועים של אימון רשתות. הפלטפורמה של AWS תאפשר ללקוחות להפעיל מספר גדול של מערכות מבוססות גאודי, כדי לקבל עוצמת מחשוב המתאימה לצורך הספציפי של כל מטלה.

חברת הבאנה לאבס תיכנס למבנה בשטח 8,000 מ"ר בקיסריה

חברת הבאנה לאבס (Habana Labs) שנמכרה לאינטל בדצמבר 2019 תמורת כ-1.7 מיליארד דולר, שכרה משרדים בשטח של כ-8,000 מ"ר בקמפוס גרניט המוקדם היום על-ידי החברה לנכסי קיסריה אדמונד בנימין דה רוטשילד. הקמת המובנה תושלם בחודשים הקרובים. הבאנה לאבס חתמה על חוזה שכירות ל-5 שנים עם אופציה להארכה לחמש שנים נוספות, במחיר של כ-400 אלף שקל לחודש ברמת המעטפת. קומפלקס המשרדים החדש משתרע על-פני שטח של כ-40 דונם וכולל שלושה בנייני משרדים בני 3 קומות בשטח בנוי של כ-30,000 מ"ר ופארק ירוק בשטח של כ-20 דונם. הוא מרוחק כ–200 מטר מתחנת הרכבת.

הבאנה פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya HL-1000, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow.

בחודש יוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא מאפשר לייצר מערכות אימון בעלות תפוקה גבוהה פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).בעקבות הרכישה, ביצעה אינטל מהפך באסטרטגיית הבינה המלאכותית שלה: היא זנחה את טכנולוגיית הבינה המלאכותית של חברת נירוונה (Nervana) שאותה היא רכשה בשנת 2016 תמורת כ-350-400 מיליון דולר, והחליטה להתמקד בטכנולוגיה של הבאנה לאבס.

בהודעה רשמית מתחילת מרץ השנה היא אישרה את השמועות על המהפך: "החלטנו לבצע שינוי אסטרטגי במפת הדרכים שלנו בתחום מרכזי הנתונים ומאיצי הבינה המלאכותית. אנחנו מתכוונים להעצים את מעבדי גויה וגאודי של הבאנה לאבס, הנוכחיים והעתידיים, באמצעות החומרה והתוכנה של אינטל. המעבדים של הבאנה מספקים יתרון חזק ואסטרטגי בארכיטקטורה האחידה והניתנת לתכנות שלהם, ביישומי אימון וביישומי הסקות כאחד".

בדומה למובילאיי, הבאנה לאבס פועלת במתכונת של חברה עצמאית הנמצאת בבעלות אינטל.

אינטל זונחת את נרוונה לטובת הטכנולוגיה של הבאנה לאבס

בתמונה למעלה: כרטיס מחשב עם מעבד האימון "גאודי" של הבאנה לאבס

עסקת הבאנה לאבס הישראלית זיעזעה את חברת אינטל (Intel) והביאה לתפנית ניהולית וטכנולוגית דרמטית. הדבר נחשף בשבוע שעבר, כאשר ראש תחום הבינה המלאכותית באינטל, נאבין ראו (Naveen Rao), דיווח בציוץ בטוויטר כי החליט לפרוש מתפקידו כמנהל הראשי של קבוצת הבינה המלאכותית (AI) של אינטל העולמית ולעזוב את החברה כבר בשבוע הבא. במקומו ימונה לתפקיד הישראלי גדי זינגר, שהוא אחד הישראלים הבכירים באינטל העובד בחברה כבר יותר מ-35 שנה. כיום הוא משמש כסגנו של ראו בקבוצת הבינה המלאכותית.

התפטרותו של ראו מסמנת את סוף דרכה של הטכנולוגיה האמריקאית, ותחילת דרכה של הטכנולוגיה הישראלית: ראו ייסד וניהל את חברת הבינה המלאכותית נרוונה (Nervana) שנירכשה על-ידי אינטל בשנת 2016 תמורת כ-350-400 מיליון דולר. מיד לאחר העיסקה הוא מונה לראש קבוצת הבינה המלאכותית החדשה של אינטל, אשר גיבשה אסטרטגיה המבוססת על טכנולוגיית מעבדי למידת העומק של נרוונה. החברה פיתחה מעבדים להרצת רשתות נוירונים, ואינטל התכוונה לבסס את קו המעבדים החדש שלה בתחום הבינה המלאכותית על הטכנולוגיה שלה, במטרה להתחרות בשליטה של אנבידיה בעולם מרכזי הנתונים.

באוגוסט 2019 היא אפילו הכריזה על המעבדים הראשונים. אלא שעיסקת הבאנה-לאבס (Habana Labs) הישראלית טרפה את הקלפים. אינטל רכשה אותה בדצמבר 2019 תמורת כ-2 מיליארד דולר, והגיעה למסקנה שהטכנולוגיה שלה טובה בהרבה מהטכנולוגיה של הבאנה. בחודש שעבר הודיעה אינטל, בתגובה לספקולציות שפורסמו באתרים מובילים ברשת, שהיא החליטה לחדול מהמשך הפיתוח של מעבדי נרוונה, ולבסס את מעבדי הבינה המלאכותית הבאים שלה על הטכנולוגיה של הבאנה-לאבס.

מנהל קבוצת הבינה המלאכותית הנכנס גדי זינגר (מימין), והמנהל הפורש נאבין ראו
מנהל קבוצת הבינה המלאכותית הנכנס גדי זינגר (מימין), והמנהל הפורש נאבין ראו

ההימור הכושל על נרוונה

תחום הבינה המלאכותית הוגדר כאחד מתחומי הליבה האסטרטגיים החדשים של אינטל בתוכנית הרה-ארגון שהציג המנכ"ל הקודם בריאן קרזניץ' בשנת 2016. אחד המהלכים הראשונים בתחום היה רכישת חברת הסטארט-אפ נרוונה, שהוקמה כשנתיים קודם לכן, והעסיקה כ-15 עובדים בלבד. אולם רק באוגוסט 2019, שלוש שנים לאחר רכישת החברה ולאחר שורה של דחיות, השיקה אינטל שני מעבדים המיועדים לשמש כמאיצים בשלבי האימון וההסקה של משימות בינה מלאכותית.

הראשון הוא מעבד NNP-T (קיצור של Neural Network Processor for Training) לביצוע פעולות לימוד ואימון של רשתות נוירוניות, והשני הוא מעבד NNP-I (קיצור של Neural Network Processor for Inference), המיועד לשימוש במרכזי עיבוד גדולים המיישמים את פעולת ההסקות (Inferencing) של רשתות נוירוניות.

שני המעבדים זכו לשמות המותג Spring Crest ו-Spring Hill בהתאמה, ואינטל אף החלה בפיתוח הדור הבא של מעבדי הבינה המלאכותית. שלושה חודשים בלבד לאחר ההכרזה החשובה, רכשה אינטל את הבאנה לאבס הישראלית, בעיסקה שעוררה תהיות רבות. בשוק לא היה ברור מהי כוונתה, מכיוון שגם המעבדים של הבאנה, גויה (Goya) וגאודי (Gaudi), מיועדים לבצע משימות לאימון רשתות נוירונים והסקת מסקנות (בהתאמה).

מעבדי גאודי וגאיה, במקום מעבדי ספרינג-היל וספרינג-קרסט

בטור שפורסם בסוף חודש ינואר במגזין Forbes, טען קרל פרוינד, אנליסט ויועץ בעל מוניטין בתחום מחשוב עתיר-ביצועים ולמידת-עומק, כי מהנדסים בכירים באינטל וכמה לקוחות גדולים כמו חברת פייסבוק, טוענים שמעבדי הבינה המלאכותית של נרוונה לא עומדים בעומס של מרכזי הנתונים. פרוינד אף טען כי בעקבות האכזבה מביצועי השבבים, אינטל החליטה להפסיק את המשך הייצור של מעבדי ספרינג-היל ולזנוח את הפיתוח של מעבדי ספרינג-קרסט. "להערכתי, לקוחותיה של אינטל אמרו שהם מעדיפים את הפלטפורמה של הבאנה לאבס כטכנולוגיה אשר יכולה להתחרות באנבידיה", הוא כתב.

מספר ימים לאחר פרסום הטור, אינטל אישרה את הדברים ומסרה בהודעה רשמית: "לאחר רכישת הבאנה-לאבס ולאור משוב מלקוחותינו, החלטנו לבצע שינוי אסטרטגי במפת הדרכים שלנו בתחום מרכזי הנתונים ומאיצי הבינה המלאכותית. אנחנו מתכוונים להעצים את מעבדי גויה וגאודי של הבאנה לאבס, הנוכחיים והעתידיים, באמצעות החומרה והתוכנה של אינטל. המעבדים של הבאנה מספקים יתרון חזק ואסטרטגי בארכיטקטורה אחידה וניתנת לתכנות לשהם, ביישומי אימון והסקות כאחד".

הבאנה פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya HL-1000, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow. בחודש יוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא מאפשר לייצר מערכות אימון בעלות תפוקה גבוהה פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).

הגיבוי הישראלי של אינטל ואנבידיה

אינטל מצויה בתחרות עזה בתחום מרכזי הנתונים מול אנבידיה. במסגרת המאבק הזה, שתי החברות נעזרות בטכנולוגיות ישראליות: אינטל עם הטכנולוגיה של הבאנה לאבס ואנבידיה עם הטכנולוגיה של מלאנוקס, שאותה היא רכשה בשנה שעברה תמורת 6.9 מיליארד דולר. להערכתה, מדובר בשוק הצפוי להגיע להיקף של כ-25 מיליארד דולר עד לשנת 2024. מתוך זה, שוק מעבדי ה-AI למרכזי נתונים צפוי להגיע להיקף של כ-10 מיליארד דולר.

לראיון מוקלט עם ד"ר אמתי ערמון, Chief Data Scientist בחברת אינטל ישראל: