"סדק ראשון בחומה של אנבידיה". AWS מאמצת את מעבדי הבאנה לאבס

חברת AWS (נמצאת בבעלות אמזון), הנחשבת לספקית שירותי המחשוב בענן הגדולה ביותר בעולם, הכריזה שהיא תשלב את מעבדי הבינה המלאכותית גאודי (Gaudi) של חברת הבאנה לאבס (Habana Labs) מקיסריה, בשרתים חדשים אשר ייכנסו ב-2021 אל שירות המחשוב האלסטי (Elastic Compute Cloud – Amazon EC2) שהיא מספקת ללקוחות. מנכ"ל AWS, אנדי ג'סי, אמר שהטכנולוגיה של הבאנה מעניקה חיסכון של עד 40% בעלויות השימוש ב-EC2 במטלות בינה מלאכותית בהשוואה למצב כיום, שבו תוכניות ה-AI מיושמות באמצעות מעבדים גרפיים.

למעשה, הוא רמז שהפתרון של הבאנה לאבס יעיל יותר מאשר מעבדי ה-GPU של אנבידיה, המשמשים לאימון רשתות נוירוניות בענן של AWS. מנהל השיווק והמכירות של הבאנה לאבס, איתן מדינה, אמר שמבחינת הבאנה לאבס והחברה-האם אינטל, "ההכרזה הזאת היא רגע מכונן. כיום המנוע המרכזי לאימון רשתות נוירוניות הוא המעבד הגרפי (GPU). לאמזון יש יותר מ-50% מהשוק הזה, ועד היום היא השתמשה רק בשרתים המבוססים על מעבדי GPU של אנבידיה. ההחלטה להציג ללקוחות שרתים המבוססים על מעבד גאודי של הבאנה לאבס – היא הסדק הראשון בחומה של אנבידיה".

אסטרטגיית XPU של אינטל

חברת הבאנה לאבס פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow. ביוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא יעיל פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).

בחודש דצמבר 2019 היא נירכשה על-ידי אינטל תמורת כ-2 מיליארד דולר. העיסקה בוצעה במסגרת אסטרטגיה כוללת של אינטל לעבור מיצרנית הממוקדת במעבדי CPU, ליצרנית הממוקדת בתחום שהיא מגדירה כ-XPU: מגוון ארכיטקטורות מחשוב כמו CPU, GPU, FPGA ועוד, המאפשרות לספק פתרון אופטימלי לכל יישום. זאת בהתאם לתפישה החדשה של מחשוב הטרוגני. מעבדי הבאנה מיוצרים בחברת TSMC. החברה הודיעה שהדור הבא של המעבדים, Gaudi2, ייוצר בתהליך 7 ננומטר של TSMC.

סכימה של שרת בינה מלאכותית המבוסס על מעבדי גאודי, מעבדי CPU וממשקי איתרנט
סכימה של שרת בינה מלאכותית המבוסס על מעבדי גאודי, מעבדי CPU וממשקי איתרנט

בעקבות העיסקה, אינטל ביצעה מהפך באסטרטגיית הבינה המלאכותית שלה וזנחה את הטכנולוגיה של חברת נירוונה (Nervana) שאותה היא רכשה ב-2016 תמורת כ-350-400 מיליון דולר, ומתמקדת בטכנולוגיה של הבאנה לאבס. חברת הבאנה לאבס ממשיכה לפעול מקיסריה כחברה עצמאית הנמצאת בבעלות אינטל. מאז העיסקה הצטרפו אליה עובדים מחברת אינטל, וכיום היא מעסיקה כ-650 עובדים, בהשוואה לכ-180 עובדים בזמן רכישתה.

מעבד וערכת פקודות ייעודיים

השרת ש-AWS מתכננת להשיק מיועד למטלות אימון של רשתות נוירוניות המבוססות על כמות גדולה מאוד של נתונים. הוא כולל 8 כרטיסי האצה של הבאנה לאבס, אשר מבוססים על מעבד שתוכנן מהיסוד למימוש רשתות נוירוניות. בכך הוא שונה מפתרון ה-GPU של אנבידיה, שתוכנן עבור יישומים גרפיים והתגלה בדיעבד כיעיל מאוד ליישום רשתות נוירוניות. הכרטיס של החברה מספק גם מענה לתקשורת מהירה בתוך מרכזי המחשוב וכולל 8 מתאמי תקשורת מהירים (NIC).

מדינה: "הארכיטקטורה שלנו מבוססת על מעבדים וערכת פקודות ייעודיים לרשתות נוירוניות. למעשה, AWS מכריזה על שרת חדש שבו כרטיסי גאודי יבואו במקום 8 כרטיסי GPU של אנבידיה". השרתים יספקו ללקוחות עוצמת עיבוד של 1200 תמונות בשניה לפי מודל ResNet-50 של תוכנת TensorFlow, המשמש כמדד להשוואת הביצועים של אימון רשתות. הפלטפורמה של AWS תאפשר ללקוחות להפעיל מספר גדול של מערכות מבוססות גאודי, כדי לקבל עוצמת מחשוב המתאימה לצורך הספציפי של כל מטלה.

חברת הבאנה לאבס תיכנס למבנה בשטח 8,000 מ"ר בקיסריה

חברת הבאנה לאבס (Habana Labs) שנמכרה לאינטל בדצמבר 2019 תמורת כ-1.7 מיליארד דולר, שכרה משרדים בשטח של כ-8,000 מ"ר בקמפוס גרניט המוקדם היום על-ידי החברה לנכסי קיסריה אדמונד בנימין דה רוטשילד. הקמת המובנה תושלם בחודשים הקרובים. הבאנה לאבס חתמה על חוזה שכירות ל-5 שנים עם אופציה להארכה לחמש שנים נוספות, במחיר של כ-400 אלף שקל לחודש ברמת המעטפת. קומפלקס המשרדים החדש משתרע על-פני שטח של כ-40 דונם וכולל שלושה בנייני משרדים בני 3 קומות בשטח בנוי של כ-30,000 מ"ר ופארק ירוק בשטח של כ-20 דונם. הוא מרוחק כ–200 מטר מתחנת הרכבת.

הבאנה פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya HL-1000, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow.

בחודש יוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא מאפשר לייצר מערכות אימון בעלות תפוקה גבוהה פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).בעקבות הרכישה, ביצעה אינטל מהפך באסטרטגיית הבינה המלאכותית שלה: היא זנחה את טכנולוגיית הבינה המלאכותית של חברת נירוונה (Nervana) שאותה היא רכשה בשנת 2016 תמורת כ-350-400 מיליון דולר, והחליטה להתמקד בטכנולוגיה של הבאנה לאבס.

בהודעה רשמית מתחילת מרץ השנה היא אישרה את השמועות על המהפך: "החלטנו לבצע שינוי אסטרטגי במפת הדרכים שלנו בתחום מרכזי הנתונים ומאיצי הבינה המלאכותית. אנחנו מתכוונים להעצים את מעבדי גויה וגאודי של הבאנה לאבס, הנוכחיים והעתידיים, באמצעות החומרה והתוכנה של אינטל. המעבדים של הבאנה מספקים יתרון חזק ואסטרטגי בארכיטקטורה האחידה והניתנת לתכנות שלהם, ביישומי אימון וביישומי הסקות כאחד".

בדומה למובילאיי, הבאנה לאבס פועלת במתכונת של חברה עצמאית הנמצאת בבעלות אינטל.

אינטל זונחת את נרוונה לטובת הטכנולוגיה של הבאנה לאבס

בתמונה למעלה: כרטיס מחשב עם מעבד האימון "גאודי" של הבאנה לאבס

עסקת הבאנה לאבס הישראלית זיעזעה את חברת אינטל (Intel) והביאה לתפנית ניהולית וטכנולוגית דרמטית. הדבר נחשף בשבוע שעבר, כאשר ראש תחום הבינה המלאכותית באינטל, נאבין ראו (Naveen Rao), דיווח בציוץ בטוויטר כי החליט לפרוש מתפקידו כמנהל הראשי של קבוצת הבינה המלאכותית (AI) של אינטל העולמית ולעזוב את החברה כבר בשבוע הבא. במקומו ימונה לתפקיד הישראלי גדי זינגר, שהוא אחד הישראלים הבכירים באינטל העובד בחברה כבר יותר מ-35 שנה. כיום הוא משמש כסגנו של ראו בקבוצת הבינה המלאכותית.

התפטרותו של ראו מסמנת את סוף דרכה של הטכנולוגיה האמריקאית, ותחילת דרכה של הטכנולוגיה הישראלית: ראו ייסד וניהל את חברת הבינה המלאכותית נרוונה (Nervana) שנירכשה על-ידי אינטל בשנת 2016 תמורת כ-350-400 מיליון דולר. מיד לאחר העיסקה הוא מונה לראש קבוצת הבינה המלאכותית החדשה של אינטל, אשר גיבשה אסטרטגיה המבוססת על טכנולוגיית מעבדי למידת העומק של נרוונה. החברה פיתחה מעבדים להרצת רשתות נוירונים, ואינטל התכוונה לבסס את קו המעבדים החדש שלה בתחום הבינה המלאכותית על הטכנולוגיה שלה, במטרה להתחרות בשליטה של אנבידיה בעולם מרכזי הנתונים.

באוגוסט 2019 היא אפילו הכריזה על המעבדים הראשונים. אלא שעיסקת הבאנה-לאבס (Habana Labs) הישראלית טרפה את הקלפים. אינטל רכשה אותה בדצמבר 2019 תמורת כ-2 מיליארד דולר, והגיעה למסקנה שהטכנולוגיה שלה טובה בהרבה מהטכנולוגיה של הבאנה. בחודש שעבר הודיעה אינטל, בתגובה לספקולציות שפורסמו באתרים מובילים ברשת, שהיא החליטה לחדול מהמשך הפיתוח של מעבדי נרוונה, ולבסס את מעבדי הבינה המלאכותית הבאים שלה על הטכנולוגיה של הבאנה-לאבס.

מנהל קבוצת הבינה המלאכותית הנכנס גדי זינגר (מימין), והמנהל הפורש נאבין ראו
מנהל קבוצת הבינה המלאכותית הנכנס גדי זינגר (מימין), והמנהל הפורש נאבין ראו

ההימור הכושל על נרוונה

תחום הבינה המלאכותית הוגדר כאחד מתחומי הליבה האסטרטגיים החדשים של אינטל בתוכנית הרה-ארגון שהציג המנכ"ל הקודם בריאן קרזניץ' בשנת 2016. אחד המהלכים הראשונים בתחום היה רכישת חברת הסטארט-אפ נרוונה, שהוקמה כשנתיים קודם לכן, והעסיקה כ-15 עובדים בלבד. אולם רק באוגוסט 2019, שלוש שנים לאחר רכישת החברה ולאחר שורה של דחיות, השיקה אינטל שני מעבדים המיועדים לשמש כמאיצים בשלבי האימון וההסקה של משימות בינה מלאכותית.

הראשון הוא מעבד NNP-T (קיצור של Neural Network Processor for Training) לביצוע פעולות לימוד ואימון של רשתות נוירוניות, והשני הוא מעבד NNP-I (קיצור של Neural Network Processor for Inference), המיועד לשימוש במרכזי עיבוד גדולים המיישמים את פעולת ההסקות (Inferencing) של רשתות נוירוניות.

שני המעבדים זכו לשמות המותג Spring Crest ו-Spring Hill בהתאמה, ואינטל אף החלה בפיתוח הדור הבא של מעבדי הבינה המלאכותית. שלושה חודשים בלבד לאחר ההכרזה החשובה, רכשה אינטל את הבאנה לאבס הישראלית, בעיסקה שעוררה תהיות רבות. בשוק לא היה ברור מהי כוונתה, מכיוון שגם המעבדים של הבאנה, גויה (Goya) וגאודי (Gaudi), מיועדים לבצע משימות לאימון רשתות נוירונים והסקת מסקנות (בהתאמה).

מעבדי גאודי וגאיה, במקום מעבדי ספרינג-היל וספרינג-קרסט

בטור שפורסם בסוף חודש ינואר במגזין Forbes, טען קרל פרוינד, אנליסט ויועץ בעל מוניטין בתחום מחשוב עתיר-ביצועים ולמידת-עומק, כי מהנדסים בכירים באינטל וכמה לקוחות גדולים כמו חברת פייסבוק, טוענים שמעבדי הבינה המלאכותית של נרוונה לא עומדים בעומס של מרכזי הנתונים. פרוינד אף טען כי בעקבות האכזבה מביצועי השבבים, אינטל החליטה להפסיק את המשך הייצור של מעבדי ספרינג-היל ולזנוח את הפיתוח של מעבדי ספרינג-קרסט. "להערכתי, לקוחותיה של אינטל אמרו שהם מעדיפים את הפלטפורמה של הבאנה לאבס כטכנולוגיה אשר יכולה להתחרות באנבידיה", הוא כתב.

מספר ימים לאחר פרסום הטור, אינטל אישרה את הדברים ומסרה בהודעה רשמית: "לאחר רכישת הבאנה-לאבס ולאור משוב מלקוחותינו, החלטנו לבצע שינוי אסטרטגי במפת הדרכים שלנו בתחום מרכזי הנתונים ומאיצי הבינה המלאכותית. אנחנו מתכוונים להעצים את מעבדי גויה וגאודי של הבאנה לאבס, הנוכחיים והעתידיים, באמצעות החומרה והתוכנה של אינטל. המעבדים של הבאנה מספקים יתרון חזק ואסטרטגי בארכיטקטורה אחידה וניתנת לתכנות לשהם, ביישומי אימון והסקות כאחד".

הבאנה פיתחה שני מעבדי בינה מלאכותית לרשתות נוירוניות: מעבד אימון ומעבד הסקות. בסוף 2018 היא הכריזה על המעבד Goya HL-1000, המשמש כמנוע לייצור הסקות (inferencing) ברשתות לימוד עומק (deep learning). בין השאר, פייסבוק התקינה אותו במערכת הבינה המלאכותית שלה, Glow. בחודש יוני 2019 היא הכריזה על מעבד אימון הרשתות הנוירוניות Habana Gaudi, שלהערכתה הוא מאפשר לייצר מערכות אימון בעלות תפוקה גבוהה פי ארבעה בהשוואה למערכות אימון המבוססות על מעבדים גרפיים (GPU).

הגיבוי הישראלי של אינטל ואנבידיה

אינטל מצויה בתחרות עזה בתחום מרכזי הנתונים מול אנבידיה. במסגרת המאבק הזה, שתי החברות נעזרות בטכנולוגיות ישראליות: אינטל עם הטכנולוגיה של הבאנה לאבס ואנבידיה עם הטכנולוגיה של מלאנוקס, שאותה היא רכשה בשנה שעברה תמורת 6.9 מיליארד דולר. להערכתה, מדובר בשוק הצפוי להגיע להיקף של כ-25 מיליארד דולר עד לשנת 2024. מתוך זה, שוק מעבדי ה-AI למרכזי נתונים צפוי להגיע להיקף של כ-10 מיליארד דולר.

לראיון מוקלט עם ד"ר אמתי ערמון, Chief Data Scientist בחברת אינטל ישראל: