אינטל מרחיבה את אסטרטגיית הענן

חברת אינטל הכריזה על שירות ענן חדש בשם Inflection for Enterprise, שהוא סייען בינה מלאכותית (virtual AI co-worker) המבוסס על מערכת Inflection 3.0 של חברת Inflection AI, אשר מספקת כלים ברמה ארגונית בבניית פתרונות מבוססי AI המותאמים לצורכי הארגון הספציפי. בשלב הראשון אינטל תספק את השירות על-גבי ענן הבינה המלאכותית הקנייני שלה, Tiber AI Cloud המבוסס על מעבדי גאודי (3 Gaudi) של חברת הבאנה לאבס הישראלית.

ברבעון הראשון של 2025 אינטל מתכננת להשיק את הפתרון גם במתכונת של אבזר בינה מלאכותית עצמאי (appliance), שיהיה האבזר הראשון המבוסס על מעבדי גאודי. הוא יריץ את אפליקציית Pi consumer של Inflection AI, אשר נבדקה מול המעבדים הגרפיים (GPU) של אנבידיה, ויהיה מצוייד בזיכרון תקשורת מהירה בנפח של 128GB. הוא יוכל להריץ את העיבוד מול הענן (כולל של אנבידיה) או לבצע את כל החישובים במקום, על-מנת לשמור על אבטחת המידע ולמנוע זליגת סודות ארגוניים אל הרשת.

הצהרת כוונות של אינטל

במקור, אינטל פיתחה את שירות Intel Development Cloud כסוג של שירות שנועד לסייע למפתחי מערכות המבוססות על מעבדי גאודי ו-Xeon. ההכרזה הזו מלמדת שאינטל החליטה להתמודד עם שוק ה-AI במתכונת משולבת של יישומי תוכנה ושל אבזרים מלאים, ולחרוג ממדיניות הממוקדת בשבבים שהלקוחות מטמיעים במוצרים שלהם. בכך היא עוקבת אחר האסטרטגיה של אנבידיה, המבוססת על מתן פתרונות לכל הרבדים בשוק: החל מתוכנות, עבור לשבבים ומערכות שלמות וכלה בשירותי ענן.

כך למשל, ההכרזה מגיעה לאחר שילוב פלטפורמת פיתוח היישומים Tiber בתוך הענן, וביחד עם שינוי שם השירות מ"ענן מפתחים" ל-Tiber Cloud. פלטפורמת Tiber מרחיבה את קהל הלקוחות של הענן האינטלי אל תעשיית ה-IT כולה, ולא רק אל מפתחי חומרה ומוצרים. במקביל לאינטל, גם Inflection AI משיקה שירות חדש: Inflection for Enterprise, אשר יתבסס על תשתיות Intel Gaudi 3 במקום מאיצי אנבידיה. השירות שלה פונה בעיקר למגזר ה-IT ומיועד לסייע לארגונים לפתח יישומי בינה מלאכותית בלא ההשקעה הגדולה בתשתיות חומרה, תוכנה והכשרת עובדים, הכרוכה במעבר הזה.

גאודי 3 יגיע למכירות של חצי מיליארד דולר

חברת אינטל צופה שבמהלך שנת 2024 יגיע מאיץ הבינה המלאכותית הישראלי, Gaudi 3, להיקף מכירות של יותר מ-500 מיליון דולר. כך העריך מנכ"ל אינטל, פט גלסינגר, במהלך שיחת הוועידה שנערכה בעקבות פרסום הדו"ח לרבעון הראשון של 2024. החברה הכריזה על המעבד בחודש אפריל השנה ודיווחה שמספר יצרניות מחשבים כבר החליטו להשתמש במאיץ החדש, בהן: Dell, Supermicro, Lenovo ו-HPE. לאור זאת, מדובר בהיקף מכירות בתקופה של חכצי שנה בלבד.

גלסינגר: "מכירות המעבד יציגו תנופה גוברת ב-2025, בהתבסס על העלות הכוללת הנמוכה של Gaudi 3, וכן על הגידול באספקה מצדנו". המכירות צפויות של מעבד גאודי 3 עשויות לאושש את מכירות חטיבת מרכזי הנתונים והבינה המלאכותית (DCAI), שסבלה בשנים האחרונות מירידה במכירות ובנתח השוק: כך למשל, מכירותיה ברבעון הראשון 2023 הסתכמו בכ-3 מיליארד דולר – בהשוואה למכירות של כ-6 מיליארד דולר ברבעון הראשון 2022.

המאיץ Gaudi 3 מיוצר בתהליך של 5 ננומטר והוא זמין ליצרני מחשבים מובילים החל מהרבעון השני 2024. להערכת אינטל, הוא מספק ביצועים יותר טובים מכל המתחרים, "כולל ממעבד NH100 של אנבידיה". המעבד החדש כולל 24 ערוצי Ethernet במהירות 200Gbps, זיכרון HBM בנפח 128GB, וליבות מותאמות במיוחד למטלות למידת מכונה ורשתות נוירונים. הוא יגיע לשוק במספר תצורות: כרטיס הרחבה בפורמט PCIe, לוח אם סטנדרטי ומודול מאיץ פתוח (OAM). 

בסך הכל מכירות אינטל ברבעון צמחו בכ-9% בהשוואה לרבעון המקביל אשתקד, והסתכמו בכ-12.7 מיליארד דולר. אינטל צופה שמכירותיה ברבעון השני יסתכמו בכ-13 מיליארד דולר. תחום הצמיחה המרכזי ברבעון היה מכירות מעבדים למחשבים, אשר צמחו בכ-31% והסתכמו בכ-7.5 מיליארד דולר. תרומה מרכזית לצמיחה הזו היתה למעבדי Core Ultra אשר יצאו לשוק בדצמבר 2023 וכוללים מודולי בינה מלאכותית מובנים בתוך המעבד (AI PCs). במהלך הרבעון אינ טל סיפקה 5 מיליון מעבדים כאלה, והיא מצפה שעד סוף השנה היא תספק עוד כ-35 מיליון מעבדים.

אינטל הכריזה על מאיץ ה-AI החדש, Gaudi-3

חברת אינטל השיקה אינטל את מאיץ Intel Gaudi 3, המיוצר בתהליך של 5 ננומטר ולהערכת החברה מספק ביצועים טובים יותר מכל המתחרים, "כולל מעבד NH100 של אנבידיה". בין השאר, הוא מהיר ב-30% בהפקת תוצאות ממודלי שפה נפוצים כמו Llama ו-Falcon. המעבד החדש יגיע במגוון תצורות: כרטיס הרחבה בפורמט PCIe, לוח אם סטנדרטי ומודול מאיץ פתוח (OAM). הוא יהיה זמין ליצרני מחשבים מובילים כבר ברבעון השני 2024. גרסת ה-PCIe צפויה להגיע לשוק עד סוף השנה. אינטל מסרה שמספר יצרניות מחשבים כבר החליטו להשתמש במאיץ החדש, בהן: Dell, Supermicro, Lenovo ו-HPE.

השבב הגדול כולל 64 ליבות לעיבוד טנסורים, 8 מנועי עיבוד מטריצות, 16 ממשקי PCIe-5, זיכרון HBM בנפח של 128GB וזיכרון SRAM בנפח של 96MB. החברה יפרסמה נתונים שלפיהם גאודי-3 מהיר פי 1.6 מאשר מעבד NH100 בהרצת מודל LLAMA2 -13B ומייצר הסקות ביעילות אנרגטית גבוהה פי 2.3 מאשר המתחרה של אנבידיה. 

הטכנולוגיה והארכיטקטורה של גאודי 3 יספקו את הבסיס למעבד הגרפי הבא של אינטל, Falcon Shores, אשר ישלב את ה-IP של גאודי ושל Xe עם ממשק תכנות אחיד המבוסס על מפרט oneAPI של החברה. ההכרזה החדשה נעשתה במהלך כנס הלקוחות – בכנס הלקוחות והשותפים Intel, המתקיים בסנטה קלרה, קליורניה. היא מהווה חלק מסדרת מהלכים של אינטל לכל רוחב קבוצות המוצר, אשר מיועד להטמיע בינה מלאכותית בכל הפתרונות שהיא מספקת. בתחום המחשוב האישי, מעבד הדור הבא למחשבים ניידים Lunar Lake יכיל 46 ליבות NPU (רשתות נוירונים) ויגיע לעוצמת עיבוד של כ-100TOPS. החברה העריכה שביצועי הבינה המלאכותית של Lunar Lake יהיו גבוהים בכ-50% מזה של מעבדי Intel Core Ultra מהדור הנוכחי.

במקביל, אינטל השיקה את המותג Xeon 6 – משפחת מעבדי שרתים חדשה עם עם ליבות E מדור חדש וביצועי AI משופרים. אינטל גם חשפה קטגוריית מוצרים חדשה בשם AI NIC (כרטיס רשת הכוללה בינה מלאכותית), המבוסס על תקנים פתוחים התואמים לדרישות קונסורציום Ultra Ethernet, אשר מיועד לפריסות AI בקנה מידה גדול. מדובר בפרוייקט שהניהול שלו יתבצע בישראל והעובדים שיפתחו אותו יגיעו מישראל, מארה"ב ומהודו. הכרטיס צפוי להגיע לשוק בשנת 2026.

אלטרה נרתמת לרעיון ה-FPGAi

בצד השני של האוקיינוס, בתערוכת embedded 2024, חשפה חברת אלטרה (Altera) הנמצאת בבעלות אינטל רכיבי FPGA חדשים ממשפחת Agilex 5, אשר כוללים מודולי בינה מלאכותית (AI) המוטמעים בתוך הרכיב. להערכת החברה, רכיבי FPGA מתאימים במיוחד לשימוש ביישומי בינה מלאכותית מכיוון שהם בנויים מהרבה מאוד אלמנטים לוגיים זהים המקושרים אחד לשני במארג צפוף של קישורים, ולכן קל לשחזר באמצעותם רשת נוירונים. הרכיבים יוצאים במסגרת אסטרטגיית FPGAi של החברה, אשר ממוקדת באספקת משפחות חדשות של רכיבים מיתכנתים ליישומי בינה מלאכותית באבזרי קצה.

מנכ"ל אינטל, פט גלסינגר, אמר במהלך כנס הלקוחות, שאינטל מביאה ה-AI לכל מקום ברחבי הארגון, מאבזרי הקצה, המחשב האישי ועד למרכז הנתונים. "הפלטפורמות האחרונות שלנו גאודי, Xeon ו-Core Ultra, מספקות קבוצה מגובשת של פתרונות גמישים המותאמים לצורכי הלקוחות שלנו ולהזדמנויות העצומות העומדות בפנינו".

אינטל מפתחת מעבד AI מבוסס גאודי 3

חברת אינטל (Intel) חשפה השבוע פרטים חדשים אודות מעבד הבינה המלאכותית החדש של הבאנה לאבס, Gaudi 3, ומעבד ה-GPU שלה עבור מחשבי-על, אשר יתבסס גם הוא על פלטפורמת Gaudi 3. החשיפה נעשתה בכנס מחשבי-העל והענן SC23, המתקיים השבוע בדנוור, קולורדו. מעבד גאודי 3 צפוי להגיע לשוק בשנת 2024, כאשר פלטפורמת ה-GPU החדשה למחשבי-על, Falcon Shores, מתוכננת להגיע לשוק בשנת 2025. היא תתבסס על מעבדי גאודי 3 ומעבדי Xe GPU.

גאודי 3 מציע שיפור של פי ארבעה בהשוואה לגאודי 2, הכפלה במהירות העברת מידע מהרשת והגדלה של פי 1.5 בנפח הזיכרון (HBM) . הוא ייוצר בתהליך ייצור של 5 ננומטר במתכונת של מארז גדול הכולל מספר תת-שבבים (Chiplets) ויכילל שני אשכולות עיבוד בניגוד לארכיטקטורה העיבוד המונליטית של Gaudi 2 (המיוצר בתהליך של 7 ננומטר). גאודי 3 יהיה מרכיב אינטגרלי בתוך מעבד ה-GPU העתידי של אינטל לתשתיות ענן, Falcon Shores, אשר יתבסס על שני מרכיבים: מעבד גאודי ומעבד Xe GPU.

מדובר במעבד המיועד להריץ מטלות בינה מלאכותית במחשבים חזקים מאוד. נראה שאינטל החליטה לחזור אל הרעיון של מעבדי XPU, המייצגים מאיצים ייעודיים למגוון משימות הפועלים במקביל למעבדי ה-CPU המרכזיים. גאודי מותאם למשימות אימון גדולות מאוד כמו בינה מלאכותית יוצרת ומודלים לשוניים מורכבים (משפחת GPT). מכיוון שהארכיטקטורה הזו שונה מזו של מעבדים גרפיים (GPU), אינטל החליטה לשלב את שתיהן (Gaudi + Xe GPU) בפלטפורמה אחת, המטפלת ברוב צורכי הבינה המלאכותית. מדובר בתצורה שונה מההכרזה המקורית של אינטל מפברואר 2022, שבה פלטפורמת Falcon Shores תוארה כשילוב של GPU ו-CPU.

בתוך כך אינטל חשפה פרטים אודות מחשב העל שהיא מתקינה בימים אלה במעבדה הלאומית Argonne של משרד האנרגיה האמריקאי, אורורה (Aurora). הוא כולל יותר מ-10,000 שרתים הכוללים כ-21,000 יחידות עיבוד מרכזיות ו-60,000 יחידות עיבוד גרפיות. לאחר הפעלה מלאה, Aurora צפוי להיות מדורג כמחשב העל המהיר בעולם. אינטל חשפה בכנס כי אורורה יהיה מסוגל להריץ מודלי AI הכוללים יותר מטריליון פרמטריםהיכולת הזו תשמש להאיץ פרויקטים מחקריים ומדעיים, תוך כדי אימון מדולי בינה מלאכותית על מערכי נתונים הכוללים טקסט, קוד ומידע מדעי.