בתמונה למעלה: חתימת הסכם הרכש בין קואלקום ל-Humain הסעודית. מקור: קואלקום
חברת קואלקום (Qualcomm) הכריזה אתמול (ב') על שני שבבי בינה מלאכותית חדשים למרכזי נתונים – AI200 ו-AI250 – שנבנו במיוחד לשלב ההיסק (Inference), כלומר להפעלת מודלים מאומנים בקנה מידה עצום. מדובר בכניסה מחודשת של קואלקום לעולם השרתים, עם הבטחה להציע את אחת הפלטפורמות היעילות ביותר בשוק מבחינת צריכת חשמל, רוחב פס לזיכרון ועלות כוללת להפעלה.
לפי נתוני החברה, שבב ה-AI200 יתמוך בזיכרון של עד 768 ג׳יגה-בייט מסוג LPDDR, בעוד דגם ה-AI250 כולל ארכיטקטורה חדשה המבוססת על Near-Memory Computing – כלומר, חישוב שמבוצע קרוב מאוד לרכיבי הזיכרון עצמם, במקום להעביר את הנתונים הלוך ושוב אל המעבד. השינוי הזה מצמצם באופן דרמטי את צוואר הבקבוק של העברת הנתונים ומגדיל את רוחב הפס האפקטיבי של הזיכרון פי עשרה בהשוואה למאיץ הקודם של החברה, Cloud AI 100 Ultra, כך לפי קואלקום.
מטרת הארכיטקטורה היא להשיג יעילות מקסימלית בשלב ההיסק, שבו נדרש לקרוא במהירות עצומה מיליארדי פרמטרים המאוחסנים בזיכרון המודל. בקואלקום מסבירים כי השילוב בין רוחב פס מוגדל, חישוב סמוך לזיכרון וקירור נוזלי ישיר מאפשר להריץ מודלים גדולים (כמו LLMs ומערכות מולטימודליות) בצריכת אנרגיה נמוכה משמעותית ביחס למערכות GPU מסורתיות.
לקוחה ראשונה מסעודיה
החברה מדגישה כי מדובר בפתרון Rack-Scale — לא רק שבב בודד אלא מערכת שלמה, שבה כמה עשרות מאיצים (accelerators) מחוברים יחד בתוך Rack יחיד עם רשת פנימית מהירה, ספקי כוח משותפים וניהול אחיד של עומסים וקירור. הרעיון הוא להפוך את ה-Rack עצמו ליחידת עיבוד חכמה, המוכנה מראש להרצת שירותי AI בהיקף ענק – החל מצ’אטבוטים ועד מודלים תעשייתיים בזמן אמת.
במקביל להשקה, קואלקום הכריזה אתמול גם על לקוחה משמעותית ראשונה עבור השבבים החדשים: חברת ה-AI הסעודית Humain מתכננת לפרוס החל משנת 2026 ארונות שרתים מבוססי AI200 ו-AI250 בהיקף של כ-200 מגה-ואט במרכזי נתונים בסעודיה, כחלק מהמאמץ הסעודי להתבסס כמוקד גלובלי למשאבי היסק.
ההשקה מסמנת מהלך אסטרטגי רחב יותר מצד קואלקום: החברה, שידועה בעיקר בזכות שבבי הסמארטפון שלה, מבקשת לתרגם את יתרונה ההיסטורי ביעילות חישובית גם לשוק מרכזי הנתונים. בניגוד לענקיות כמו אנבידיה, שמכוונות בעיקר לשוק האימון (Training), קואלקום מתמקדת בשלב ההיסק – שבו מתבצעת בפועל עיקר צריכת המשאבים בתעשיית הבינה המלאכותית.
אם תצליח לעמוד בהבטחותיה – קצב עיבוד גבוה, יעילות חשמלית ועלות תפעול נמוכה – היא עשויה לערער את ההגמוניה של אנבידיה בשוק, ולפתוח עידן חדש שבו מרכזי נתונים לא יתוכננו סביב ה-GPU, אלא סביב יחידות Inference ייעודיות. זהו לא רק שינוי הנדסי, אלא שינוי תפישתי: מעבר מהמירוץ אל “המעבד הכי חזק”, למירוץ החיסכון והיעילות של “ה-AI הכי חסכוני”.

עורכי המחקר הסבירו את הפער בביצועים ברשת T-Mobile בעובדה כי T-Mobile היא מפעילת התקשורת היחידה מבין השלוש שיש לה רשת דור-חמישי עצמאית בפריסה רחבה בעל ספקטרום רחב של תדרים ויישומים מתקדמים נוספים לניהול התעבורה. כאמור, ברמת החומרה זהו היתרון הבולט בין שני המודמים: Snapdragon של קואלקום תומך בגלים מילימטריים (MMWave), לעומת C1 של אפל, שאינו תומך בספקטרום הזה. כלומר, ככל שתתרחב הפריסה של רשתות 5G, המודם של קואלקום צפוי, אם להסתמך על המחקר, להציג ביצועים גבוהים יותר, לפחות בהשוואה לדור הראשון של מודם הבית של אפל.









