ניוריאליטי החלה באספקת שרתי AI שפותחו עם קואלקום
16 יולי, 2024
המנכ"ל משה תנך: "ה-CPU נשאר צוואר הבקבוק של תשתיות הבינה המלאכותית. פיתחנו ארכיטקטורת שרת אלטרנטיבית המבוססת על מעבד שלנו כתחליף ל-CPU - והסרנו את צוואר הבקבוק הזה"
מייסד משותף ומנכ"ל ניוריאליטי, משה תנך. צילום: יוסי זליגר.
חברת ניוריאליטי (NeuReality) מקיסריה החלה לספק החודש שרתים להאצת יישומי AI, אשר פותחו בשיתוף פעולה עם קואלקום וכוללים את הטכנולוגיה שלה. מייסד משותף ומנכ"ל ניוריאליטי, משה תנך, גילה בשיחה עם Techtime שאחד מהלקוחות הוא ספק שירותי ענן מארה"ב אשר מתמקד באספקת שירותי ענן עבור כלי-רכב אוטונומיים, יישומי הדמאה רפואית (Medical Imaging) ויישומים המבוססים על עיבוד מודלי שפה (Natural Language Processing – NLP). השרתים מבוססים על מעבד של החברה, כרטיס עיבוד המיוצר בישראל ושרת שלם המיוצר בפוקסקון בטאיוואן.
חברת ניוריאליטי זיהתה את בעיית תעבורת המידע כמחסום המונע שימוש יעיל ביישומי בינה מלאכותית, וגורם לבזבוז עצום של אנרגיה. הטכנולוגיה של החברה מבוססת על הגדרה מחדש של מטלות עיבוד מרכזיות וייצור שבב ייעודי המתמודד עימן, ומוגנת באמצעות 21 פטנטים רשומים. תנך: "בעקבות הגידול ביישומי בינה מלאכותית, המבנה של שרת הנתונים נמצא כעת בתהליכי שינוי. בעבר הוא התבסס על מעבד מרכזי (CPU) וכרטיס תקשורת (NIC). היום נוספו למערך הזה מעבדי עזר, כמו למשל מעבדי GPU שנועדו לסייע בעיבוד המקבילי המאסיבי הנדרש במטלות בינה מלאכותית (AI).
"אולם ה-CPU נשאר צוואר הבקבוק של המערכת. בניוריאליטי פיתחנו ארכיטקטורה אלטרנטיבית לשרת הסטנדרטי, אשר מיושמת באמצעות מעבד שלנו מסוג Network Addressable Processing Unit (NAPU) כתחליף ל-CPU – והסרנו את צוואר הבקבוק הזה". הארכיטקטורה של החברה מבוססת על מעבד ייעודי המיוצר ב-TSMC בתהליך של 7 ננומטר, ותוכנה להפעלת השבב וניהול מטלות ההסקה. שבב NAPU כולל מעבד ARM Neoverse וארבעה מנועי עיבוד הנעזרים ב-16 ליבות DSP, כאשר הניהול מתבצע באמצעות ה-CPU הפנימי, אולם הנתונים מועברים ישירות ל-DLA – Deep Learning Acceleration.
הגישה הזאת מאפשרת לבצע מטלות העברת נתונים (data-path functions) רבות בחומרה עצמה, ולא בתוכנה כפי שמקובל היום, ועל-ידי כך לקבל האצה טובה יותר בעיבוד רשתות נוירוניות. למרות שהמודל העסקי של החברה מבוסס על מכירת כרטיסי האצה הנתקעים בשרתים קיימים, היא נכנסה אל השוק באמצעות שרת מלא. תנך הסביר מדוע: "המוצר שלנו מיועד לחברות ענן ולמרכזי נתונים גדולים. כשאתה מביא לחברות מהסוג הזה ארכיטקטורה חדשה, אתה צריך להראות תכנון ייחוס ומוצרים עובדים.
"על הרקע הזה חתמנו לפני שנתיים על הסכם שיתוף פעולה עם חברת לנובו שבמסגרתו פיתחנו ביחד את השרת אשר מיוצר על-ידי פוקסקון בטאיוואן. "כיום אנחנו מוכרים את השרתים האלה ללקוחות, אולם ליבת העסקים שלנו תתמקד במכירת כרטיסי העיבוד NR1, שהם מודול שלם במתכונת של כרטיס נתקע המתאים לכל סוגי השרתים בשוק".
מהו שוקי היעד המרכזיים שלכם?
"כרגע השוק הגדול ביותר הוא של מרכזי הנתונים, אבל הלחץ הגדול יהיה להערכתנו בשוק המתהווה של תשתיות מסחריות וייצור. למעשה, כל מה ששרתים מנהלים. ארגונים גדולים שביצעו השקעות גדולות מאוד בבינה מלאכותית מתחילים לחוש בעלויות הגדולות הכרוכות בכך, בצריכת האנרגיה הגוברת ובקשיי היישום. אנחנו לא באים ומציעים להחליף את מחשבי אנבידיה, אלא רק להוסיף עוד שרת למערכת, ולהתחיל להעביר את העומסים דרך הערוץ שלנו. אנחנו עובדים בשיתוף פעולה עם יבמ, קואלקום ועם AMD לאספקת מאיצי AI, כאשר ההסכם עם יבמ הוא לפיתוח שרת של יבמ שיהיה בו מאיץ AI שלנו. כעת אנחנו גם רואים התפתחות שוק חדש: חברות אשר מספקות ממשקים להפעלת יישומי תוכנה (API) עבור שירותי בינה מלאכותית".
פורסם בקטגוריות: חדשות