ניוריאליטי השיקה פורטל פיתוח ליישום שרת ה-AI שלה

[בתמונה למעלה מימין לשמאל: צביקה שמואלי, משה תנך ויוסי קיסוס. צילום: אביב קורט]

חברת ניוריאליטי (NeuReality) מקיסריה, שמפתחת ומספקת תשתיות בינה מלאכותית עבור ארגונים וממשלות, השיקה פורטל חדש למפתחים, הכולל כלי הדגמה המסייעים בהתקנה פשוטה של פתרון התוכנה וממשקי תכנות היישומים (APIs) שלה.

השקת הפורטל מגיעה לאחר שהחברה סיפקה והפעילה את שרת ה-AI על גבי שבב ב-7 ננו-מטר מדגם NR1 NAPU והשלימה את ההפעלה והאימות של כל מערכת החומרה והתוכנה NR1 שלה ברבעון הראשון.

לדברי ניוריאליטי, הפתרון שלה מקנה למפתחים את היכולת לפרוס את מערכות ה-AI המתקדמות והמורכבות ביותר באופן גמיש וקל יותר על בסיס הדרישות הספציפיות של כל פרויקט. הוא מעניק למפתחים מערך כלים להאצת כל תהליכי הפיתוח, השילוב וההקצאה של מערכות AI, לצד ממשקי תכנות יישומים להסקה המאפשרים לזרז את תהליך פריסת המערכות.

ה-NR1, פתרון ההסקה (inference) לבינה מלאכותית של ניוריאליטי, מאפשר לעסקים ולממשלות להריץ מודלי AI חדשים ויישומים קיימים ללא צורך להשקיע מיליוני דולרים במעבדי GPUs (יחידות עיבוד גרפיות) הנמצאים כיום במחסור. מעבדי CPU נותרו צווארי הבקבוק העיקריים לביצועי הסקה לבינה מלאכותית, ללא תלות בביצועי מאיץ ה-AI, מה שמביא לרמות גבוהות מדי של צריכת הספק ועלויות ולא מאפשר לרוב הארגונים להתקין ולהפעיל מערכות AI חדשניות.

תו תקן מ-TSMC

מערכת NR1 מוכנה לפריסה אצל לקוחות החל מהרבעון הראשון של 2024 לאחר שמעבד ה-NAPU הגיע בדצמבר, ממפעלי ייצור השבבים של TSMC בטאיוואן, ועבר בהצלחה אקטיבציה, בדיקות אימות מקיפות ואינטגרציית מערכת בתוך 90 יום בלבד.

"העובדה שסטארט אפ עם צוות טכני קטן מצליח לבצע אינטגרציית מערכת AI כה מורכבת, מהסיליקון ועד השרת והתוכנה, באופן מהיר וחלק היא מרשימה", אמר אילן אביטל, מנהל המו"פ בניוריאליטי.

המערכת של ניוריאליטי עמדה במכלול הדרישות הפונקציונליות בהיבטים של שרת על גבי שבב, IP ייעודי, מערכת ותוכנה. אבן דרך זו מסמנת את המוכנות של המערכת לפיילוטים אצל לקוחות בדגש על ספקי שירותי ענן, שירותים פיננסיים ושירותי בריאות, עבור יישומים של ראייה ממוחשבת, זיהוי אוטומטי של דיבור ועיבוד שפה טבעית. הישג זה מניח יסודות כלכליים איתנים למערכות עתידיות של בינה מלאכותית יוצרת (Generative AI), מערכות מולטי-מודאליות (שיכולות לטפל בקלטים ממגוון סוגים) וטכנולוגיות מתקדמות נוספות. לדברי ניוריאליטי, האקטיבציה והתיקוף המהירים של NR1 נובעים מתהליך קפדני של תכנון מערכת ושל אמולציה מקיפה שהחברה ביצעה בשיתוף עם סינופסיס לפני הטייפ אאוט ב-2023.

לדברי אילן אביטל: "שיעור האימוץ של AI עומד על 35% בממוצע עולמי ופחות מ-25% בארצות הברית. ניוריאליטי ממוקדת בהנמכת החסמים שעומדים בפני ענפים מרכזיים בכלכלה בכל הקשור ליישום מערכות AI. יישום כזה הוא כרגע מחוץ להישג היד של רוב העסקים. שרתי ההסקה האידיאליים לבינה מלאכותית דורשים תצורות שרת שונות לחלוטין ויעילות יותר ביחס למחשבי העל ולמעבדי ה-GPU המתקדמים בהם נעשה כיום שימוש באימון של בינה מלאכותית. אנחנו יכולים להתחיל לשנות זאת כבר עכשיו דרך צמצום של צריכת ההספק הגבוהה כבר במקור והורדת עלויות עבור הלקוחות".

ניוריאליטי נוסדה בשנת 2019 ומונהגת על ידי צוות הנהלה בעל ניסיון רב בארכיטקטורת דאטה סנטרים, מערכות ותוכנה. מייסדי החברה הם משה תנך, המשמש כמנכ"ל, צביקה שמואלי, סגן נשיא לתפעול, ויוסי קסוס המשמש כסגן נשיא לפיתוח שבבים. הצוות המוביל של החברה כולל את ה-CTO ליאור חרמוש ואת אילן אביטל מנהל המו"פ(CRO – Chief R&D Officer) , מבכירי מערך המו"פ של אינטל לשעבר. ניוריאליטי, שגייסה מהקמתה 70 מיליון דולר, מעסיקה כיום למעלה מ-60 עובדות ועובדים בישראל, אירופה וארצות הברית. בכוונת החברה לגייס בשנה הקרובה עשרות עובדות ועובדים נוספים למרכזי הפיתוח של החברה בקיסריה ובתל אביב על מנת לתמוך באתגרי הפיתוח ובצמיחה המואצת של החברה.

מועצת החדשנות האירופית השקיעה בניוריאליטי

בתמונה למעלה מימין לשמאל: צביקה שמואלי, משה תנך ויוסי קיסוס. צילום: אביב קורט

חברת ניוריאליטי (NeuReality) מקיסריה השלימה גיוס הון בהיקף של 20 מיליון דולר שהתבצע בהשתתפות קרן מועצת החדשנות האירופית European Innovation Council)) וקרנות ההון סיכון Varana Capital, Cleveland Avenue, OurCrowd ו-XT Hi-Tech. גיוס ההון מיועד לממן את המכירות והשיווק, בעקבות השלמת הפיתוח ואבטחת הייצור בסוף שנת 2023, ומעבר למכירות מסחריות. גיוס ההון הקודם של החברה הושלם בנובמבר 2023 ובמהלכו היא גייסה 35 מיליון דולר. מאז הקמתה החברה גייסה כ-70 מיליון דולר.

חברת ניוריאליטי פיתחה טכנולוגיה ייעודית מבוססת חומרה ותוכנה אשר נועדה להאיץ פי 10 את מהירות העיבוד של משימות הסקה (Inference) במרכזי נתונים. הפתרון של החברה מבוסס על שבב חומרה ייעודי שהיא פיתחה (NeuReality NR1), אשר מיוצר בחברת TSMC בתהליך של 7 ננומטר ופועל ביחד עם חבילת תוכנות להפעלת השבב ולניהול מטלות ההסקה. מעבד הליבה מבוסס על ארכיטקטורת NAPU – Network Addressable Processing Units, שלהערכת החברה היא יעילה יותר עבור הסקות AI מהגישה הקלאסית של שרתים מבוססי CPU.

הארכיטקטורה הזו מאפשרת לבצע מטלות העברת נתונים (data-path functions) רבות בחומרה עצמה ולא בתוכנה, כפי שמקובל היום, ועל-ידי כך להאיץ את העיבוד (DLA – Deep Learning Acceleration). מייסד משותף ומנכ"ל החברה, משה תנך, אמר שמאיצי ה-AI הקיימים היום בשוק מאופיינים בנצילות נמוכה של כ-30%-40% בלבד. "השקעות נרחבות במאיצי למידה עמוקה (DLAs) לא פותרת את בעיית יעילות המערכת. הדבר דומה להתקנת מנוע חזק במכונית – כדי להתגבר על פקקי תנועה. אנחנו מספקים 'נתיב תחבורה מהיר ורחב' אשר מנתב משימות למאיצי AI ייעודיים, ועל-ידי כך מגיע לזמני תגובה מהירים".

שרת ההסקות NR1-S של חברת ניוריאליטי
שרת ההסקות NR1-S של חברת ניוריאליטי

כיום החברה מספקת שני פתרונות מרכזיים: שרת בינה מלאכותית מלא מדגם NR1-S, המכיל 10 רכיבי NeuReality NR1 ו-10 מאיצי דיפ לרנינג (Deep Learning Accelerator) ומעבדי GPU, ומודול NR1-M המופיע בכרטיס PCIe, אשר מכיל רכיב אחד של ניוריאליטי ויכול להתחבר אל מאיצים ושרתים קיימים סטנדרטיים. כיום היא מבצעת התקנות ראשונות בקרב ספקים נבחרים של שירותי ענן ולקוחות ארגוניים במגזרי השירותים הפיננסיים, שירותים עסקיים וממשלה.

חברת ניוריאליטי נוסדה בשנת 2019 על-ידי משה תנך, סגן נשיא לתפעול צביקה שמואלי, וסגן נשיא לפיתוח שבבים יוסי קסוס. לפני הקמת ניוריאליטי, מילא משה תנך תפקידים הנדסיים בכירים במארוול ובאינטל ישראל ושימש כסגן נשיא למו"פ בדיזיין-ארט נטוורקס (שנמכרה לקואלקום). צביקה שמואלי כיהן כסגן נשיא Backend במלאנוקס וכסגן נשיא להנדסה בהבאנה לאבס. יוסי קסוס שימש כדירקטור בכיר להנדסה במלאנוקס וכראש תחום פיתוח השבבים באיזיצ'יפ. הצוות המוביל של החברה כולל את ה-CTO ליאור חרמוש, לשעבר מייסד משותף ומדען ראשי של ParallelM ו-fellow בחברת PMC Sierra, ומנהל המו"פ אילן אביטל, לשעבר סגן נשיא הנדסה של חטיבת התקשורת למרכזי נתונים בחברת אינטל.

שרת ה-AI של ניוריאליטי ייצא לשוק לפני סוף 2023

חברת ניוריאליטי (NeuReality) מקיסריה יוצאת משלב המו"פ ומתכננת להתחיל במכירת שרתי ה-AI ממשפחת TR1, כבר לפני סוף 2023. החברה דיווחה שהמוצרים ייצאו לשוק בשותפות עם שותפים מתחומי התוכנה, שירותי ענן ויצרני מחשבים. חברת ניוריאליטי פיתחה פתרון כולל הבנוי מחומרה ותוכנה אשר נועד להאיץ פי 10 את מהירות העיבוד של משימות הסקה (Inference) במרכזי נתונים. התפישה של החברה נקראת AI-centric, ומבוססת על ההנחה שעקב הגידול העצום בעיבוד מבוסס בינה מלאכותית במרכזי הנתונים, יש צורך בשרתים ייעודיים לתחום זה.

הארכיטקטורה של החברה מבוססת על שבבי חומרה ייעודיים המיוצרים בחברת TSMC בתהליך של 7 ננומטר, וחבילת תוכנות להפעלת השבב ולניהול מטלות ההסקה. מעבד הליבה מבוסס על ארכיטקטורת NAPU – Network Addressable Processing Units, שלהערכת החברה היא יעילה יותר עבור הסקות AI מהגישה הקלאסית של שרתים מבוססי CPU. הארכיטקטורה הזו מאפשרת לבצע מטלות העברת נתונים (data-path functions) רבות בחומרה עצמה ולא בתוכנה, כפי שמקובל היום, ועל-ידי כך לקבל האצה טובה יותר בעיבוד רשתות נוירוניות (DLA – Deep Learning Acceleration).

מנכ"ל החברה, משה תנך, מסר ל-Techtime שהחברה תגיע לשוק עם שני מוצרים מרכזיים: השרת המלא NR1-S, אשר מכיל 10 רכיבי ניוריאליטי ו-10 מאיצי דיפ לרנינג ומעבדי GPU או ASIC, והמוצר השני הוא כרטיס PCIe בשם NR1-M, אשר מכיל רכיב אחד של ניוריאליטי ויכול להתחבר אל שרתים קיימים סטנדרטיים. היציאה לשוק תתבצע בשיתוף פעולה עם חברות גלובליות אשר ישתמשו בטכנולוגיה של ניוריאליטי: יבמ, AMD וקואלקום אשר יציגו מאיצי דיפ לרנינג מבוססי TR1, ספקית שירותי הענן Cirrascale ויצרניות המחשבים והשרתים לנובו ו-SuperMicro.

אתגר ה-AI דורש פתרון לא סטנדרטי

לדבריו, ניתן אומנם להשתמש בטכנולוגיה כאל כרטיס האצה המוכנס לשרת סטנדרטי בדטה סנטר, "אולם הערך הגדול ביותר שלה מתקבל כאשר מחברים את הכרטיס אל השרת הייעודי שפותח בניוריאליטי. בתחילה הוא יהיה זמין לרכישה ישירה מניוריאליטי, ובהמשך השנה ניתן יהיה לרכוש אותו מהחברות דל, לנובו, HP וסופר-מיקרו". השלב הראשון בתהליך היציאה לשוק יתחיל בשבוע הבא, כאשר החברה תציג את פלטפורמת NR1 בכנס SC23 שיתקיים בדנוור, ארה"ב.

ניוריאליטי הוקמה בשנת 2019 ומעסיקה כיום כ-50 עובדים במרכזי הפיתוח שלה בקיסריה ובתל אביב. היא זיהתה את בעיית ההסקה כצוואר בקבוק בתחום השימוש בבינה המלאכותית (מודלי LLM ו-GenerativeAI) עקב הגידול המהיר והיקף המידע שיש לעבד, ופיתחה טכנולוגיית מענה המוגנת ב-14 פטנטים. לאחרונה העריך מנכ"ל אנבידיה שעל כל דולר המושקע באימון של מודל AI, יושקעו 8 דולרים על הרצת המודלים (הסקה). תנך: "עלויות האנרגיה והעלויות הכספיות האסטרונומיות האלה רק יגדלו ככל שתוכנות, יישומים ו-pipelines יתפתחו בשנים הבאות על גבי מודלי AI בעלי תחכום גובר".

סגנית נשיא AMD מצטרפת לדירקטוריון NeuReality

חברת ניוריאליטי (NeuReality) מקיסריה הודיעה שסגנית נשיא ומנהלת חטיבת השרתים בחברת AMD, לין קומפ (Lynn A Comp), מצטרפת למועצת המנהלים של ניוריאליטי. לין היא בעלת נסיון של 25 שנה בתעשיית השבבים, ובעבר כיהנה כסגנית נשיא קבוצת מרכזי הנתונים (דטה סנטר) של אינטל. בשנת 2020 צירף אותה המגזין Connected World לרשימת הנשים המשפיעות בטכנולוגיה. דירקטוריון החברה מונה בכירים נוספים מהתעשייה העולמית, בהם: ד"ר נאבין ראו (Naveen Rao), לשעבר מנהל קבוצת מוצרי AI באינטל ו-סי.ג'יי ברונו (CJ Bruno), לשעבר מנהל קבוצת המכירות והשיווק של אינטל באמריקה.

מייסד משותף ומנכ"ל NeuReality, משה תנך, אמר שצירופה של לין לדירקטוריון, "יסייע לנו  לעבור משלבי הפיתוח לשלבי הייצור וההטמעה בשוק. בעזרתה נשכלל את אסטרטגיות השוק שלנו עבור מוצרי ושירותי ההסקה שלנו המבוססים על AI". לין אמרה שניוריאליטי מציעה גישה חדשנית בתחום פלטפורמות עיבוד ממוקדות AI באמצעות פתרון הסקה קל להטמעה מקצה לקצה. "לפתרון הזה יש פוטנציאל להפוך לתקן הזהב של אפליקציות AI מורכבות בהיקף רחב".

חברת ניוריאליטי מפתחת פתרונות הסקה (inference) עתירי ביצועים מבוססי חומרה ותוכנה. מוצר הדגל שלה הוא שבב NR1, שהוא המוצר הראשון בקטגוריית מעבדים שהחברה הגדירה, בשם Network Addressable Processing Unit. השבב הזה משמש כעין שרת-בשבב ומיועד לשימוש במרכזי נתונים שבהם יש צורך לבצע עיבוד רחב היקף של אלגוריתמי בינה מלאכותית.

גיוס עובדים חדשים

השבב כולל את מרכיבי הקישור, העיבוד ומאיצי בינה מלאכותית (Deep Learning Accelerators). החברה גם מספקת פתרונות מדף בכרטיסי PCIe וחבילת תוכנות וכלים לביצוע יעיל של משימות העיבוד הנדרשות. הגישה הזאת מספקת ביצוע מהיר של מטלות המבוצעות כיום באמצעות תוכנה ולכן הן איטיות יותר, דוגמת ניהול, עיבוד פקודות הכנת המידע לרשת הנוירונים ועוד.

החברה הוקמה בשנת 2019 על-ידי משה תנך, סמנכ"ל התפעול צביקה שמואלי וסמנכ"ל פיתוח שבבים יוסי קסוס. תנך הגיע מאינטל ומארוול, צביקה שמואלי הגיע ממלאנוקס והבאנה לאבס. יוסי קסוס שימש כדירקטור בכיר להנדסה במלאנוקס וכראש תחום פיתוח שבבים באיזיצ'יפ (שנימכרה למלאנוקס). ה-CTO, ליאור חרמוש, הוא לשעבר fellow בחברת PMC Sierra. בסוף 2022 השלימה ניוריאליטי גיוס הון בהיקף של כ-35 מיליון דולר. כיום החברה מעסיקה כ-50 עובדים במרכזי פיתוח בתל אביב ובקיסריה, ומתכננת להכפיל את מצבת העובדים בשנה הקרובה.