ניוריאליטי הציגה לראשונה ביצועי "עולם אמיתי" של שרת ה-AI

[בתמונה למעלה מימין לשמאל: צביקה שמואלי, משה תנך ויוסי קיסוס. צילום: אביב קורט]

חברת ניוריאליטי (NeuReality) מקיסריה פרסמה תוצאות של מבחני ביצועים שבדקו את ביצועיה של פלטפורמת שרת ה-AI של החברה, NR1-S, בהרצת משימות הסקת AI בסביבה המדמה מרכז נתונים (Data Center). מטרת המבדקים היתה להדגים את יכולת הפתרון של החברה לסייע משמעותית בהפחתת צריכת האנרגיה ועליות החומרה של דאטה-סנטר המריץ פתרונות הסקה (inference), כלומר יישום של מודולי AI.

NR1-S הוא שרת-על-שבב ייעודי שפיתחה ניוריאליטי לביצוע משימות הסקה, והוא כולל את המודולים של החברה, NR1-M, שתפקידם לווסת באופן אופטימאלי את העבודה של יחידות העיבוד. מודולים אלה מתוכננים לעבוד בשילוב עם מאיצי AI ייעודיים – ובמבחני הביצועים שנערכו נעשה שימוש במשפחת המאיצים Cloud AI-100 של קוואלקום. הפתרון נבחן בהשוואה למערכות מבוססות CPU הנמצאות בשימוש על ידי יצרנים כגון אנבידיה וחברות ענק המפעילות דאטה סנטרים גדולים במיוחד.

לדברי החברה, המבדקים העלו כי השילוב עם מאיצי קואלקום הוכיח רמת סקלאביליות אופטימאלית של 100%, חסכון של עד 90% בעלויות, ויעילות אנרגטית עד פי 15 יותר טובה בדאטה סנטרים של AI, בהרצות נפוצות של בינה מלאכותית.

בפרט, השילוב של ניוריאליטי וקוואלקום הדגים הפחתה של עלות הבעלות הכוללת (TCO) בשיעורים של 80% בעיבוד שפה טבעית, 88% בעיבוד דיבור אוטומטי ו-90% בעיבוד תמונה המשמשים בשירותים פיננסיים, בריאות, בטיחות ציבורית ותחבורה. כמו כן הוא הדגים יעילות משולבת של עלות ואנרגיה טובה פי 5-6 בעיבוד שפה טבעית, פי 8-10 בעיבוד דיבור אוטומטי ופי 13-15 בראיה ממוחשבת, יישומים שימושיים במיוחד בדימות רפואי, ביטחון פנים, תיעוד קליני מבוסס קול, תביעות ביטוח, גילוי הונאות בנקאיות, שירות לקוחות, יצירת תוכן ובידור מבוסס מולטימדיה. כמו כן, NR1-S עם Qualcomm® Cloud AI-100 Pro השיג סקלאביליות לינארית של 100% עם ResNet-50, ארכיטקטורה פופולארית למשימות סיווג תמונות.

תרשים המציג את השיפור בעלויות ובביצועים [מתוך בלוג החברה]

צווארי הבקבוק של GenAI

אילן אביטל, מנהל המו"פ של NeuReality, ואשר צוות ההנדסה שבראשותו סיים את ביצוע שלב המבחנים המקיפים של NR1-S, מסר: "תוצאות הביצועים בעולם האמיתי מציגות מענה ייחודי לאתגרים הגדלים שעמם מתמודדים ספקי וצרכני תשתיות AI מהדור הבא. יחידות עיבוד גרפיות (GPUs) מהירות יותר מניעות חדשנות בזכות יכולות AI מתקדמות, אך הן גם מרחיקות אותנו יותר ויותר מהיכולת להתמודד עם המציאות התקציבית והאנרגטית של רוב החברות".

מודלים של בינה מלאכותית יוצרת כמו מודלי שפה גדולים (LLMs) נתקלים באותם צווארי בקבוק של CPU כמו AI מסורתי. לפי הפוסט שפרסמו אילן אביטל ואנשי צוותו לסיכום מבחן הביצועים, הבעיה מחמירה עם מודלי AI מתקדמים ומאיצים אשר אינם מנוצלים היטב.

"התעשייה של היום ממשיכה להתקדם תוך ראייה צרה המבוססת על השגת ביצועים גולמיים גבוהים יותר עבור המודלים הגדולים והמתקדמים ביותר של AI באמצעות מערכות AI חזקות יותר ויותר. כתוצאה מכך, צריכת האנרגיה והעלויות ממשיכות לעלות ולהקשות על השימוש המעשי של AI עבור רוב הארגונים", הוסיף אביטל.

משה תנך, מנכ"ל ומייסד משותף של NeuReality, אמר: "התוצאות, שבחנו ביצועים בעולם האמיתי, מצביעות על משהו שונה לגמרי.  למרות שמדובר בימים מוקדמים בעידן ה-AI, חשוב כבר עכשיו להציע נתיב טוב יותר עבור דאטה סנטרים המריצים משימות של הסקה בבינה מלאכותית".

תרשים המציג את החיסכון באנרגיה [מתוך בלוג החברה]

ניוריאליטי נוסדה בשנת 2019 ומונהגת על ידי צוות הנהלה בעל ניסיון רב בארכיטקטורת דאטה סנטרים, מערכות ותוכנה. מייסדי החברה הם משה תנך, המשמש כמנכ"ל, צביקה שמואלי, סגן נשיא לתפעול, ויוסי קסוס המשמש כסגן נשיא לפיתוח שבבים. לפני הקמת ניוריאליטי, משה תנך כיהן בתפקידים בכירים כמנהל הנדסה במארוול ובאינטל וסגן נשיא למו"פ בדיזיינארט נטוורקס (שנרכשה מאוחר יותר על ידי קוואלקום). צביקה שמואלי כיהן כסגן נשיא Backend במלאנוקס וכסגן נשיא להנדסה בהבאנה לאבס. יוסי קסוס שימש כדירקטור בכיר להנדסה במלאנוקס וכראש תחום פיתוח השבבים באיזיצ'יפ. הצוות המוביל של החברה כולל את ה-CTO ליאור חרמוש, לשעבר מייסד משותף ומדען ראשי של ParallelM ו-fellow בחברת PMC Sierra, ואילן אביטל  מנהל המו"פ(CRO – Chief RND Officer) , מבכירי מערך המו"פ של אינטל לשעבר ,שכיהן כסגן נשיא הנדסה של חטיבת התקשורת למרכזי נתונים (VP Engineering, Datacenter Networking).

ניוריאליטי מעסיקה כיום כ-70 עובדות ועובדים במרכזי הפיתוח של החברה בקיסריה ובתל אביב. בכוונת החברה לגייס בשנה הקרובה עשרות עובדות ועובדים נוספים על מנת לתמוך באתגרי הפיתוח ובצמיחת החברה המואצת.

"מרכזי הנתונים עוברים למתכונת של קירור נוזלי"

בתמונה למעלה: מאוריציו פריציירו. "קירור נוזלי יהיה הנורמל בתעשייה". צילום: Techtime

מרכזי הנתונים משנים את פניהם. מנהל תחום החדשנות בחטיבת מערכות הקירור של Schneider Electric, מאוריציו פריציירו, סיפר ל-Techtime שמחקרי השוק של החברה מלמדים שמרכזי הנתונים מתחילים סוף סוף להיכנס לשלב המעבר לשימוש בטכנולוגיות קירור נוזלי. "אנחנו מדברים על הצורך בקירור נוזלי כבר כמעט 10 שנים, אבל רק עכשיו חברות הענן הגדולות מתחילות להתעניין בטכנולוגיה". פריציירו עומד בראש צוות של 13 מומחים ואנליסטים מרחבי אירופה, אשר מצויים בקשר הדוק עם כל קבלני הדטה סנטר הגדולים בעולם במטרה להבין את המגמות בשוק.

פריציירו: "בעבר רק יצרני מחשבי-על ואחר כך מפעילי מרכזי קריפטו התעניינו בקירור נוזלי. אולם כיום מרכזי הנתונים מתרחבים בקצב גובר, והבינה המלאכותית הופכת אותם לצפופים יותר. התרגלנו בעבר לצריכת הספק של כ-5kW לכל מסד, אבל כיום הלקוחות מבקשים לקבל 15kW למסד. פיזור החום של קירור אוויר מסורתי כבר לא מספקת מענה לצורכי הקירור. בשניידר התחלנו לעבוד על הטכנולוגיות האלה לפני מגיפת הקורונה, וביצענו פרוייקטים ראשונים ב-2022. אבל רק השנה אנחנו מרגישים שהמגמה הזאת מתחילה להיות משמעותית. כל יצרני המערכות למרכזי נתונים גדולים פנו אלינו בבקשה לקבל מידע על קירור נוזלי וכיצד משתמשים בו. זה הולך להיות הנורמל בתעשיית ה-Data Centers".

שרתי הדור הבא יהיו טבולים באמבטיות

קיימות שתי גישות מרכזיות לקירור נוזלי במרכזי נתונים: קירור ישיר ברמת מעבדי השרתים, וקירור שיקוע ברמת הכרטיסים ומסדי השרתים. הקירור הישיר מתבצע באמצעות הזרמת מים או נוזל קירור אחר אל מפזר חום הנמצא במגע ישיר עם המעבד. בשיטה הזאת ניתן לסלק 80%-50% מהחום שהמעבד מייצר. הקירור בשיקוע מבוסס על שמן או נוזל אחר שאינו מוליך חשמל, אשר מאפשר לסלק כ-95% מהחום שהשרת מייצר. שתי הגישות המרכזיות של קירור בשיקוע הן: קירור כל שרת בנפרד, או קירור מסד השרתים כולו. בטכניקה הראשונה, השרת נמצא בתוך תיבה אטומה המשמשת כאמבטיית שיקוע שאליה מגיע נוזל הקירור וממנו הוא יוצא אל מחליף חום. בגישה השנייה, מושקעים מספר רב של כרטיסי שרת בתוך אמבטיית נוזל קירור גדולה ומשותפת.

שתי השיטות לקירור נוזלי ישיר ברמת מעבדי השרתים
שתי השיטות לקירור נוזלי ישיר ברמת מעבדי השרתים

 

כיצד עוברים מקירור אוויר לקירור נוזלי?

"כאשר מערכת המיזוג במרכז הנתונים מבוססת על שימוש במים קרים, ניתן לבצע את המעבר בקלות יחסית. אבל אם הקירור מבוסס על שיטה אחרת – צריך להחליף את כל המערכת הקיימת. מכיוון שאי-אפשר לסגור את מרכזי הנתונים, אנחנו מאמינים שמתפתח עכשיו שוק חדש וגדול של החלפת מערכות הקירור במרכזי נתונים פעילים. אבל זהו רק חלק מהתמונה: גם השרתים עצמם נמצאים כעת בתהליכי שינוי והתחדשות, ולכן קיבלנו החלטה אסטרטגית לפתח מערכות קירור אוניברסליות – המתאימות לכל סוגי השרתים. הצלחת המעבר לקירור נוזלי תלויה ברמת שיתוף הפעולה בין כל השחקנים באקוסיסטם של מרכזי נתונים".

החום הגבוה של בינה מלאכותית

להערכת החברה, כ-70%-80% מהחום המיוצר בכל שרת סטנדרטי מגיע מהמעבד המרכזי (CPU). השינוי המתחולל כיום, עם הכניסה של מאיצי עיבוד נוספים כמו GPU ו-NPU, מכפיל את כמות החום שכל שרת מייצר. מהי עלות הקירור? לפי שניידר אלקטריק, הקירור מהווה 70% מעלויות האנרגיה של מרכזי נתונים, שהם עצמם אחד מצרכני האנרגיה הגדולים בעולם. השפעתו מוחשית מאוד: לשינוי של 1% בטמפרטורת השרתים, יש השפעה של 4% על עלויות האנרגיה הכוללות של מרכז הנתונים.

השיחה עם מאורציו התקיימה במסגרת סיור עיתונאים שאירגנה חברת Schneider Electric במפעל מערכות הקירור שלה ליד ונציה. המפעל מייצר פתרונות קירור ברמת השרת הבודד, ארון השרתים, ועד פתרונות עבור המרכז הנתונים השלם. כעת הוא נמצא בתהליכי התרחבות עקב הדרישה הגוברת לקירור מרכזי נתונים. כדי להמחיש את היקף הבעיה, ביקרנו במרכז הנתונים של חברת Stack, אשר מאכלס 1,060 ארונות שרתים בשטח של 100,000 מ"ר. לאורך צידי המבנה מסודרים עשרות מחליפי חום עצומים בגודל של בניין דירות ישראלי ממוצע כל אחד, ו-9 גנרטורים המייצרים ביחד חשמל בהספק של 25 ג'יגה-ואט ביום.

השלב הבא: תרומת חום לקהילה

עלויות האנרגיה כל-כך גדולות, שהחברה החלה לבדוק תוכניות שימוש חוזר בחום (Heat Reuse) מול הרשויות המקומיות באתרי הפעילות שלה בעולם: במקום לסלק את כל החום המיוצר במרכזי הנתונים, היא מציעה להעבירו לשימוש מקומי, כמו למשל חימום מים, מערכות מיזוג אוויר במבנים ציבוריים, מתקני המרת חום לאנרגיה ועוד. לאור הציפייה בתעשייה שנפח מרכזי הנתונים יוכפל בתוך 20 שנה, התחזית לעתיד ברורה מאוד: יהיה חם.

באיור למטה: השיטות המרכזיות לקירור שרתים ומסדים באמצעות שיקוע בנוזל מסלק חום. מקור: Schneider Electric