doubleAI: שיפרנו פי 3.6 את קוד ה-GPU של אנבידיה

3 מרץ, 2026

מייסד ומנכ"ל פרופ' אמנון שעשוע: מערכת ה-AI ‏WarpSpeed שיכתבה מחדש ליבות CUDA בספריית RAPIDS והשיגה שיפור משמעותי. "מודלי השפה הקיימים 'קורסים' כאשר הדאטה נדיר והאימות מורכב"

מאת: יוחאי שויגר

חברת הסטארט-אפ doubleAI, שהוקמה על-ידי המנכ"ל פרופ' אמנון שעשוע וה-CTO פרופ' שי שלו-שוורץ, הודיעה כי מערכת הבינה המלאכותית שלה, WarpSpeed, הצליחה לשכתב ולאופטם מחדש את קרנלי ה-CUDA של ספריית cuGraph — חלק מחבילת RAPIDS, אקוסיסטם התוכנה של אנבידיה לעיבוד נתונים על גבי GPU, ולהשיג שיפור מהירות ממוצע של פי 3.6 לעומת גרסאות שפותחו ושופרו במשך עשור על ידי מהנדסי CUDA של אנבידיה במסגרת אותו פרויקט. לדברי החברה, כל אחד מהקרנלים שנבדקו הציג שיפור כלשהו, ויותר ממחציתם השתפרו ביותר מפי שניים. הקוד פורסם ב-GitHub, כך שמשתמשים יכולים, לטענתה, להתקין את הגרסה המואצת ללא שינוי בקוד הקיים, וההכרזה לוותה בפוסט פומבי של שעשוע ברשת X ובבלוג טכני מפורט.

cuGraph היא חלק מחבילת RAPIDS של NVIDIA ונחשבת לאחת הספריות המרכזיות בעולם לעיבוד גרפים על גבי GPU, תחום קריטי לניתוח רשתות, מנועי המלצה, סייבר, ביואינפורמטיקה ומערכות פיננסיות. הקרנלים שבה נכתבו לאורך שנים בידי מהנדסים המתמחים באופטימיזציית ביצועים ברמת חומרה, תחום שבו כל החלטה הנוגעת לפריסת זיכרון, תזמון threads, מבנה warps והתנהגות cache משפיעה באופן דרמטי על התוצאה. בניגוד לכתיבת קוד יישומי רגיל, כאן מדובר במרחב החלטות עמוק ותלוי-הקשר שבו אין "פתרון נכון" אחד, אלא איזון עדין בין אילוצים פיזיים וחישוביים.

האם מדליות הזהב של ה-LLM היו מצג שווא?

אלא שמעבר להישג ההנדסי עצמו, שעשוע מציג את המהלך כחלק מדיון רחב יותר על גבולות הבינה המלאכותית המודרנית, ובעיקר על השאלה האם מודלי שפה מבוססי סקיילינג אכן מסוגלים להתמודד עם בעיות עומק מורכבות שבהן הדאטה מצומצם, האימות קשה, ושרשרת קבלת ההחלטות ארוכה ותלוית-הקשר. בהקשר הזה הוא מבקר גם את הדרך שבה נמדדים כיום הישגי AI. בפוסט שפרסם, מחדד שעשוע כי אף ש־AI כבר “זכה במדליות זהב ב-IMO” ו“התעלה על מתכנתים מובילים ב-CodeForces”, מדובר בהצלחות הנשענות על תנאים נוחים במיוחד. הוא כותב כי לניצחונות הללו יש “שלושה קביים סמויים: שפע נתוני אימון, אימות טריוויאלי, ושרשראות נימוק קצרות”. לדבריו, “כאשר שלושתם מתקיימים, ה-AI של היום מצטיין. הסר אפילו אחד מהם, והוא קורס”.

מכאן הוא עובר להסביר מדוע הנדסת ביצועים ל-GPU היא מקרה מבחן שבו אותם תנאים אינם מתקיימים. “הדאטה נדיר. קשה לאמת נכונות. והביצועים נובעים משרשרת ארוכה של החלטות תלויות – פריסת זיכרון, התנהגות warp, קאשינג, תזמון, מבנה הגרף”. במילים אחרות, אין כאן בעיה סינתטית עם תשובה ברורה, אלא מרחב חיפוש עמוק שבו כל בחירה משפיעה על רבות אחרות. בהקשר זה טוען שעשוע כי גם סוכנים מתקדמים בשוק מתקשים בתחום: “אפילו סוכנים מתקדמים כמו Claude Code, Codex ו-Gemini CLI נכשלים כאן באופן דרמטי, ולעיתים קרובות מייצרים מימושים שגויים גם כאשר הם מקבלים את חבילת הבדיקות של cuGraph”. לדבריו, “Scaling לבדו לא יכול לשבור את המחסום הזה”, ונדרשו רעיונות אלגוריתמיים חדשים כדי להתמודד עם מורכבות מסוג זה.

AEI במקום AGI

doubleAI נוסדה בסוף 2023 על ידי שעשוע ושלו-שוורץ וגייסה מאז מאות מיליוני דולרים לפי שווי המוערך בכמיליארד דולר. היא מפתחת מערכות AI ייעודיות לפתרון בעיות הנדסיות ומדעיות מורכבות במיוחד, שבהן לטענתה ניתן להגיע לרמת מומחיות — ואף מעבר לה — באמצעות אלגוריתמיקה וחיפוש עמוק ולא רק סקיילינג של מודלי שפה.doubleAI מציגה את ההישג הנוכחי כחלק מתפיסה רחבה יותר שהיא מכנה Artificial Expert Intelligence, או AEI, כלומר מערכות שמצליחות להתעלות באופן עקבי על מומחים אנושיים בתחומים צרים אך קריטיים, שבהם המומחיות נדירה ויקרה. במקום חתירה ל-AGI כללי, החברה מתמקדת בפתרון בעיות עומק בתחומי אופטימיזציה מורכבים, ומשלבת לדבריה למידה מדאטה מצומצם, מתודולוגיית אימות הסתברותית ומבני חיפוש סוכניים המנווטים במרחבי החלטה עמוקים. הגישה הזו קרובה יותר למערכת חיפוש אלגוריתמית מתקדמת מאשר למודל שפה קלאסי שמייצר תשובה בפעם אחת.

Share via Whatsapp

פורסם בקטגוריות: בינה מלאכותית , חדשות

פורסם בתגיות: AGI , cuGraph , DoubleAI , GPU , אמנון שעשוע , קרנלים