חוקרים "שיכפלו" את מודל החשיבה של דיפסיק ב-30 דולר בלבד

בתמונה למעלה: תהליך החשיבה של המודל. מתוך פוסט של החוקר הראשי ברשת Nitter

מאת יוחאי שויגר

חוקרים מאוניברסיטת ברקלי שבקליפורניה הצליחו "לשכפל" את אופן פעולתו של מודל החשיבה של DeepSeek הסינית, בעלות מזערית של 30 דולר בלבד. למעשה, החוקרים עשו שימוש בשיטת האימון הייחודית שבה פיתחו בדיפסיק את מודל החשיבה R1, והדגימו כיצד, באמצעות אותה שיטת אימון, ניתן לייצר מודלים קטנים שמצליחים לפתח "בעצמם" יכולות חשיבה.

החוקרים אימנו את המודל באמצעות משחק מתמטי הקרוי "הספירה לאחור" (Countdown Game), שבו המשתתפים מקבלים 4 מספרים, ועליהם  להגיע, באמצעות שילוב של פעולות מתמטיות, למספר מטרה כלשהו. החוקרים הציבו את המשימה הזו בפני מודל קטן יחסית של כ-3 מיליארד פרמטרים, ובדקו כיצד הוא מתמודד עם הבעיה. החוקרים השתמשו בשיטת האימון "למידה באמצעות חיזוקים" (Reinforcement Learning), שבה המודל מקבל תגמול שלילי במידה והוא טועה ותגמול חיובי במידה והוא צודק. זוהי השיטה שבה השתמשו בדיפסיק בשלב ה-post-training בפיתוח המודל R1.

היתרון בשיטה זו שניתן לבצע אותה באופן אוטומטי, עם התערבות אנושית מינימלית, ובמשאבי עיבוד מצומצמים יותר. עם זאת, ניתן לעשות זאת רק במשימות שבהן יש תשובות נכונות ולא נכונות, כמו בבעיות מתמטיות, ולא במשימות "יצירתיות" כמו כתיבת טקסט חופשי. בהדגמה שביצעו החוקרים מברקלי, בניסיונות הראשונים המודל הפיק ניחושים אקראיים, אך בהדרגה המודל פיתח, באופן עצמוני לחלוטין, טכניקות ואסטרטגיות של תיקון-עצמי ופתרון בעיות באמצעות ניסוי וטעייה – עד אשר הגיע לתשובה הנכונה. המחקר הראה שבאמצעות "למידה באמצעות חיזוקים" מודלי שפה יכולים לפתח באופן עצמאי יכולות "חשיבה".

קפיצת מדרגה ב-3-7 מיליארד פרמטרים

החוקרים אימנו את המודל באמצעות השכרת שירותי GPU בענן, תוך מספר שעות ובעלות של כ-30 דולר בלבד. בנוסף, החוקרים הציבו בפני המודל בעיות בכפל של מספרים, ועד מהרה המודל יישם בעצמו שיטות של פיצול הבעיה למספר כפולות יותר פשוטות, ממש בדומה לאופן שבו בני אדם מתמודדים עם בעיות כפל מורכבות. לדברי החוקרים, הניסוי המחיש את יכולתו של המודל לפתח טכניקות חשיבה המותאמות לאופי הבעיה. הניסוי בוצע במודלים בגדלים שונים. המודל הקטן, של כחצי מיליארד פרמטרים, לא הצליח לפתח טכניקות מיוחדות מלבד ניחוש. מודל שכלל 1.5 מיליארד פרמטרים התחיל לפתח טכניקות ראשוניות של בדיקה-עצמית, ואילו המודלים בגודל של 3-7 מיליארד פרמטרים הציגו קפיצת מדרגה משמעותית ביכולות החשיבה. לפי ההערכות, מודל החשיבה o1 של OpenAI כולל מאות מיליארדי פרמטרים.

המחקר ממחיש ביתר שאת את ההשלכות מרחיקות הלכת שעשויות להיות למודל R1 של דיפסיק על עולם הבינה המלאכותית, ובפרט על פיתוח מודלי חשיבה (reasoning). בדומה למודל של דיפסיק, הניסוי שביצעו החוקרים בברקלי ממחיש כי ניתן לייעל באופן משמעותי את פיתוח מודלי החשיבה, בעיקר בשלב ה-post-training, וזאת בעוד שעד עתה ההנחה היתה כי אימון מודלים כאלה מצריך משאבי דאטה ועיבוד עצומים, שעלותה נאמדת במאות מיליוני דולרים. דבר מעניין נוסף שעולה מהמחקר בברקלי הוא האפשרות לפתח מודלי חשיבה קטנים המותאמים לביצוע משימות ספציפיות. המחקר גם ממחיש את האופן שבו מודלים בקוד-פתוח, בדומה לזה של דיפסיק, מסייעים לקדם את החדשנות בתחום ומערערים את המונופול של חברות הענק. 

ServiceNow מפתחת LLM ל-IT ארגוני במעורבות מרכז המו"פ בישראל

בתמונה למעלה: משרדי ServiceNow בישראל. צילום: אוראל כהן

טכנולוגיית הבינה המלאכותית הגנרטיבית (Gen AI) חודרת כיום לעוד ועוד תחומים, מפיננסיים וסייבר ועד אוטומוטיב ומדיקל. חברת מחשוב הענן ServiceNow, בשיתוף פעולה עם אנבידיה (Nvidia), מפתחת בימים אלה כלים מבוססי Gen AI שמיועדים לחולל מהפכה באופן שבו מתנהלים תהליכים ארגוניים ושירות לקוחות. חלק מהמאמץ של החברה האמריקאית בתחום זה מתבצע גם במרכז הפיתוח שלה בישראל.

ServiceNow, שבסיסה הראשי בקליפורניה, היא אחת מחברות שירותי ה-IT הגדולות בעולם. הכנסותיה ב-2022 הסתכמו ב-7.25 מיליארד דולר והיא נסחרת ב-NYSE לפי שווי שוק של 140 מיליארד דולר. החברה מספקת פלטפורמת ענן שמסייעת לארגונים לנהל את תהליכי העבודה הארגוניים, ותהליכים עסקיים מול לקוחות, בצורה דיגיטלית ומאוחדת. בנוסף לניהול שירותים ותהליכים אירגוניים, ServiceNow מספקת מספר פתרונות ספציפיים לניהול חברות ואירגונים, וביניהן פתרון לניהול משימות ה-IT ומיפוי ובקרה של כל המערכות המחוברות לרשת הארגונית, כגון שרתים, מחשבים, מכשירים ניידים ואביזרים מקושרים. הפלטפורמה מסייעת לזהות ולאבחן אירועי IT המצריכים מענה מצד צוות ה-IT.

להערכת החברה, כ-80% מקרב חברות Fortune500 עושות שימוש בפלטפורמה של סרוויס נאו , וגם בקרב המגזר הארגוני בארץ יש לה לקוחות רבים. מרכז המו"פ של ServiceNow בישראל, הפועל מזה כעשור, נמצא בפתח תקוה ומעסיק מעל-200 איש. הוא מבוסס על ארבע רכישות חשובות שביצעה החברה בישראל. ביולי 2014 רכשה ServiceNow ב-100 מיליון דולר את חברת Neebula Systems הישראלית, שפיתחה טכנולוגיה שמסייעת לבצע מיפוי חכם לכל משאבי ה-IT של הארגון, ושיוכם לאפליקציות מרובות שכבות.

ב-2017 רכשה את חברת סקיי-ג'ירף (SkyGirafe), שעל בסיס הטכנולוגיה שלה השיקה ServiceNow את פלטפורמת המובייל שלה לארגונים ב-2019, מתוך מטרה לאפשר לעובדים לבצע משימות ארגוניות באמצעות הסמרטפון בממשק פשוט ונוח.  ב-2019 רכשה את AppSee, שפיתחה פלטפורמה המספקת אנליטיקה על דפוסי השימוש של המשתמשים בפלטפורמה של ServiceNow, וב-2020 רכשה את Loom Systems, שפיתחה פתרון מבוסס AI לאבחון ותיקון תקלות IT בארגון.

בתוך האקוסיסטם הטכנולוגי של ServiceNow, תחומי המיקוד של מרכז המו"פ הישראלי הם IT Operations Management (ITOM), פלטפורמת המובייל, ושיפור חוויית משתמש. בשיחה עם Techtime סיפר מנהל מרכז המו"פ של ServiceNow בישראל, אדר מרגלית, על הייחוד של הצוות המקומי. "מה שמייחד את הסייט הישראלי זה שיש רוח של סטארט-אפ. זה מתבטא במאמץ מתמיד להביא את החדשנות. בחברה-האם מעריכים זאת מאוד."

מרכז העצבים של כל ארגון

IT היא אחת המחלקות החשובות ביותר בכל ארגון. צוות ה-IT אחראי על התפקוד התקין והרציף של מערכות המידע והמחשוב, והיכולת שלו לאבחן ולטפל בבעיות במהירות היא קריטית לרציפות העסקית של הארגון, ודאי עם מדובר בארגון גדול שפועל באופן מבוזר באתרים שונים.

כאמור, אחד הנדבכים המרכזיים בפלטפורמה של ServiceNow הוא סט הכלים לניהול שירותי IT. הפלטפורמה מספקת מעין "מחלקת IT דיגיטלית". אדר: "הפלטפורמה שלנו מאפשרת לנהל את הפעילות של מחלקת ה-IT בצורה הרבה יותר יעילה, וזה תורם לתפקוד של הארגון כולו. היא מספקת לצוות ה-IT נראות לגבי כל היישומים שרצים בשרתים, לקבל התראות על בעיות ולדעת מהם יחסי הגומלין בין היישומים השונים. המטרה היא למנוע השבתת פעילות [downtime], ואף לחזות בעיות לפני שהן מתרחשות."

אדר מרגלית. קרדיט: יח"צ

לדברי אדר, זהו אחד ההיבטים המרכזיים שבו מתמקד מרכז המו"פ הישראלי. "בישראל אנחנו פיתחנו פתרונות שמספקים מיפוי של הנעשה בשרתי הארגון. מתוך ניתוח הדאטה ובאמצעות טכנולוגיות AI, ניתן לקצר את זמני המיפוי וגם לספק חיזויים תפעוליים. המטרה היא לאגד את ההתראות שמגיעות ממערכות שונות, לנתח אותן, ולספק תובנות שיסייעו לתת מענה לתקלה ולעיתים להתריע מראש על תקלה שהולכת ומתהווה, מה שמכונה Predictive AIOps. הלקוחות שלנו חווים ירידה של עשרות אחוזים בהשבתות ובהתראות קריטיות."

ה-LLM מגיע לעולם ה-IT

בחודש מאי האחרון הכריזו ServiceNow ואנבידיה על שיתוף פעולה, שמטרתו לרתום את יכולות הבינה המלאכותית הגנרטיבית לעולמות שירותי ה-IT, שירות הלקוחות וחוויית העובדים. המטרה היא לנצל את הדאטה הייחודי שאוספת הפלטפורמה של ServiceNow כדי לפתח כלי אוטומציה חכמים בתחום תהליכי העבודה הארגוניים.

ServiceNow מפתחת את המודלים הן באופן עצמאי, והן תוך הרחבת מודלים קיימים, ביניהן פלטפורמת Nemo של אנבידיה, המשמשת לפיתוח מודלים טקסטואליים – ועל בסיס פלטפורמת המחשוב של אנבידיה DGX.

בין היתר, ServiceNow רותמת מודלי LLM כדי לפתח כלים שיידעו לתקצר ולסכם אוטומטית אירועים, קריאות (tickets) ותכתובות, דבר שמאוד ייעל את תהליכי העבודה הארגוניים והן את השירות ללקוח. בנוסף, מפתחת החברה עוזרים-אישיים מבוססי AI שיסייעו להתמצא בפלטפורמה ולקבל מענה לשאילתות בשפה חופשית, ועוד כלי ליצירת קוד לפי פקודה (prompt) שיאפשרו לארגונים המשתמשים בפלטפורמה לפתח יישומים מותאמים אישית. במרכז הפיתוח הישראלי עובדים גם על מערכת שתיתן המלצות מבוססות GenAI לפתרון תקלות, ושיפורים נוספים. חלק מכלים אלו כבר הגיעו ללקוחות החברה בנובמבר, וכלים ושיפורים נוספים צפויים בחודשים הקרובים. 

אדר: "היתה החלטה אסטרטגית ב-ServiceNow לפתח LLM עצמאיים שלנו, על סמך הדאטה שלנו וייעודי לתחום שלנו. היתה הסטה גדולה של משאבים לטובת הנושא הזה. בצורה זו אנו יכולים לספק מודל בעל מומחיות גבוהה יותר בתחומי הידע הספציפיים שלנו, וגם להימנע מהחשש של לקוחות להוציא את המידע שלהם החוצה לשירותים דוגמת Open AI. אין ספק שה-Gen AI עבר לחזית המאמץ, וזה מתבטא בשיתוף הפעולה עם אנבידיה ובהשקעה הרבה של החברה בנושא. "