דיפסיק הסינית הפילה את מניות השבבים
27 ינואר, 2025
השיקה מודל AI מסוג "מודל חשיבה", אשר ביצועיו שקולים לביצועי o1 של OpenAI, אולם דורש כמו קטנה בהרבה של משאבי עיבוד. אנבידיה מובילה את הירידות עם צניחה בשיעור דו-ספרתי

מניות השבבים צוללות היום (ב') היום במסחר בנסד"ק, לאחר שחברה סינית עלומה בשם DeepSeek AI השיקה מודל AI מהדור החדש ("מודל חשיבה"), אשר לטענתה מגיע לביצועים השקולים לביצועי המודלים הגדולים של חברות כמו OpenAI, אך בשבריר מעוצמת העיבוד הנדרשת להרצתם. אם היא אומנם הצליחה לפתח מודל כה עוצמתי באמצעות משאבי הון, עיבוד ודטה כה דלים – ותחת הסנקציות האמריקאיות – הדבר מעמיד בסימן שאלה את עתיד השקעות העתק שביצעו ענקיות ה-AI האמריקאיות.
מניות החומרה רשמו את הירידות החדות ביותר, ובראשן אנבידיה שירדה ב-13%, כאשר ASML ירדה ביותר מ-7%. מניות הענן כמו מיקרוסופט ומטא מציגות ירידות שערים מתונות. ההסבר לפער הזה נעוץ בכך שאם הצהרות דיפסיק על יעילות המודל הן נכונות, ניתן להריץ מודלים גדולים ויעילים באמצעות תשתיות מחשוב צנועות מהצפוי, ומהפיכת ה-AI תזדקק לפחות שבבים. מנגד, חברות הענן שייאמצו טכנולוגיה דומה, יוכלו להוזיל משמעותית את העלויות שלהן באספקת שירותים מבוססי בינה מלאכותית.
מהפיכת "מודלי החשיבה"
דיפסיק היא חברת סטארט-אפ סינית שמאחוריה עומדת קרן הון-סיכון High-Flyer המתמחה בתחום המסחר האלגוריתמי בשוק המניות. הקרן הוקמה על ידי שלושה מהנדסים סינים, שלפני כשנתיים, לאחר ביצועים ירודים במסחר, החליטו להקדיש את משאבי העיבוד לפיתוח מודלי AI. למעשה, כבר בדצמבר 2024 השיקה החברה מודל שפה גדול בשם v3, במתכונת של ChatGPT, ובשבוע שעבר, ממש ביום השבעתו של הנשיא טראמפ, היא השיקה את מודל r1, שהוא מודל חשיבה (reasoning) ופועל בדומה למודלים o1 ו-o3 שהשיקה OpenAI לאחרונה.
דיפסיק דיווחה שהמודל שלה כולל 671 מיליארד פרמטרים. הוא מתבסס על מודל ה-LLM שהשיקה החברה לפני כחודש, v3, שעבר אדפטציה למודל חשיבה. מודלי חשיבה מקדישים זמן בשלב ההסקה (inference) ויוצרים "שרשרת מחשבות" כדי לבחון את המשימה מכל מיני היבטים, ורק לאחר סיום התהליך הם מתחילים בבניית התשובה, כדי לספק תשובה יסודית ומעמיקה יותר. זהו ענף חדש ומבטיח בתחום ה-AI, אשר פותח בעיקר כדי לספק פתרון לבעיות מורכבות בתחומים כמו תכנות, מתמטיקה ומדע.
המחיר זול מאוד – אבל המפלגה שולטת באלגוריתם
בינתיים דיפסיק מציעה את המודל במתכונת של קוד-פתוח. היא גם שחררה ב-GitHub משפחה של מודלים "רזים" בגדלים שונים, בין 1.5 מיליארד פרמטרים ל-70 מיליארד פרמטרים, וניתנים להרצה על מכונות מקומיות. המודל הקטן ביותר יכול לרוץ אפילו על מחשב נייד. עלות השימוש במודל היא על 55 סנט לקלט של מיליון אסימונים (tokens). לשם השוואה, קלט של מיליון אסימונים ב-o1 של OpenAI עולה 15 דולר.
ובשונה מ-o1 של OpenAI, המודל של דיפסיק מציג בפני המשתמש בפירוט רב את "שרשרת המחשבות" שיצר המודל, וזאת כדי שהמשתמש יוכל להתחקות אחר האופן שבו הושגה התשובה וכך גם יוכל לטייבה. לטענת דיפסיק, r1 עולה על o1 במספר מדדים מקובלים בתעשיית ה-AI, כדוגמת AME, שהוא מבחן העושה שימוש במודלים אחרים כדי לבחון את ביצועיו של מודל, MATH-500, שהוא קובץ של בעיות במתמטיקה, ו-SWE, הבוחן יכולות תכנות.
עם זאת בהיותו מודל סיני, הוא כפוף לחוקי הצנזורה של המפלגה הקומוניסטית. כך למשל, המודל יתחמק מלענות על שאלות בנושאים רגישים למשטר כמו האירועים בכיכר טיין-אן-מן או בסוגיית עצמאותה של טאיוואן. כמו כן, ייתכן כי הזיקה האפשרית של המודל למשטר הסיני תגביר את החשש בקרב ארגונים ומשתמשים לעשות בו שימוש, חרף העלות הנמוכה, וזאת מטעמי פרטיות ובטיחות. כמו כן, אף שמרבית התגובות בתעשייה מביעות התפעלות ישנם גם כאלה הטוענים כי ייתכן כי מדובר בסוג של תרמית ושלא ייתכן שדיפסיק פיתחה בסודיות מודל כה עוצמתי אשר זקוק למשאבים כל-כך דלים.
פורסם בקטגוריות: בינה מלאכותית , חדשות
פורסם בתגיות: AI , בינה מלאכותית