גוגל זיעזעה את שוק הזכרונות

9 אפריל, 2026

אלגוריתם TurboQuant החדש מקטין דרמטית את נפח זכרון המטמון הדרוש לביצוע פעולות הסקה במודלים לשוניים גדולים (LLM). מניות יצרניות הזכרונות התמוטטו מיידית, אולם חזרו ברובן למצבן ערב ההכרזה

מחלקת המחקר של חברת גוגל (Google) חשפה לפני שבועיים טכנולוגיית דחיסת נתונים חדשה בשם TurboQuant, אשר מקטינה את נפח הזיכרון הפעיל הדרוש להפעלה של מודלי שפה גדולים (LLM) ובכך מצמצמת את אחד מצווארי הבקבוק הגדולים ביותר של תשתיות הבינה המלאכותית. החברה מסרה ש-TurboQuant היא שיטת דחיסה שמצליחה להשיג הקטנה משמעותית בגודל המודל ללא אובדן דיוק, ולכן היא מיועדת לתמיכה גם בדחיסת מטמון מפתחות-ערך (KV Cache) בזכרון של המודלים המעובדים וגם בחיפוש וקטורי של תוצאות.

התהליך מתבצע בשני שלבים בתחילה התוכנה מבצעת סריקה אקראית של וקטורי הנתונים ומפשטת את הגאומטריה שלהם. בשלב הזה נעשה שימוש ברוב כוח הדחיסה (רוב הביטים) כדי ללכוד את המהות והעוצמה של הווקטור המקורי. בשלב השני, אלגוריתם TurboQuant משתמש בכמות קטנה ושיורית של כוח דחיסה (ביט אחד בלבד) כדי להפעיל את מנגנון תיקון השגיאות QJL אשר מסיר שגיאות שנותרו לאחר ביצוע השלב הראשון.

מבחני מדידה שבוצעו על-גבי מידע שנשמר במחשבי Nvidia H100 GPU, הראו שהאלגוריתם הקטין פי 6 את גודל זכרון המטמון והגדיל פי 8 את הביצועים, בהשוואה לשמירה סטנדרטית במתכונת מפתחות של 32 ביט. הטכנולוגיה החדשה תוצג בפירוט בכנס ICLR 2026 שיתקיים בסוף חודש אפריל בריו דה ז'ניירו, ברזיל. ההכרזה גרמה לזעזוע מיידי במניות של יצרניות רכיבי הזכרון, אשר בשנה האחרונה אירגנו מחדש את מודל הפעילות שלהן כדי להגדיל את כושר הייצור של רכיבי הזכרון עבור מרכזי ה-AI הגדולים.

בהלה בשוק המניות

מניית מייקרון בנסד"ק ירדה מיידית מכ-460 דולר ל-320 דולר, והתאוששה חלקית בימים האחרונים למחיר של כ-402 דולר. מניית סנדיסק ירדה מ-722 דולר, לכ-565 דולר, אולם התאוששה בשבוע שעבר וחזרה למחירה המקורי. המניות של ווסטרן דיג'יטל וסמסונג התמוטטו בשיעורים של כ-30% בתגובה להודעה, אולם בשבוע האחרון חזרו למחירם מלפני שבועיים, ובמקרה שלהם אפילו עברו אותו. אנליסט Lynx Equity Strategies הסביר מה בעצם קרה, ומדוע המניות התאוששו למרות הזעזוע של השוק:

"ספקי ה-LLM צריכים לפתח גישות חדשות כדי להתמודד עם צוואר הבקבוק של זכרונות מטמון, לאור הגידול בגודל האסימונים (Token) במערכות ההסקה. אולם למודל החדש כמעט ולא תהיה השפעה על הדרישה לזכרונות ב-3-5 השנים הבאות, מכיוון שהשוק נמצא כיום במצב חמור מאוד של מחסור בזכרונות. טכניקות דחיסה חדשות יצמצמו במקצת את בעיית צוואר הבקבוק, אולם לא ישפיחעו מהותית על הדרישה לזכרונות RAM/FLASH".

Share via Whatsapp

פורסם בקטגוריות: בינה מלאכותית , חדשות , רכיבים

פורסם בתגיות: בינה מלאכותית , גוגל , זכרונות