לייטריקס חושפת את מודל האודיו-וידיאו LTX-2.3, הפועל מקומית

חברת לייטריקס (Lightricks) משיקה את LTX-2.3, גרסה חדשה למודל הבינה המלאכותית שלה ליצירת וידאו ואודיו. המודל כולל כ-20.9 מיליארד פרמטרים ומסוגל לייצר סרטונים באיכות הפקה של עד 4K — כאשר כל תהליך היצירה מתבצע באופן מקומי על כרטיסי GPU במחשב האישי, ללא צורך בתשתיות ענן.

משקולות המודל משוחררות בקוד פתוח וזמינות לשימוש חופשי, בעוד שחברות עם הכנסות שנתיות של מעל 10 מיליון דולר יידרשו לרישיון מסחרי. במקביל, החברה משיקה גם את LTX Desktop, אפליקציית יצירה ועריכת וידאו מקצועית המבוססת על מנוע ה-AI של LTX וזמינה גם היא בקוד פתוח.

לדברי החברה, המהלך משקף שינוי רחב יותר בתעשיית התוכנה היצירתית: מרכז הערך עובר מכלי התוכנה עצמם אל מנועי ה-AI שמפעילים אותם. במקום שתוכנות העריכה יהיו המוצר המרכזי, הן הופכות למעטפת סביב מודלים המספקים את יכולות היצירה, הסנכרון והשדרוג.

השקת LTX-2.3 מגיעה על רקע ההתפתחות המואצת בתחום יצירת הווידאו מבוסס AI. עד כה, רוב המערכות דרשו שימוש בתשתיות ענן יקרות, תשלום לפי שימוש ולעיתים גם העברת נכסי תוכן וקניין רוחני לשרתים של ספקים חיצוניים. עבור יוצרים עצמאיים מדובר היה לעיתים בחסם כלכלי, ועבור ארגונים – גם בסיכון מבחינת פרטיות ושליטה על נתונים.

היכולת להריץ את המודל באופן מקומי משנה את המצב הזה. LTX-2.3 פועל על חומרה שכבר קיימת אצל יוצרים ואולפנים רבים, ללא קריאות API וללא תשלום לפי שימוש. המשמעות עבור סטודיו שמפתח עשרות רעיונות ויזואליים בסשן עבודה אחד היא מעבר מעלות לכל יצירה לעלות שולית נמוכה מאוד — מה שמאפשר חופש יצירתי רחב יותר וניסוי מהיר של רעיונות.

במישור הארגוני, הפעלה מקומית של המודל מאפשרת להפחית חלק ניכר מעלויות תשתיות הענן ולצמצם תלות בספק יחיד. מאחר שמדובר במודל עם משקולות פתוחות, ניתן גם לבצע התאמה אישית ולכוון אותו לצרכים ארגוניים שונים. לפי החברה, עלות החישוב של LTX-2.3 עומדת על כ-10%–20% בלבד לעומת מודלים מתחרים, מה שהופך אותו מתאים גם לסביבות ייצור בקנה מידה גדול.

המודל כולל מספר שיפורים טכנולוגיים, בהם מנגנון חדש המשפר את הדיוק ביחס לפרומפטים טקסטואליים ו-VAE חדש המסייע לשמור על פרטים ויזואליים עדינים בתהליך היצירה. בנוסף נוספה תמיכה מובנית בפורמט וידאו אנכי ושופרו יכולות image-to-video. גם רכיב האודיו שודרג, והמודל מסוגל להפיק פס קול כחלק אינטגרלי מהווידאו.

הארכיטקטורה של LTX-2.3 היא מולטימודלית: המודל מטפל בטקסט, תמונה, אודיו ווידאו הן כקלט והן כפלט, במקום להסתמך על שילוב של מספר מערכות נפרדות.

משקולות המודל זמינות כבר כעת בפלטפורמת Hugging Face, ובהמשך צפוי לצאת גם כלי CLI שיאפשר למפתחים להריץ את המודל באופן מקומי ולבנות עליו יישומים נוספים. גם אפליקציית LTX Desktop מבוססת על אותו מנוע פתוח ומלווה במפת דרכים ציבורית לפיתוח עתידי בשיתוף הקהילה.

גרסת LTX-2 הקודמת זכתה לאימוץ מהיר בקהילת המפתחים והיוצרים: בתוך חודש מהשקתה היא הורדה יותר מ-3 מיליון פעמים מ-Hugging Face, וכיום מספר ההורדות מתקרב ל-5 מיליון.

לדברי החברה, אימון המודל הקודם דרש השקעה של כ-150 מיליון דולר בלבד וצוות פיתוח של כ-40 מהנדסים — נתונים נמוכים משמעותית מההשקעות שמבצעות חברות מודלים גדולות — אך הצליח להגיע לרמת ביצועים דומה.

לייטריקס משחררת את LTX-2 בקוד פתוח ומאתגרת את גוגל ו-OpenAI בשוק הווידאו AI

בתמונה: מנכ"ל לייטריקס ד"ר זאב פרבמן. קרדיט צילום: ריקי רחמן. *תמונה ערוכה]

חברת לייטריקס (Lightricks) הכריזה בתערוכת CES על שחרור מודל הווידאו והאודיו הגנרטיבי LTX-2 בקוד פתוח מלא, כולל משקולות וקוד אימון. מדובר במהלך חריג בשוק שבו מודלי וידאו מתקדמים נשלטים כמעט לחלוטין בידי פלטפורמות ענן סגורות. ההכרזה, שנעשתה בשיתוף עם אנבידיה, מציבה אלטרנטיבה לגישה שמובילות חברות כמו OpenAI וגוגל, ומאותתת על שינוי כיוון אפשרי בתחום הווידאו מבוסס הבינה המלאכותית.

LTX-2 הוא מודל המסוגל לייצר וידאו ואודיו מסונכרנים באיכות של עד 4K, באורך של עד 20 שניות ובקצבי פריימים גבוהים. המודל מותאם להרצה מקומית על מחשבי RTX וכן על מערכות DGX ארגוניות, ומוגדר כמוכן לפרודקשן. בניגוד למודלים סגורים דוגמת Sora או Veo, לייטריקס מאפשרת למפתחים ולארגונים לא רק להשתמש במודל אלא גם לאמן, להתאים ולהטמיע אותו כחלק ממוצרים ותהליכים פנימיים.

המהלך של לייטריקס אינו ניסיון להתחרות בקנה המידה או בעומק הקוגניטיבי של מודלי היסוד הגדולים של ענקיות הטכנולוגיה. LTX-2 אינו מוצג כמודל שמבקש להבין את העולם כולו, אלא כבסיס הנדסי גמיש שנבנה מראש לשימוש תעשייתי. הדגש הוא על שליטה, התאמה ויכולת שילוב.

בעוד שכבר קיימים מודלי וידאו פתוחים, רובם סובלים ממגבלות משמעותיות כמו היעדר אודיו, איכות נמוכה או חוסר התאמה לשימוש מסחרי. LTX-2 הוא הראשון שמנסה לשלב פתיחות מלאה עם יכולות שמיועדות לעבודה בפועל, מה שממקם אותו כגשר בין עולם הקוד הפתוח לבין צורכי הפרודקשן של תעשיית המדיה.

לייטריקס היא חברה ישראלית שמוכרת בעיקר בזכות אפליקציות יצירה ועריכת תוכן פופולריות, ובהן כלים לעריכת תמונה ווידאו שמשמשים מיליוני משתמשים ברחבי העולם. בשנים האחרונות החברה הרחיבה את פעילותה מפיתוח אפליקציות לצרכנים לפיתוח מודלי בינה מלאכותית ותשתיות יצירה לשוק המקצועי.

מאחורי שחרור הקוד עומדת אסטרטגיה עסקית ברורה. לייטריקס מוותרת על שליטה מלאה במודל עצמו כדי להפוך אותו לסטנדרט שעליו אחרים יבנו. המודל אינו מיועד להימכר לפי שימוש, אלא לשמש בסיס לפיתוח כלים, פלטפורמות ושירותים בתשלום. הגישה הזו מזכירה מודלים מוכרים מעולם התוכנה הפתוחה, שבהם הערך הכלכלי נבנה סביב הקוד ולא בתוכו.

אנבידיה אינה שותפה לפיתוח המודל, אך ממלאת תפקיד מרכזי בהצבתו כעומס עבודה טבעי לחומרת RTX ולמערכות DGX. השותפות מדגישה תפיסה שלפיה וידאו גנרטיבי מתקדם יכול וצריך לרוץ מחוץ לענן, על תחנות עבודה מקומיות ובסביבות ארגוניות.

השקת LTX-2 מסמנת מגמה רחבה יותר בשוק: מעבר ממודלים סגורים שמכוונים בעיקר להצגת יכולות ולשימוש כשירותי ענן מצומצמים, לעבר תשתיות פתוחות שמאפשרות אימוץ עמוק ובניית מוצרים בקנה מידה. לייטריקס אינה מתמקדת בהדגמות ראווה, אלא בבניית הבסיס שעליו ייבנו כלי הווידאו של הדור הבא.