חברת אנבידיה הציגה בכנס NeurIPS שנערך השבוע את DRIVE Alpamayo-R1, מודל נהיגה אוטונומית חדש שמוגדר כמודל ה־VLA (Vision-Language-Action – מודל המאחד ראייה, הבנת סצנה והסקה סיבתית עם יכולת תכנון וביצוע פעולה) הראשון בקנה-מידה תעשייתי הזמין בקוד פתוח. זהו צעד משמעותי עבור החברה, שביססה בשנים האחרונות את פעילותה בתחום הנהיגה האוטונומית על פלטפורמות מחשוב ייעודיות כמו DRIVE Orin ו–DRIVE Thor, אך טרם שחררה מודול נהיגה מרכזי הניתן לשימוש פתוח לכול. לצד המשמעות עבור אנבידיה עצמה, ההכרזה מהווה גם נקודת ציון עבור תעשיית הנהיגה האוטונומית, שבה מודלי החלטה פתוחים כמעט שאינם קיימים.
Alpamayo-R1 הוא מודל נהיגה אוטונומית מאוחד המבצע בו-זמנית ראייה ממוחשבת, הבנת סצנה והסקה סיבתית (reasoning), וכן תכנון מסלול ופעולה. בניגוד לארכיטקטורות הנהיגה המסורתיות שמפרידות בין תפיסה, חיזוי ותכנון, AR1 מבוסס על מבנה VLA שמחבר את שלושת הרבדים למערכת אחת רציפה. בליבת המודל נמצאת יכולת Reasoning – הסקה סיבתית – המאפשרת לו לפרק תרחישי נהיגה מורכבים לגורמים, לשקול “מסלולי מחשבה” אפשריים, ולגבש תכנון מסלול שמבוסס על הסברים פנימיים לתהליך קבלת ההחלטות.
לפי אנבידיה, המודל אומן על תמהיל של נתוני שטח, סימולציה ומערכי נתונים פתוחים, ובכלל זה Chain-of-Causation Dataset, שבו לכל פעולה יש הסבר כתוב ומובנה לגבי הסיבה שהובילה אליה. את שלב הפוסט-אימון ביצעו החוקרים באמצעות Reinforcement Learning, שהביא לשיפור ביכולות ה-reasoning ביחס לגרסה הטרום-מאומנת.
המודל מתוכנן להיות זמין לשימוש לא-מסחרי ב-GitHub וב-Hugging Face, לצד אלמנטים משלימים: AlpaSim – מסגרת בדיקה, ומערך נתונים פתוח בתחום הנהיגה האוטונומית.
מודל שקוף מול מודל סגור
מערכות נהיגה אוטונומית היום נחלקות לשני זרמים עיקריים: טסלה פועלת בגישת End-to-End Vision → Control, שבה מודל יחיד מקבל וידאו מהמצלמות ומחזיר פקודות היגוי ובלימה. המערכת של טסלה איננה פתוחה, אינה מספקת נימוקים מפורשים לפעולות, ולא מבוססת על הפרדה ברורה בין Reasoning לבין פעולה.
מובילאיי, לעומת זאת, ממשיכה לאמץ ארכיטקטורה “קלאסית” של תפיסה–חיזוי–תכנון המבוססת על מפות סמנטיות, אלגוריתמים דטרמיניסטיים וחוקי בטיחות. גם כאן המודלים עצמם סגורים, ומנגנוני ההחלטה אינם זמינים לניתוח חיצוני.
בנקודה הזו AR1 מבדל את עצמו: הוא מציג יכולת הסבר מפורש של המסלול שנבחר ושל ההיגיון שמאחוריו — דבר שעד כה כמעט לא נראה במערכות נהיגה, בטח לא ברמה תעשייתית.
העובדה שהמודל פתוח לשימוש מחקרי אינה רק אקט טכנולוגי; היא עשויה להשפיע על כיוון התעשייה. מודלי נהיגה מסחריים הם קופסאות שחורות, ולכן קשה לבדוק אותם רגולטורית, להשוות בין גישות או לאמת ביצועים בתרחישים נדירים. פתיחת מודל Reasoning מאפשרת, לראשונה, ביצוע ניסויים שקופים ושחזוריים, ובונה בסיס משותף לקהילה רחבה יותר — בדומה למה שעשו Llama ו-Mistral בתחום השפה.
הצגת AR1 מאותתת על שינוי תפיסתי: נהיגה אוטונומית מתקרבת לשדה שבו מודלי בינה כללית עומדים במרכז, במקום תלות מוחלטת במערכות ידניות ושלבי עיבוד מופרדים. בעוד שבפועל אין עדיין הוכחה שמודל מסוג זה יכול להחליף את כל המערכות הקיימות, זהו הצעד הברור ביותר עד היום לכך שהתחום מתקרב למה שאפשר לכנות “פיזיקה של התנהגות”— ניסיון להבין לא רק מה הרכב רואה, אלא למה הוא צריך לפעול בדרך מסוימת.
במקביל, המהלך משרת גם את אסטרטגיית החומרה של אנבידיה: ככל שמודלים הופכים צפופים, דורשי מחשוב ומבוססי סימולציה עתירת חישוב, כך גובר סימוכין לשימוש בפלטפורמותיה.
Alpamayo-R1 אינו מערכת נהיגה מלאה, אך הוא פותח לראשונה את לב המערכת — ההיגיון המחשבתי — בפני חוקרים, OEMs וסטארט-אפים. עבור תחום שנמצא שנים מאחורי דלתות סגורות, זו התפתחות בעלת פוטנציאל משמעותי.




