אל תרדפו אחר המודל הבא – הבעיה היא הדאטה

דמיינו שאתם שוכרים את השף הכי טוב בעולם. יש לו מטבח נוצץ, סכינים יקרות, צוות מיומן, וכל מה שצריך כדי להוציא מנה מושלמת. ואז אתם מגישים לו ירקות עייפים, בשר שפג תוקפו ורוטב שמישהו שכח פתוח יומיים בחוץ.
אתם אולי תקבלו צלחת שנראית נהדר — אבל הביס הראשון יהיה אסון.

זה, פחות או יותר, מה שקורה היום באלפי ארגונים שרודפים בהתלהבות אחרי מודל ה-AI הבא, אבל שוכחים לבדוק מה הם מזינים אליו. מרוץ החימוש בין Anthropic, OpenAI וגוגל מייצר כותרות כמעט כל שבוע, אבל הוא גם מייצר מסך עשן. בזמן שמנהלים רצים לסמן וי על "יש לנו AI", הם לעיתים קרובות מדלגים על השאלה הכי פחות נוצצת — והכי חשובה: האם המידע שהמערכת הזאת נשענת עליו בכלל ראוי לשימוש?

נניח, למשל, שחברת תעופה משיקה עוזר AI לשירות לקוחות. השקיעו בו כסף, חיברו אותו למאגרי מידע, עשו מצגת מרשימה לדירקטוריון. על הנייר — הכול נראה מצוין. בפועל, המערכת נשענת על נתונים שלא טויבו: חלק ממדיניות הכבודה עודכנה רק באתר אחד ולא בשני, שמות יעדים מופיעים בכמה פורמטים שונים, ומידע על זיכויים וביטולים נשמר בשלוש מערכות שלא תמיד מסכימות זו עם זו.

התוצאה? לקוח אחד מקבל תשובה שמותרת לו מזוודה, אחר מקבל תשובה שלא, ושלישי מקבל החזר שלא באמת מגיע לו. זה כבר לא רק באג — זה נזק תפעולי, שירותי ותדמיתי.

ופה בדיוק הבלבול הגדול של התקופה.

הרבה אנשים מדברים על מודלים כאילו הם הקסם עצמו. כאילו אם רק נבחר את המודל הנכון, נקבל מערכת חכמה, מדויקת ושימושית. אבל מודל הוא לא קסם — הוא מנוע. ואם מזינים אותו במידע כפול, חסר, סותר או לא מעודכן, הוא לא יתקן את המציאות. במקרה הטוב הוא ימחזר את הבעיה. במקרה הרע הוא יעשה את זה ברהיטות, במהירות ובביטחון עצמי. הוא יחרטט בביטחון.

פעם קראו לזה Garbage In, Garbage Out. היום זה הרבה יותר מסוכן, כי ה־Garbage Out כבר לא נראה כמו טעות — הוא נראה כמו תשובה מקצועית.

וזה בדיוק מה שהופך את הנושא הזה לכל כך קריטי: ברגע שמערכת AI מתחילה להשפיע על החלטות — שירות, תמחור, שיווק, רפואה, בנקאות או תפעול — איכות הנתונים מפסיקה להיות עניין של אנשי דאטה בלבד. היא הופכת להיות עניין של כל מי שמשלם את המחיר כשהמערכת טועה.

טיוב נתונים הוא הסינדרלה של עולם הטכנולוגיה: עבודה סיזיפית, שקופה, אפורה וחסרת תהילה — שבלעדיה הסיפור המופלא של ה-AI פשוט לא יתקיים.

ומה זה אומר בפועל? לא רק "לנקות דאטה", אלא לוודא שהמידע שלם, עקבי, אמין ומעודכן. זה נשמע בסיסי, אבל בארגונים רבים זו בדיוק הנקודה שבה הכול מתפרק: אותו לקוח מופיע בכמה גרסאות, אותו מוצר מתואר אחרת בכל מערכת, נוהל אחד מעודכן ושני לא, מחיר שונה באתר וב-CRM. מזינים את כל הבלגן הזה למודל — ומצפים לנס.

לא יהיה נס. יהיה לכל היותר דמו יפה שיעבוד בקושי.

כמובן, גם המודל חשוב. יש הבדלים אמיתיים בין מודלים, ובמקרים מסוימים הם משמעותיים מאוד. אבל בהרבה ארגונים, בחירת המודל היא לא הבעיה הראשונה. הבעיה הראשונה היא שמנהלים רוצים את התחושה שהם "בתוך המשחק", בלי לעשות את העבודה האיטית, השחורה והלא-סקסית של תשתיות מידע.

אבל זאת בדיוק העבודה שמבדילה בין ארגון שמתנסה ב-AI לבין ארגון שבאמת מפיק ממנו ערך.

אז לפני ששואלים "איזה מודל נבחר?", כדאי לשאול שלוש שאלות הרבה פחות זוהרות: על איזה מידע אנחנו נשענים, מי אחראי לאיכות שלו, ומה המחיר שאנחנו כבר משלמים היום על זה שהוא לא מספיק טוב.

וזה הסיפור האמיתי: לא רק שהדאטה קובע אם מערכת AI תצליח — הדאטה קובע אם היא תחסוך כסף, תבזבז כסף, תשפר שירות או תייצר נזק במהירות ובסדר גודל שעוד לא הכרנו.

המרוץ למודל הבא ימשיך לייצר כותרות. אבל השאלה החשובה באמת היא לא מי ניצח השבוע בבנצ'מרק — אלא מי מוכן סוף סוף לעשות סדר בחומרי הגלם.