הפיסיקה הבלתי אפשרית של מרכזי בינה מלאכותית

4 יוני, 2026

מאמר אורח: מהפיכת ה-AI הבאה לא תתרחש רק ברמת הקוד או המודל – אלא בתכנון המכני והתרמי המאפשרים לכל המערך הזה לעבוד באופן רציף לאורך שנים

בתמונה למעלה: מערכת מאיצי AI של NextSilicon. פיתוח ותכן מכני-תרמי: תירוש הנדסה

מאת: איתמר תירוש, חברת תירוש הנדסה

בזמן שכולם מדברים על מודלי שפה, ארכיטקטורות תוכנה ומרוץ המאיצים, הקרב האמיתי על עתיד ה-AI מתנהל במקום אחר: מול חוקי הפיזיקה. העוצמה והצפיפות של מעבדי ומאיצי ה-AI מעבירים את צוואר הבקבוק מתחום התוכנה והאלגוריתם בחזרה אל רמת החומר: ניהול חום, הספק, זיכרון, קישוריות, אופטיקה וקירור.

חלק 1: האבסורד התרמודינמי ודחיסות ההספק

רבים נוטים לתאר את מהפיכת הבינה המלאכותית ברמה הלוגית: מודלי השפה, מיליארדי הפרמטרים, וכוח העיבוד התיאורטי. המחשוב המודרני נתפש כיישות מופשטת המתקיימת בענן. אלא שבמציאות ההנדסית "הענן"  נמצא על רצפת חוות השרתים ומנהל מאבק יומיומי מול חוקי הפיזיקה והתרמודינמיקה. האמת המקצועית פשוטה: הבעיה הגדולה ביותר של מאיצי ה-AI המודרניים (XPU) היא לא כיצד לחשב מהר יות – אלא כיצד למנוע מהם לשרוף את עצמם .

כדי להבין את גודל האתגר, ניעזר באנלוגיה למנוע בעירה פנימית. מנוע מודרני הפועל לפי מחזור אוטו (Otto Cycle) עובד בנצילות של כ-40%-30%. כלומר חלק ניכר מהאנרגיה שמקורה בדלק אינו מותמר לעבודה מכנית ממשית, אלא נפלט כחום. המנוע עצמו הוא גם גוף מתכתי מסיבי מוקף בתעלות מים ייעודיות, שדרכן זורם נוזל הקירור הסופג את האנרגיה התרמית ומפנה אותה דרך מחליף החום (הרדיאטור) אל הסביבה.

מאיץ AI, לעומת זאת, אינו מייצר עבודה מכנית. אין בו בוכנות, תנועה סיבובית או אנרגיה מכנית שימושית, אלא מיתוג מהיר של מיליארדי טרנזיסטורים. כאן נוצר סוג של אבסורד תרמודינמי: כמעט כל האנרגיה החשמלית הנכנסת לשבב הופכת בסופו של דבר לחום. מאיץ AI הצורך 1000 ואט, מתנהג בעצם כמו תנור חשמלי בהספק של 1000 ואט – אולם הוא דוחס את כל האנרגיה הזו לתוך שטח של כמה סנטימטרים רבועים.

זו  הבעיה האמיתית: לא רק כמות החום, אלא צפיפות ההספק. לדחוס מאות ואט בתוך פיסת סיליקון קטנטנה הוא אתגר הנדסי רציני. בניגוד לבלוק המנוע המאסיבי, לשבב כמעט ואין מסה תרמית שתספוג אנרגיה. ללא הצמדה תרמית מדויקת, חלוקת לחצים נכונה, שכבת TIM איכותית ויציבה, ומערכת קירור המפנה את החום כמעט בזמן אמת – המאיץ יגיע במהירות למגבלות הטמפרטורה שלו, יפחית ביצועים – וייכשל.

מודול מאיץ AI בתצורת OAM (Open Accelerator Module). פיתוח ותכן מכני-תרמי :תירוש הנדסה

חלק 2: הפיזיקה של החום – מה באמת קורה בתוך הסיליקון?

צריך לזכור ש-XPU מודרני מייצר כמות גדולה מאוד של חום בגלל שני מנגנונים פיזיקליים בלתי נמנעים: הפסדי מיתוג וזרמי זליגה. הפסדי המיתוג נובעים מבעיית גודל: שבב AI מודרני מכיל מיליארדי טרנזיסטורים המשמשים כמתגים דיגיטליים מהירים. כל טרנזיסטור כזה הוא מבנה תלת־ממדי בגודל של עשרות ננומטרים בלבד, קטן פי כמה אלפים מרוחב שערת אדם (בסדר גודל המתקרב לממדים של וירוסים מסוימים).

כדי לבצע חישובים, המתגים הזעירים האלו נדרשים לשנות את מצבם מ-0 ל-1 ובחזרה מיליארדי פעמים בשנייה. כל טרנזיסטור כזה מתנהג, מבחינה חשמלית, כמו קבל זעיר כאשר כל שינוי במצבו דורש טעינה ופריקה. הזרם החשמלי הנע בשבב פוגש התנגדות טבעית של החומר, וכמו בכל מערכת חשמלית חלק מהאנרגיה מומר לחום. ככל שקצב המיתוג עולה, כך גם עולה פליטת החום הדינמית.

לסוגיית זרמי הזילגה השפעה לא פחות חשובה: ככל שהתעשייה דוחסת יותר כוח עיבוד בשטח קטן יותר, הטרנזיסטורים נעשים קטנים יותר. בממדים כאלה, שכבות הבידוד החשמליות דקות כל-כך, שהבידוד כבר אינו מושלם: חלק מהאלקטרונים מצליחים לזלוג גם כאשר הטרנזיסטור אמור להיות כבוי לחלוטין.

כלומר גם כאשר השבב אינו מבצע חישוב פעיל, חלק קטן מהזרם ממשיך לזרום ולהפוך לחום. במאיצי AI מודרניים, בגלל הכמות האדירה של הטרנזיסטורים, גם זליגה זעירה מכל טרנזיסטור מצטברת להספק משמעותי. התופעה אף מחמירה עם עליית הטמפרטורה: ככל שהשבב מתחמם, הזליגה גדלה, והדבר מייצר עוד חום. לפעמים נוצר מעגל של התחממות מואצת אם מערכת הקירור אינה מתוכננת היטב.

חלק 3: קו ההגנה הראשון: איך לייצר פחות חום

כאשר שבב AI מודרני מתנהג הלכה למעשה כמו תנור קטן ועוצמתי, השאלה הראשונה שהמתכננים שואלים את עצמם היא כיצד לייצר פחות חום, עוד לפני שמתחילים לקרר את השבבמערכת קירור חיצונית יכולה רק לפנות חום היא לא יכולה לבטל את עצם היווצרותו. לכן, קו ההגנה הראשון מתחיל עמוק בתוך הארכיטקטורה הלוגית של השבב עצמו.

מעבדים מסורתיים משתמשים שנים רבות בשיטות חיסכון באנרגיה והפחתת חום, כמו מנגנוני Power Gating או ניהול תדרים דינמי. כאשר אזור מסוים ברכיב אינו נמצא בשימוש, המערכת יודעת להרדים אותו זמנית או להאט את פעילותו, כדי להפחית את צריכת החשמל. הדבר דומה למערכת Start/Stop המכבה את המנוע ברכב בזמן עצירה ברמזור כדי לחסוך בדלק.

אלא שבעולם ה-AI האתגר מורכב בהרבה. בזמן הרצת עומסי מחשוב כבדים, חלקים גדולים מהמאיץ עובדים במקביל ובעוצמה גבוהה לאורך זמן. במצב כזה, האפשרות פשוט לכבות אזורים נרחבים בסיליקון הופכת מוגבלת יותרלכן התעשייה החלה לשאול שאלה אחרתאם אין כמעט מה לכבות אולי אפשר לגרום לצ'יפ לעבוד באופן חכם יותר?

חלק מהארכיטקטורות המודרניות מנסות לצמצם מראש עבודה מיותרת בתוך השבב: להפחית תנועת מידע לא חיונית, לצמצם אנרגיה המתבזבזת על ניהול ובקרה ולייעל את האופן שבו מידע זורם בין יחידות החישוב והזיכרוןבמקום שכל החלטות הניתוב יתבצעו בזמן אמת באמצעות חומרה מורכבת, חלק מההחלטות מועבר אל שכבת התוכנה (קומפיילר) המארגן את החישוב בצורה יעילה יותר ומפחית תקורה מיותרת.

גישה דומה ניתן לראות גם בארכיטקטורות חדשות, כדוגמת זו של חברת Next Silicon. ניתן לדמות את הרעיון למערכת כבישים: במקום שכל רכב יחפש לבד את הדרך בזמן אמת וייצור פקקים, מערכת חכמה מארגנת חלק גדול מזרימת התנועה מראש, מפחיתה עומסים ומקטינה תנועה מיותרתכאשר פחות מידע מטייל ללא צורך בתוך השבב, נדרשת פחות תנועה חשמלית ולכן גם נוצר פחות חום במקור.

חלק 4: בעיית הקישוריות – הנחושת נאבקת בחוקי בפיזיקה

גם כאשר הרכיב יעיל יותר, מאיץ AI מודרני לעולם אינו פועל לבדו. כדי לאמן מודלים עצומים או לשרת מיליוני בקשות בזמן אמת, יש צורך באלפי מאיצים העובדים ביחד כמערכת אחת מסונכרנת ומבוזרת. כלומר, לא מספיק לחשב מהר – צריך גם להזיז כמויות עצומות של מידע במהירות אדירה בין מאיצים, שרתים ורכיבי מחשוב. וכאן כאן בדיוק מופיע אחד מצווארי הבקבוק הפיזיקליים הגדולים של תעשיית הAI: מגבלות הנחושת.

כיום, רוב המידע העובר בין שבבים, שרתים וארונות מחשוב, נע כאותות חשמליים דרך מוליכי נחושת. כדי לעמוד בקצבי התקשורת האדירים, מהנדסים נאלצים לדחוף את האותות החשמליים לתדרים גבוהים מאודאלא שככל שהתדר עולה, תופעה המכונה (Skin Effect) גורמת לזרם החשמלי להתרכז יותר ויותר בשכבה החיצונית של המוליך. אפשר לחשוב על זה כמו כביש מהיר שהופך צר יותר ככל שמנסים להעביר עליו יותר ויותר תנועה.

התוצאה היא שהאות החשמלי נחלש, נוצר יותר רעש אלקטרומגנטי, ונדרשת יותר אנרגיה כדי להבטיח שהמידע יגיע לצד השני באופן יציב ואמין. המשמעות היא שגם העברת מידע למרחקים קצרים יחסית בתוך שרת, בין כרטיסים או בין ארונות מחשוב הופכת יקרה ובזבזנית יותר מבחינת הספק.

כדי לפצות על היחלשות האות, מהנדסים מוסיפים רכיבים ייעודיים, שתפקידם לחזק, לנקות ולייצב את האות לאורך הדרך. אך גם הרכיבים האלו צורכים חשמל ומייצרים חום נוסף במערכת שממילא פועלת קרוב לקצה הגבול התרמיככל שהמערכות גדלות, לא רק המאיצים עצמם צורכים הספק משמעותי ומתחממים, גם רכיבי התקשורת, תיקון האות וההגברה הופכים לצרכני אנרגיה משמעותייםבמילים אחרות: עצם היכולת להזיז מידע ממקום למקום הפכה לאתגר תרמי ואנרגטי כמעט כמו החישוב עצמו.

חלק 5: בין CPO ל־NPO – כשהאופטיקה פוגשת ייצור סדרתי

זו בדיוק הסיבה שהתעשייה מנסה לבצע מעבר הדרגתי לתקשורת אופטית באמצעות טכנולוגיות Silicon Photonics. האופטיקה אינה מבטלת לחלוטין את בעיית ההספק והחום, שכן גם לייזרים ומתמרים אופטיים צורכים אנרגיה ורגישים לחום, אך היא מאפשרת להעביר נפחי מידע עצומים למרחקים גדולים יותר וביעילות טובה יותר, מבלי לסבול מאותה רגישות גבוהה של נחושת בתדרים הגבוהים.

על פניו, המסקנה פשוטה: אם האופטיקה יעילה יותר צריך לקרב אותה כמה שיותר אל המאיץמכאן נולד חזון ה-Co-Packaged Optics – CPO, המבוסס על שילוב רכיבי פוטוניקה קרוב מאוד למאיץ החישוב, ולעיתים אף בתוך אותו מארז. המטרה היא לקצר ככל האפשר את מסלול הנחושת, להפחית איבודי אות, לצמצם שימוש ברכיבי תיקון והגברה ולהקטין את צריכת ההספק של שכבת הקישוריות.

אבל כאן מתברר שקשה מאוד לייצר את המערכת בצורה סדרתית, חזרתית ואמינה בקנה מידה תעשייתיבעולם ה-CPO, כל סטייה זעירה היא קריטית. כדי להעביר אור בצורה יעילה, יש צורך ביישור (Alignment) מדויק במיוחד בין לייזרים, מוליכי גלים, מערכי סיבים ורכיבים אופטיים נוספים. סטייה של מיקרונים בודדים בלבד עלולה להחליש את האות, לפגוע בביצועים או לדרוש יותר הספק מהלייזר כדי לפצות על האובדן.

וזה עוד לפני שדיברנו על חום. לייזרים ורכיבים אופטיים אקטיביים רגישים במיוחד לטמפרטורה. ככל שהמערכת מתחממת, היעילות שלהם עלולה לרדת, היציבות נפגעת ואורך החיים עלול להתקצר. הצבת רכיבים אופטיים רגישים בתוך מארז צפוף וחם של מאיץ AI עוצמתי, הופכת לבעיית אינטגרציה תרמית לא פשוטה.

קיימת גם השאלה המעשית הפשוטה: מה קורה אם רכיב אופטי קטן נכשלמאיץ AI מודרני הוא רכיב יקר מאוד, מחירו למגיע לעתים לעשרות אלפי דולרים ליחידה. כאשר לייזר, רכיב אופטי קטן או נקודת חיבור אחת נכשלת, צריך לזרוק מכלול שלם בגלל תקלה נקודתית? וקיימת גם בעיית תפוקת הייצור: כיצד מבצעים בדיקות ? איך שומרים על אחוזי תפוקה גבוהים כאשר המאיץ, הלייזר, מערכי הסיבים והמארז חייבים לעבוד יחד בדיוק גבוה כבר מהרגע הראשון, ובאופן חזרתי באלפי יחידות?

נוסיף לכך את האתגר התפעולי בשטח. מערכות אופטיות אינן מסתיימות בתוך המארז. הסיבים עצמם יוצאים אל מחוץ למודול או לכרטיס, ודורשים חיבור, ניתוק, ניהול כבילה ולעיתים תחזוקה. ככל שהאופטיקה נכנסת עמוק יותר אל המאיץ, כך מורכבת יותר השאלה כיצד מתקנים או משרתים מערכת שעובדת 24/7 בתוך תשתית AI עצומה.

פשרת ה-NPO

במילים אחרות, השאלה שהתעשייה שואלת כיום אינה רק האם CPO עובד במעבדה, אלא: האם ניתן לייצר, לבדוק, לקרר ולתחזק אותו בקנה מידה שמתאים ל־AI Factories? כאן נכנסת לתמונה פשרת ה־Near-Packaged Optics – NPO: במקום לשלב את כל האופטיקה עמוק בתוך מארז השבב, ממקמים את הרכיבים האופטיים על-גבי המודול או כרטיס המאיץ, אך עדיין מחוץ ל־Package עצמו. כלומר מחוץ לאזור האינטגרציה הצפוף והרגיש ביותר של הסיליקון.

כלומר האופטיקה מגיעה עד הכרטיס, והאות החשמלי נדרש לעבור רק מרחק קצר על-גבי הכרטיס. אומנם ה-NPO אינו מבטל לחלוטין את מגבלות הנחושת מכיוון שקיימים הפסדי אות מסוימים לאורך המסלול הקצר, אבל הפשרה הזו מאפשרת לשלב את רכיבי האופטיקה קרוב מאוד למאיץ, ולעיתים אף באותו מערך קירור, תוך שמירה על יתרונות משמעותיים של ייצור סדרתי, בדיקות פרטניות, שירותיות ויכולת החלפה מהירה.

מדובר בפשרה הנדסה קלאסית של ניהול סיכונים: ה-CPO מייצג את האידיאל הפיזיקלי: לקרב את האופטיקה ככל האפשר אל הליבה ולצמצם למינימום את מסלול הנחושת. ה-NPO מייצג את הפשרה התעשייתית: לקרב את האופטיקה מספיק כדי לשפר ביצועים והספק, אך להשאיר אותה נגישה לייצור ולתחזוקה בעולם האמיתי.

כדי להבין עד כמה הסוגיה הזו קריטית, מספיק להתבונן בהיקפי ההשקעה האדירים של אנבידיה באקוסיסטם של Silicon Photonics, ובחברות המתמחות בקישוריות אופטית ובטכנולוגיות אריזה מתקדמותהמסר המגיע מהתעשייה הוא ברור: עתיד ה־AI לא ייקבע רק על-ידי השבב החזק ביותר, אלא על-ידי היכולת לחבר, לקרר, לייצר ולתחזק את המערכת כולה.

חלק 6: פתרונות הקירור לתשתיות AI

אחרי שדיברנו על החום שנוצר בתוך הסיליקון, על מגבלות הנחושת ועל אתגרי האופטיקה, אנו מגיעים לשאלה הפשוטה ביותר לכאורה: כיצד מפנים את כל החום הזה החוצהכאן נפתח הפער בין הפתרון התרמודינמי האידיאלי לבין הפתרון שהתעשייה באמת מסוגלת להפעיל, לתחזק ולהרחיב בקנה מידה תעשייתי.

שרת של NextSilicon הכולל קירור משולב מים ואוויר. פיתוח ותכן: תירוש הנדסה

במשך שנים, קירור אוויר היה ברירת המחדל של עולם השרתים. מאווררים גדולים, צלעות קירור (Heat Sinks), וניהול זרימת אוויר קרה וחמה בתוך הארון היו פתרון מוכר, פשוט יחסית וזול לתחזוקה. אבל בעומסי AI מודרניים ובצפיפות ההספק של המאיצים החדשים, האוויר מתחיל להיגמר: המחיר האנרגטי, הרעש, נפח המאווררים והיכולת להגיע ביעילות אל מוקדי החום הצרים (Hotspots) הופכים את הפתרון לבלתי כדאי.

קירור נוזלי ישיר

לכן, התעשייה עוברת בצעדי ענק לשלב הבא: קירור נוזלי ישיר של השבב (Direct to Chip Liquid Cooling). בתצורה הזו, בלוק קירור (Cold Plate) יושב ישירות על-גבי המאיץ או מארז העיבוד, ונוזל קירור זורם דרכו כדי לפנות את החום. זהו כיום הפתרון המעשי והמוביל עבור מערכות AI צפופות: הוא מאפשר להמשיך לעבוד במבנה ה-Rack המוכר, לשמור על שירותיות סבירה, להשתמש במחברים מהירים, ולשלב את המערכת בתשתיות דאטה סנטר קיימות או משודרגות.

במילים פשוטות: ה-Cold Plate הוא לא בהכרח הפתרון הכי אקזוטי, אבל הוא הפתרון שהכי קל להפוך למוצר אמין, ותעשייתיהבלוק עצמו הוא כבר לא חתיכת מתכת חלולה עם מים בפנים. תכנון Cold Plates למאיצי AI הפך לאמנות הנדסית ומכנית בפני עצמה: חלוקת זרימה אחידה, תעלות זעירות להגדלת שטח הפנים, מניעת אזורי זרימה מתה, שליטה בהפרשי טמפרטורה על-פני השבב, והבטחת הצמדה תרמית אחידה שתצמצם Hotspots מקומיים הנוצרים מעומסי העבודה הדינמיים של מאיצי AI. לכך מצטרפת גם בחירת חומרים קפדנית למניעת קורוזיה גלוונית.

אחד מהאתגרים המרכזיים הוא למצוא את נקודת האיזון שבין מהירות הזרימה לבין מפל הלחץ (ΔP). מהירות זרימה גבוהה משפרת את פינוי החום ומקטינה שכבות גבול תרמיות, אולם היא מגדילה את התנגדות הזרימה, דורשת משאבות חזקות יותר, מעלה את צריכת ההספק של מערכת הקירור ועלולה לפגוע באמינות הכוללת של הדטה־סנטר.

קירור בטבילה

לצד השימוש בקירור ישיר במתכונת ה-Direct-to-Chip, קיימת חלופה נוספת המקבלת תשומת לב גוברת, קירור בטבילה (Immersion Cooling). בפתרון הזה, במקום לקרר רק את השבב באמצעות בלוק ייעודי, מטבילים את השרתים או הכרטיסים כולם בתוך מיכל ממולא בנוזל דיאלקטרי שאינו מוליך חשמל. היתרון התיאורטי ברור: שטח מגע עצום, פינוי חום היקפי מכל רכיבי המערכת, היפטרות מוחלטת ממאווררים, ופוטנציאל לצפיפות מחשוב גבוהה במיוחד. חברות כמו Gigabyte כבר מציעות פתרונות immersion ייעודיים, כולל שרתים ומכלים המותאמים לסביבה כזו.

אבל גם כאן, הפיזיקה היא רק חצי מהסיפור. Immersion Cooling משנה לחלוטין את הארכיטקטורה התפעולית של הדטהסנטר. השרת כבר אינו נשלף בצורה אנכית ומהירה מארון סטנדרטי; כל פעולת תחזוקה הופכת לאירוע מורכב הדורש שליפת מודול מתוך נוזל, ניקוז, ניקוי, טיפול במחברים ייחודיים, ותאימות כימית ארוכת טווח של כבלים, אטמים, מדבקות ורכיבים לנוזל הדיאלקטרי. בנוסף, ספקי חומרה רבים אינם מעניקים אחריות מלאה בתנאי טבילה.

הנקודה הזו קריטית: Immersion יכול להיות פתרון תרמי מצוין, אבל הוא דורש בנייה של אקוסיסטם שלם: שרתים מותאמים, נהלי שירות מורכבים, ציוד הרמה ייעודי ותשתית שונה לחלוטין. לכן הוא מתאים כיום בעיקר לנישות ספציפיות, ופחות כתחליף מיידי ופשוט לכל דטהסנטר קיים.

קירור דו-פאזי

מעל כל אלה מרחף הפתרון התרמודינמי המרתק מכולם: קירור דופאזי (Two-Phase Cooling). בקירור חד־פאזי קלאסי, הנוזל נכנס קר יותר, קולט חום, ויוצא חם יותר, אך נשאר במצב צבירה נוזלי. בקירור דו־פאזי לעומת זאת, מנצלים את שינוי הפאזה של הקרר: הוא סופג חום מהשבב, רותח והופך בחלקו לגז. בתהליך הזה נספגת כמות גדולה של אנרגיה כחום כמוס, כמעט ללא עלייה משמעותית בטמפרטורת הקרר כל עוד הלחץ נשמר מבוקר. לכן, מבחינה תרמודינמית, קירור דו־פאזי הוא אחד המנגנונים היעילים ביותר לפינוי חום מצפיפויות הספק קיצוניות.

אבל המחיר של פריצת הדרך הזו הוא במורכבות הנדסית גדולה. מערכת דופאזית אינה רק זרימת הנוזל בצינור, אלא דינמיקה של רתיחה מבוקרת בתוך מערכת סגורה. יש לשלוט בלחצים, בטמפרטורות, באיכות האדים, ובעיקר למנוע תופעות מסוכנות כמו Dry-out, שהוא מצב שבו משטח חם מאבד מגע יעיל עם הנוזל, מתכסה בבועת גז מבודדת ומתחיל להתחמם במהירות בלתי מבוקרת עד לשריפת הרכיב.

בעומסי AI, הבעיה מורכבת שבעתיים. העומס החישובי אינו יציב או ליניארי, הוא משתנה בצורה חדה ומהירה בהתאם למודל, לפעולת החישוב, ולתזמון העבודה. מערכת הקירור צריכה להגיב לעומסים דינמיים ופתאומיים כאלה בלי לאבד יציבות תרמית ובלי להכניס את המערכת לתנודות לחץ וזרימה הרסניות.

לכן השוק נמצא היום בנקודת ביניים מרתקת: טכנולוגיות Direct-to-Chip Cold Plates מספקות פתרון בשל, מעשי והמהיר ביותר לפריסה רחבה של AI Factories. טכנולוגיית Immersion Cooling מציעה יתרונות תרמיים היקפיים וצפיפות גבוהה, אך דורשת שינוי עמוק בצורת התפעול, השירות והאחריות. פתרון Two-Phase Cooling מציע את הפוטנציאל התרמודינמי הגבוה ביותר, אך עדיין מציב אתגרי בקרה, אמינות וייצור מורכבים לעתיד.

שיקולים מעשיים

כולם רוצים את הפיזיקה של הדו פאזי, את הפשטות היחסית של הCold Plate ואת היכולת של Immersion להתמודד עם עומסי חום וצפיפויות הספק קיצוניות. אבל בעולם ההנדסה "אין ארוחות חינם", אין פתרון יחיד עם כל היתרונותוזו בדיוק הנקודה שבה הנדסת מכונות, ניהול תרמי, ייצור ושירותיות הופכים קריטיים לא פחות מהאלגוריתם או מהשבב עצמו. שכן השאלה אינה רק כמה מהר המאיץ יכול לחשב, אלא האם ניתן לפנות ממנו את החום בצורה אמינה, חזרתית וברתתחזוקה לאורך שנים, בתוך תשתית AI שעובדת ללא הפסקה.

חלק 7: סיכום המהפיכה השקטה של ההנדסה המכנית

מנהלי פיתוח, יזמים וחברות חומרה כבר אינם יכולים להתייחס לפיתוח האופטו־מכני, לניהול התרמי ולתכנון המארז כאל השלב שאחרי האלקטרוניקה. במערכות AI מודרניות, המכניקה אינה רק מעטפת – היא חלק בלתי נפרד מהביצועים, מהאמינות ומהיכולת להפעיל את המערכת בקנה מידה תעשייתי.

כאשר סטייה מיקרונית ביישור אופטי עלולה לפגוע בקישוריות, וכאשר חוסר יציבות בזרימת קרר או היווצרות אזור יבש (Dry-out) במערכת דו־פאזית עלולים לגרום להתחממות מקומית חריפה, הנדסת המערכת המכנית היא מרכזי מהאירוע. אלו כבר לא בעיות של קופסה, אלא בעיות ליבה של תשתיות AI .

ההתמודדות עם צווארי הבקבוק הללו דורשת אינטגרציה הנדסית רחבה: הבנה עמוקה של השרשרת כולה מפעולת המיתוג בליבה, דרך תנועת המידע על גבי הסיליקון, הולכת האות בכרטיס, יישור הסיבים האופטיים, פיזור החום בבלוק הקירור, זרימת הנוזל, החלפת החום ב־CDU, תכנון מערך הצ’ילרים ועד לפינוי מגה־ואטים של חום אל הסביבה.

החברות שיובילו את השוק בשנים הקרובות יהיו אלו שיידעו לחבר בין ארכיטקטורת מחשוב מתקדמת לבין דיוק מכני, ניהול תרמי, דינמיקת זורמים, אריזה מתקדמת ויכולת ייצור חזרתית ואמינה. מהפיכת ה-AI הבאה לא תתרחש רק ברמת שורת הקוד או המודל – אלא גם בשכבות הפיזיות המאפשרות לכל המערך הזה לעבוד באופן רציף לאורך שניםזהו המקום שבו ההנדסה המכנית חוזרת, ובגדול, אל קדמת הבימה.

אודות הכותב

איתמר תירוש הוא מהנדס מכונות והבעלים של חברת תירוש הנדסה (Tirosh Engineering), המתמחה בפיתוח, תכן ואינטגרציה של מערכות חומרה מורכבות עבור תחומי הביטחון, אלקטרו־אופטיקה, תשתיות AI/HPC והייטקתירוש הנדסה עוסקת בפיתוח, תכן ואינטגרציה של מערכות חומרה מורכבות — משלב הארכיטקטורה והקונספט ועד ייצור, הרכבה והטמעה, תוך שילוב תכן מכני, אופטו־מכניקה וניהול תרמי.

www.tirosh-eng.com
[email protected]

Share via Whatsapp

פורסם בקטגוריות: בינה מלאכותית , בקרה וציוד תעשייתי , חדשות , מחשבים ומערכות משובצות

פורסם בתגיות: בינה מלאכותית , קירור , תירוש הנדסה , תכנון תרמי