אתגר ה-PCI Express 3.0: תכנון ערוץ תקשורת "בעיניים פקוחות"

18 אוגוסט, 2011

היישום של רכיבים ומערכות לעבודה בתקן PCI Express 3.0 דורש התמודדות עם הפרעות ערוץ שהשפעתן גוברת עם העלייה בתדרי העבודה. אוסילוסקופ רגיש המסוגל לבצע גם De-embedding וגם אקווליזציה, מאפשר להעריך את איכות האות במערכת

תקן PCI Express 3.0 דורש התמודדות עם הפרעות ערוץ שהשפעתן גוברת עם העלייה בתדרי העבודה. אוסילוסקופ רגיש המסוגל לבצע  גם De-embedding וגם אקווליזציה, מאפשר להעריך את איכות האות במערכת

מאת: Rick Eads, Agilent Technologies

טכנולוגיית המידע מאופיינת בשיפור מתמיד בכל ההיבטים, אולם הכפלת ביצועי המעגלים המשולבים (IC) וממשקי הקלט/פלט (I/O) אינה משימה פשוטה. מהירות ה-I/O חיונית לשיפור הביצועים, אולם הדבר דורש התגברות על מגבלות הנובעות ממאפיינים פיסייים של החומרה, כמו עקבות הנחושת ומחברי Through-hole. ככל שגדלה מהירותם של האותות החשמליים בקווי התמסורת מנחושת, קשה יותר להתגבר על בעיות ריצוד, הפרעות (Intersymbol interference), הפסדי פיזור ותופעות נוספות.

PCI Express Agilent Eye Diagram
אוסילוסקופ Agilent Infiniium 90000 X-Series: משלב גם De-embedding וגם אקווליזציה

כיום טכנולוגיית PCI Express נפוצה מאוד בכל תשתיות המחשוב, החל במחשבים שולחניים, דרך תחנות עבודה וכלה בשרתים ואפילו במערכות משובצות. הדור הראשון של PCI Express פעל בקצבים של (2.5GT/s (Giga Transfers per second, שהיו שיפור עצום ברוחב הפס של ה-I/O בהשוואה לטכנולוגיות PCI ו-PCI/X. הדור השני של PCI Express הכפיל את המהירות ואת התפוקה והגיע לקצבים של 5.0GT/s, אולם כאשר קבוצת PCI-SIG החלה לשקוד על הדור השלישי של ה-PCI Express, היא גילתה שהכפלה פשוטה של קצב הנתונים של הדור ה-2 אינה אפשרית.

ה-PCI-SIG קבעה שממשק הפועל במהירות של 10GT/s, כפי שרצו להשיג ב-PCI Express 3.0, אינה ישימה בגלל מספר בעיות, ושהיישום יהיה כה יקר שהוא עשוי למנוע את הטמעת הטכנולוגיה. עלויות אלה כוללות מחברים משופרים, קיצור אורכי העקבות (Traces) ואפילו שילוב חומרים מיוחדים בעלי הפסדים נמוכים בתוך המעגלים המודפסים.

הנשק הסודי של PCI-SIG

יחד עם זאת, היה בידי ה-PCI-SIG קלף אחד מנצח אחד שעשוי היה לסייע בהשגת היעד של הכפלת ביצועי ה-PCI Express בהשוואה לגרסה 2.0: בשני הדורות הראשונים של PCI Express נעשה שימוש בסכימת קידוד של 8B/10B. קידוד זה הבטיח למקלט צפיפות מעבר מינימלית המסייעת לשמור על סנכרון בין מעגלי שחזור השעון מבוססי PLL לבין רצף הנתונים המועבר. בנוסף, הוא הבטיח שאיזון ה-DC הממוצע של האות המועבר יישאר תמיד על אפס. חסרונו המרכזי קידוד 8B/10B טמון בתקורה של 20%. כדי לשדר 8 סיביות מידע, הקידוד משתמש ב-10 סיביות על-גבי הקישור.

PCI Express דיאגרמת עין Agilent
העין "נסגרת": דיאגרמת העין בתחילתו ובסופו של ערוץ 48 ס"מ.

קבוצת PCI-SIG החליטה אפוא לשנות את סכימת הקידוד בדור השלישי של PCI Express, ולהטמיע סכימת קידוד מעורבלת של 128/130 סיביות. סכימה זו מאפשרת ל-PCI Express 3.0 להכפיל את התפוקה בהשוואה ל-PCI Express 2.0, תוך העלאה בפועל של קצב הנתונים ב-60% בלבד. להפעלת הממשק של PCI Express 3.0 בקצב של 8GT/s בלבד יש יתרונות משמעותיים בעלות.

קצב הנתונים הנמוך יותר אינו מצריך שינויים בארכיטקטורת המערכות הקיימת של יישומי PCI Express (ניתן להשתמש במחברים שבהם נעשה שימוש בדור ה-2), והתקן תומך גם באבזרים קצרי-ערוץ (25 ס"מ) וגם במערכות ברמת שרת הכוללות ערוץ באורך של 48 ס"מ.

אלא שגם בקצב המופחת של 8GT/s, טכנולוגיית PCI Express 3.0 מהווה ממשק הקלט/פלט המתוחכם ביותר במערכות מחשב המבוססות על ארכיטקטורת ה-PC. הירידה במרווחי התיזמון ל-125ps ב-PCI Express 3.0 משאירה מרחב תמרון מצומצם מאוד לניהול "תקציב הריצוד". בנוסף, יש חשיבות לעובדה, כי כאשר קצבי הנתונים עולים על 5GT/s, תיאום תדרים ועכבות (Equalization) בצד המקלט (Rx) הופך לחובה.

מדוע צריך תיאום (Equalization)?

בקצבים של 8GT/s, סגירת העין הנוספת הנובעת מהפרעות ISI עשויה להיות משמעותית ביותר. השימוש באקווליזציה מאפשר לפצות על חלק מהריצוד הנובע מ-ISI שנגרם על-ידי הערוץ, באמצעות החלת אקווליזציה של אותות בצד המקלט. באופן אידיאלי, האקווליזציה צריכה להיות תואמת לערך ההופכי של היענות האימפולס של הערוץ.

באופן כזה היא מצליחה להנחית תדרים מסוימים ולהגביר אחרים במטרה להשיג היענות תדר אחידה בסוף הערוץ. ככל שהערוץ ארוך יותר, בעל מחברים רבים יותר ומאלץ את האותות לעבור דרך קדחים, כך האות שיויפע בסוף הערוץ יהיה מעוות יותר. במקרה של PCI Express 3.0, בנקודת הסיום של ערוץ באורך 48 ס"מ שבו שני מחברים, העין כבר תהיה סגורה לחלוטין.

ייתכן שאקווליזציה בלבד לא תספיק כדי להשאיר את העין פתוחה. האתגר המשמעותי יותר המאפיין את תהליך הפיתוח בקצבי 8GT/s טמון בצורך ליצור בדיקת עומס למקלט, אשר תוכל לשכפל תנאי Worst Case של האותות. גם בדיקה כזו נדרשת להשיג עין סגורה; עם זאת, העין אינה יכולה להיות סגורה במידה שתמנע ממקלט תואם לפתוח אותה.

טכניקת De-emphasis

בנוסף לאקווליזציה בצד הקליטה, ניתן להוסיף אקווליזציה גם מצד המשדר. הטכניקה הזו מכונה גם De-emphasis, ומדגישה את סיביות המעבר של אותות הנתונים בניסיון להתגבר על היענות האימפולס של הערוץ דרכו הנתונים מועברים. באמצעות טכניקה זו משתמשים במתחים גבוהים יותר לביצוע מעברי הסיביות ממצבי 0-1 או 1-0, כדי להתגבר על קבוע הזמן של הערוץ הנתון.

PCI Express Agilent צב"ד דיאגרמת עין מסנן מעביר נמוכים
עקומת היענות טיפוסית של אקוולייזר CTLE

כאשר משלבים טכניקה זו ביחד עם אקווליזציה של המקלט, למעשה עומדים לרשותנו  שני כלים המאפשרים להתגבר על הפסדי הערוץ ועל חוסר רציפות קיבולי או השראותי הקיים בערוץ.

האקוולייזרים המשולבים במקלטים יכולים להיות ליניאריים או לא ליניאריים. האקוולייזר הפשוט והזול ביותר הוא אקוולייזר ליניארי בזמן רציף (CTLE): בעיקרו הוא מסנן מעביר תדרים גבוהים המנחית רכיבים הרמוניים נמוכי תדר כשהאות חורג מתקרת ההרמוניות.

בכפוף לתכנון, אקלווייזר CTLE עשוי לכלול או לא לכלול שבח. השבח יכול אמנם להיות שימושי, אולם בה בעת עלול להגביר רעש בתדר נמוך ולגרום לירידה ניכרת ביחס האות לרעש של המקלט.

עם זאת, כאשר אקלווייזר ה-CTLE שבמקלט משולב עם טכניקת De-emphasis מבוססת משדר, הוא יכול לספק ביצועים נאותים עבור מערכות 8GT/s רבות – במיוחד מערכות בעלות ערוצים קצרים (25 ס"מ או פחות). בערוצים ארוכים יותר, ייתכן שתידרש אקווליזציה ליניארית מתוחכמת יותר, דוגמת  Feed Forward Equalization או Decision Feedback Equalization. ביישום אופייני של ערוץ ארוך, סכימת האקווליזציה הנבחרת עשויה לכלול אקוולייזר CTLE/FFE שלאחריו DFE.

דרישות רוחב פס של הסקופ ב-8GT/s

אחת מהשאלות הנשאלת לעתים מזומנות על-ידי מפתחי פתרונות קישוריות מהירים היא מהן הן דרישות רוחב הפס המינימלי שיש לקחת בחשבון בעת בחירת האוסילוסקופ המשמש למדידת התעבורה. קבוצת PCI-SIG קבעה שרוחב הפס המינימלי הנדרש מסקופים עבור קצבי 5GT/s, הינו 12.5GHz. ההנחייה גובשה על סמך ההנחה שיושג דיוק משופר באמצעות לכידת ההרמוניה ה-5 של האות הנמדד.

תקני PCI Express 2.0 ו-PCI Express 3.0 מאפשרים לבצע  De-embedding של האותות בתקע של ההתקן הנמדד. סביבת המדידה האופיינית המשמשת לאימות IC כוללת התקן מותאם אישית, אשר מפריד את אותות הכניסה והיציאה של המשדרים ושל המקלטים ומחלצם לתוך מחברים גבוהי תדרים (כגון SMAs או SMPs). בכל מקרה, התקן הפרדה זה מוסיף הפסדים לאות, ביחס למדידה ישירה המבוצעת בתקע המארז. לצורך שחזור חלק מההפסדים, ייתכן שכדאי יהיה לבצע De-embedding לערוץ. תהליך ה-De-embedding אינו מתואר במאמר זה, אולם השימוש בו כטכניקה לשחזר מרווח תכנוני, הוא רלוונטי ביותר להגדרת רוחב הפס הדרוש ל-PCI Express 3.0.

PCI Express Agilent Eye Diagram
חישוב ניחות המעבר (Insertion Loss) של הערוץ

ביצוע De-embedding לערוץ

כשמבצעים De-embedding לערוץ, תחילה יש לחשב את ניחות המעבר (Insertion Loss) של הערוץ הספציפי. בדרך כלל החישוב מבוצע באמצעות S-parameters המתארים את ההפסדים תלויי התדר של הערוץ.

לצורך ביצוע De-embedding לערוץ, יש ליצור את הערך המתימטי ההופכי לתגובת המדרגה (Step Response) של הערוץ ולהחיל את ההתמרה על האות הנמדד.

PCI Express Agilent
De-embedded waveform+Post Channel Waveform

אולם אין מתנות חינם. למרות שניתן ללכוד את ה-S-parameters עבור ערוצים של עד כ-20GHz, תהליך ה-De-embedding של ערוץ כזה מוגבל בד"כ על-ידי רצפת הרעש של המכשירים שבהם נעשה שימוש.

במקרה של אותות PCI Express 3.0 בקצבי 8GT/s, לא קיימת למעשה תכולת תדרים משמעותית מעל לתדר של 8GHz, והדבר מגביל את יעילות תהליך ה-De-embedding לכ-12GHz בקירוב. החדשות הטובות הן, שהכלים שבהם נעשה שימוש עבור PCI Express 2.0 עדיין שמישים במסגרת מדידות התאימות גם עבור PCI Express 3.0.

האם רוחב פס גדול הוא בהכרח טוב יותר?

אחת מהנחות היסוד בנוגע לרוחב הפס של האוסילוסקופ הנדרש לצורך מדידת אותות מהירים נוגעת לקצבי הקצה שאותם מצפים לגלות. בטכנולוגיית PCI Express 3.0, מצפים שהרכיבים המשולבים ייוצרו בגיאומטריה של 45-65 ננומטר. קצבי הקצה המתקבלים בשבבים בגיאומטריה זו הם בד"כ 40ps-65ps. בדיקת התכולה ההרמונית של אותות 8GT/s מראה שהרמוניות הגבול העליון נמוכות בהרבה מרצפת הרעש של המכשור הקיים בשוק, ולא ניתן לפתור אותן במידה שתשפר את דיוק המדידה.

כאשר גיאומטריות הצומת יורדות אל מתחת ל-28 ננומטר, ניתן לצפות לגידול משמעותי בקצבי הקצה. במקביל, נהייה עדים גם לגידול באמפליטודת ההרמוניות המופקות, ודבר זה בתורו יגרום להיווצרות צורות גל שקצותיהן רבועים יותר למראה מאשר הצורות המיוצרות על-ידי שבבים הבנויים בגיאומטריות גדולות יותר. לפיכך, ככל שהאות יהיה רבוע יותר, כך הוא פחות מועד לריצוד הנגרם על-ידי רעש הערוץ, ומתח השיא-לשיא יכול להיות גבוה יותר. כאשר נידרש לטפל בקצבי קצה של 12.5ps, נגלה שמדידות רוחב פס שיבוצעו באמצעות מכשור נמוך רעש יספקו קריאות מדויקות יותר ויציגו מרווח גבוה יותר עבור ההתקן.

PCI Express Agilent Eye Diagram
דיאגרמת עין של אות 8GT/s שנמדדה בתדר של 20GHz

האוסילוסקופים מסייעים

באיורים מימין מוצגת השוואה של דיאגרמות עין שנמדדו עבור אותות 8GT/s בתדרים של 32GHz ו-20GHz ובקצבי קצה של 12.5ps. במקרה זה, מומלץ להשתמש במכשור רוחב פס מהיר יותר, המאפשר לשחזר מרווח מוגדל של מתח וריצוד במהלך המדידות.

PCI Express Agilent Eye Diagram
דיאגרמת עין של אות 8GT/s שנמדדה בתדר של 32GHz

החדשות הטובות הן, שבשוק קיימים מכשירים המספקים את הביצועים ואת היכולות הדרושים להשגת תכנונים אמינים לקצבי 8GT/s, ומכסים ערוצים שמגיעים עד ל-48 ס"מ.

אוסילוסקופ כמו Agilent Infiniium 90000 X-Series, המשלב De-embedding ואקווליזציה' יכול להבהיר כיצד ייראה האות בצד שבב הסיליקון של המקלט – מידע קריטי להבנת מרווח הפעולה הממשי.

Share via Whatsapp

פורסם בקטגוריות: חדשות , ציוד בדיקה