מהי בעצם רשת שדרה-עלים? רשת שדרה-עלים של רשתות בסיס

על מנת לענות על צרכי שירותי הענן, הרשת מחולקת בהדרגה לרשתות Underlay ו-Overlay. רשת Underlay היא הציוד הפיזי כגון ניתוב ומיתוג במרכזי נתונים מסורתיים, שעדיין מאמינים במושג היציבות ומספקים יכולות העברת נתונים אמינות ברשת. Overlay היא רשת עסקית המקופלת עליה, קרוב יותר לשירות, באמצעות אנקפסולציה של פרוטוקול VXLAN או GRE, כדי לספק למשתמשים שירותי רשת קלים לשימוש. רשת Underlay ורשת Ooverlay קשורות ומנותקות, והן קשורות זו לזו ויכולות להתפתח באופן עצמאי.

רשת הבסיס (Underlay) היא הבסיס של הרשת. אם רשת הבסיס אינה יציבה, אין הסכם רמת שירות (SLA) לעסק. לאחר ארכיטקטורת הרשת התלת-שכבתית וארכיטקטורת הרשת Fat-Tree, ארכיטקטורת רשת מרכז הנתונים עוברת לארכיטקטורת Spine-Leaf, מה שהוביל את היישום השלישי של מודל רשת CLOS.

ארכיטקטורת רשת מסורתית של מרכז נתונים

עיצוב שלוש שכבות

בין השנים 2004 ל-2007, ארכיטקטורת הרשת בת שלוש השכבות הייתה פופולרית מאוד במרכזי נתונים. יש לה שלוש שכבות: שכבת הליבה (עמוד השדרה המהיר של המיתוג של הרשת), שכבת הצבירה (המספקת קישוריות מבוססת מדיניות) ושכבת הגישה (המחברת תחנות עבודה לרשת). המודל הוא כדלקמן:

מודל 3 שכבות

ארכיטקטורת רשת תלת-שכבתית

שכבת ליבה: מתגי הליבה מספקים העברה מהירה של חבילות אל תוך ומחוץ למרכז הנתונים, קישוריות לשכבות הצבירה המרובות ורשת ניתוב L3 גמישה שבדרך כלל משרתת את הרשת כולה.

שכבת צבירה: מתג הצבירה מתחבר למתג הגישה ומספק שירותים נוספים, כגון חומת אש, פריקת SSL, זיהוי חדירות, ניתוח רשת וכו'.

שכבת גישה: מתגי הגישה נמצאים בדרך כלל בחלק העליון של המדף, ולכן הם נקראים גם מתגי ToR (Top of Rack), והם מתחברים פיזית לשרתים.

בדרך כלל, מתג הצבירה הוא נקודת ההפרדה בין רשתות L2 ו-L3: רשת L2 נמצאת מתחת למתג הצבירה, ורשת L3 נמצאת מעל. כל קבוצת מתגי צבירה מנהלת נקודת מסירה (POD), וכל POD היא רשת VLAN עצמאית.

פרוטוקול לולאת רשת ועץ פורש

היווצרות לולאות נגרמת בעיקר מבלבול הנגרם מנתיבי יעד לא ברורים. כאשר משתמשים בונים רשתות, על מנת להבטיח אמינות, הם בדרך כלל משתמשים בהתקנים יתירים ובקישורים יתירים, כך שנוצרות לולאות באופן בלתי נמנע. רשת שכבה 2 נמצאת באותו תחום שידור, וחבילות השידור ישודרו שוב ושוב בלולאה, ויוצרות סערת שידור, אשר עלולה לגרום לחסימת פורטים ולשיתוק ציוד באופן מיידי. לכן, על מנת למנוע סערות שידור, יש צורך למנוע היווצרות לולאות.

כדי למנוע היווצרות לולאות ולהבטיח אמינות, ניתן להפוך התקנים מיותרים וקישורים מיותרים להתקני גיבוי וקישורי גיבוי רק. כלומר, יציאות וקישורים של התקנים מיותרים חסומים בנסיבות רגילות ואינם משתתפים בהעברת חבילות נתונים. רק כאשר ההתקן, היציאה או הקישור הנוכחיים נכשלים, וכתוצאה מכך עומס ברשת, יציאות וקישורים מיותרים של התקנים ייפתחו, כך שניתן יהיה להחזיר את הרשת למצב רגיל. בקרה אוטומטית זו מיושמת על ידי פרוטוקול עץ מתלה (STP).

פרוטוקול עץ פורש פועל בין שכבת הגישה לשכבת ה-sink, ובליבו נמצא אלגוריתם עץ פורש הפועל על כל גשר התומך ב-STP, אשר תוכנן במיוחד כדי למנוע לולאות גישור בנוכחות נתיבים מיותרים. STP בוחר את נתיב הנתונים הטוב ביותר להעברת הודעות ואוסר קישורים שאינם חלק מהעץ פורש, ומשאיר רק נתיב פעיל אחד בין שני צמתי רשת והקישור העולה השני ייחסם.

ארכיטקטורת רשת בת 3 שכבות

ל-STP יתרונות רבים: הוא פשוט, ניתן לחבר אותו ולהפעיל אותו, ודורש מעט מאוד תצורה. המכונות בכל פוד שייכות לאותו VLAN, כך שהשרת יכול להעביר את המיקום באופן שרירותי בתוך הפוד מבלי לשנות את כתובת ה-IP והשער.

עם זאת, STP לא יכול להשתמש בנתיבי העברה מקבילים, אשר תמיד יבטל נתיבים מיותרים בתוך ה-VLAN. חסרונות של STP:

1. התכנסות איטית של טופולוגיה. כאשר טופולוגיית הרשת משתנה, פרוטוקול העץ הפורש לוקח 50-52 שניות להשלים את התכנסות הטופולוגיה.

2, לא יכול לספק את פונקציית איזון העומסים. כאשר יש לולאה ברשת, פרוטוקול עץ פורש יכול פשוט לחסום את הלולאה, כך שהקישור לא יכול להעביר חבילות נתונים, ובכך לבזבז משאבי רשת.

וירטואליזציה ואתגרי תעבורה ממזרח למערב

לאחר 2010, במטרה לשפר את ניצול משאבי המחשוב והאחסון, מרכזי נתונים החלו לאמץ טכנולוגיית וירטואליזציה, ומספר רב של מכונות וירטואליות החל להופיע ברשת. טכנולוגיה וירטואלית הופכת שרת למספר שרתים לוגיים, כאשר לכל מכונה וירטואלית ניתן לפעול באופן עצמאי, יש לה מערכת הפעלה משלה, אפליקציה, כתובת MAC וכתובת IP עצמאיות משלה, והם מתחברים לישות החיצונית דרך מתג וירטואלי (vSwitch) בתוך השרת.

לווירטואליזציה יש דרישה נלווית: הגירה בזמן אמת של מכונות וירטואליות, היכולת להעביר מערכת של מכונות וירטואליות משרת פיזי אחד לאחר תוך שמירה על פעולה רגילה של שירותים במכונות הווירטואליות. תהליך זה אינו רגיש למשתמשי הקצה, מנהלי מערכת יכולים להקצות משאבי שרת באופן גמיש, או לתקן ולשדרג שרתים פיזיים מבלי להשפיע על השימוש הרגיל של המשתמשים.

על מנת להבטיח שהשירות לא יופרע במהלך ההגירה, נדרש לא רק שכתובת ה-IP של המכונה הווירטואלית תישאר ללא שינוי, אלא גם שמצב ההפעלה של המכונה הווירטואלית (כגון מצב סשן TCP) יישמר במהלך ההגירה, כך שההגירה הדינמית של המכונה הווירטואלית תוכל להתבצע רק באותו תחום שכבה 2, אך לא על פני הגירת תחום שכבה 2. זה יוצר את הצורך בתחומי L2 גדולים יותר משכבת ​​הגישה לשכבת הליבה.

נקודת ההפרדה בין L2 ל-L3 בארכיטקטורת רשת שכבה 2 גדולה מסורתית היא במתג הליבה, ומרכז הנתונים שמתחת למתג הליבה הוא תחום שידור שלם, כלומר, רשת L2. בדרך זו, ניתן לממש את השרירותיות של פריסת המכשירים והעברת המיקומים, מבלי שיהיה צורך לשנות את תצורת ה-IP והשער. רשתות L2 השונות (VLans) מנותבות דרך מתגי הליבה. עם זאת, מתג הליבה תחת ארכיטקטורה זו צריך לשמור על טבלת MAC ו-ARP ענקית, מה שמציב דרישות גבוהות ליכולת מתג הליבה. בנוסף, מתג הגישה (TOR) מגביל גם את קנה המידה של הרשת כולה. אלה מגבילים בסופו של דבר את קנה המידה של הרשת, את הרחבת הרשת ואת יכולת הגמישות, ובעיית העיכוב על פני שלוש שכבות התזמון, לא תוכל לענות על צרכי העסק העתידי.

מצד שני, התעבורה ממזרח למערב שמביאה טכנולוגיית הווירטואליזציה גם מעמידה אתגרים לרשת המסורתית בת שלוש השכבות. ניתן לחלק את תעבורת מרכזי הנתונים באופן כללי לקטגוריות הבאות:

תנועה מצפון לדרום:תעבורה בין לקוחות מחוץ למרכז הנתונים לשרת מרכז הנתונים, או תעבורה משרת מרכז הנתונים לאינטרנט.

תנועה ממזרח למערב:תעבורה בין שרתים בתוך מרכז נתונים, כמו גם תעבורה בין מרכזי נתונים שונים, כגון התאוששות מאסון בין מרכזי נתונים, תקשורת בין עננים פרטיים וציבוריים.

הכנסת טכנולוגיית הווירטואליזציה הופכת את פריסת היישומים למבוזרת יותר ויותר, ו"תופעת הלוואי" היא שתעבורת הרשתות ממזרח למערב הולכת וגדלה.

ארכיטקטורות מסורתיות בעלות שלוש שכבות מתוכננות בדרך כלל עבור תעבורה צפון-דרום.למרות שניתן להשתמש בו לתנועה מזרח-מערב, הוא עלול בסופו של דבר לא לתפקד כנדרש.

 ארכיטקטורות מסורתיות בעלות שלוש קומות

ארכיטקטורה מסורתית בת שלוש קומות לעומת ארכיטקטורת שדרה-עלים

בארכיטקטורה בת שלוש שכבות, תעבורה ממזרח למערב חייבת להיות מועברת דרך התקנים בשכבות הצבירה והליבה. מעבר מיותר של צמתים רבים. (שרת -> גישה -> צבירה -> מתג ליבה -> צבירה -> מתג גישה -> שרת)

לכן, אם כמות גדולה של תעבורה ממזרח למערב עוברת דרך ארכיטקטורת רשת מסורתית בת שלוש שכבות, התקנים המחוברים לאותו יציאת מתג עשויים להתחרות על רוחב פס, וכתוצאה מכך זמני תגובה גרועים שיתקבלו על ידי משתמשי הקצה.

חסרונות של ארכיטקטורת רשת תלת-שכבתית מסורתית

ניתן לראות כי לארכיטקטורת הרשת המסורתית בת שלוש השכבות יש חסרונות רבים:

בזבוז רוחב פס:כדי למנוע לולאה, פרוטוקול STP מופעל בדרך כלל בין שכבת הצבירה לשכבת הגישה, כך שרק קישור עלייה אחד של מתג הגישה באמת נושא תעבורה, ושאר הקישורים העליונים ייחסמו, וכתוצאה מכך בזבוז רוחב פס.

קושי בהצבת רשת בקנה מידה גדול:עם הרחבת קנה המידה של הרשת, מרכזי נתונים מפוזרים במיקומים גיאוגרפיים שונים, יש ליצור ולהעביר מכונות וירטואליות לכל מקום, ותכונות הרשת שלהן כגון כתובות IP ושערים נותרות ללא שינוי, מה שמחייב את התמיכה של שכבה 2 (fat Layer 2). במבנה המסורתי, לא ניתן לבצע העברה.

חוסר תנועה ממזרח למערב:ארכיטקטורת הרשת בת שלוש השכבות מיועדת בעיקר לתעבורה מצפון לדרום, למרות שהיא תומכת גם בתעבורה ממזרח למערב, אך החסרונות ניכרים. כאשר התעבורה ממזרח למערב גדולה, הלחץ על שכבת הצבירה ומתגי שכבת הליבה יגדל מאוד, וגודל הרשת והביצועים יוגבלו לשכבת הצבירה ולשכבת הליבה.

זה גורם לארגונים ליפול לדילמה של עלות וגמישות:תמיכה ברשתות בעלות ביצועים גבוהים בקנה מידה גדול דורשת מספר רב של ציוד שכבת התכנסות ושכבת ליבה, מה שלא רק מביא עלויות גבוהות לארגונים, אלא גם דורש תכנון מראש של הרשת בעת בניית הרשת. כאשר קנה המידה של הרשת קטן, הדבר יגרום לבזבוז משאבים, וכאשר קנה המידה של הרשת ממשיך להתרחב, קשה להתרחב.

ארכיטקטורת רשת השדרה-עלים
מהי ארכיטקטורת רשת Spine-Leaf?
בתגובה לבעיות הנ"ל,עיצוב חדש של מרכז נתונים, ארכיטקטורת רשת Spine-Leaf, צץ, וזה מה שאנו מכנים רשת רכס עלים.
כפי שהשם מרמז, לארכיטקטורה יש שכבת שדרה ושכבת עלה, כולל מתגי שדרה ומתגי עלה.

 ארכיטקטורת רשת שדרה-עלים

ארכיטקטורת השדרה-עלים

כל מתג עלה מחובר לכל מתגי הרכס, שאינם מחוברים ישירות זה לזה, ויוצרים טופולוגיית רשת מלאה.
ב-spine-and-leaf, חיבור משרת אחד לאחר עובר דרך אותו מספר של התקנים (Server -> Leaf -> Spine Switch -> Leaf Switch -> Server), מה שמבטיח השהייה צפויה. מכיוון שחבילה צריכה לעבור רק דרך spine אחד ועלה נוסף כדי להגיע ליעד.

איך פועלת שדרה-עלה?
מתג Leaf: הוא שווה ערך למתג הגישה בארכיטקטורה המסורתית בת שלוש השכבות ומתחבר ישירות לשרת הפיזי כ-TOR (Top Of Rack). ההבדל עם מתג הגישה הוא שנקודת התיחום של רשת L2/L3 נמצאת כעת על מתג Leaf. מתג Leaf נמצא מעל רשת 3 השכבות, ומתג Leaf נמצא מתחת לתחום השידור העצמאי של L2, מה שפתר את בעיית ה-BUM של רשת 2 השכבות הגדולה. אם שני שרתי Leaf צריכים לתקשר, עליהם להשתמש בניתוב L3 ולהעביר אותו דרך מתג Spine.
מתג Spine: שווה ערך למתג ליבה. ECMP (Equal Cost Multi Path) משמש לבחירה דינמית של נתיבים מרובים בין מתגי Spine ו-Leaf. ההבדל הוא ש-Spine מספק כעת פשוט רשת ניתוב L3 גמישה עבור מתג Leaf, כך שניתן לנתב את תעבורת צפון-דרום של מרכז הנתונים ממתג Spine במקום ישירות. ניתן לנתב תעבורת צפון-דרום ממתג הקצה במקביל למתג Leaf לנתב WAN.

 ארכיטקטורת רשת Spine-Leaf לעומת ארכיטקטורת רשת מסורתית בת שלוש שכבות

השוואה בין ארכיטקטורת רשת Spine/Leaf לבין ארכיטקטורת רשת מסורתית בת שלוש שכבות

יתרונות של שדרה-עלה
שָׁטוּחַ:עיצוב שטוח מקצר את נתיב התקשורת בין שרתים, וכתוצאה מכך השהייה נמוכה יותר, מה שיכול לשפר משמעותית את ביצועי היישומים והשירות.
יכולת הרחבה טובה:כאשר רוחב הפס אינו מספיק, הגדלת מספר מתגי הרכס יכולה להאריך את רוחב הפס בצורה אופקית. כאשר מספר השרתים גדל, ניתן להוסיף מתגי עלה אם צפיפות הפורטים אינה מספקת.
הפחתת עלויות: תנועה צפונה ודרומה, היוצאת מצמתי עלים או יוצאת מצמתי רכס. זרימה מזרח-מערב, המפוזרת על פני נתיבים מרובים. בדרך זו, רשת רכס העלים יכולה להשתמש במתגים עם תצורה קבועה ללא צורך במתגים מודולריים יקרים, ובכך להפחית את העלות.
השהיה נמוכה ומניעת גודש:לזרימת נתונים ברשת Leaf ridge יש את אותו מספר של קפיצות ברחבי הרשת ללא קשר למקור וליעד, וכל שני שרתים ניתנים לגישה בשלוש קפיצות זה מזה. זה יוצר נתיב תעבורה ישיר יותר, מה שמשפר את הביצועים ומפחית צווארי בקבוק.
אבטחה וזמינות גבוהות:פרוטוקול STP משמש בארכיטקטורת רשת מסורתית בת שלוש שכבות, וכאשר התקן נכשל, הוא יתכנס מחדש, מה שמשפיע על ביצועי הרשת או אפילו כשל. בארכיטקטורת leaf-ridge, כאשר התקן נכשל, אין צורך להתכנס מחדש, והתעבורה ממשיכה לעבור דרך נתיבים רגילים אחרים. קישוריות הרשת אינה מושפעת, ורוחב הפס מצטמצם רק בנתיב אחד, עם השפעה מועטה על הביצועים.
איזון עומסים באמצעות ECMP מתאים היטב לסביבות בהן נעשה שימוש בפלטפורמות ניהול רשת מרכזיות כגון SDN. SDN מאפשר לפשט את התצורה, הניהול והניתוב מחדש של תעבורה במקרה של חסימה או כשל בקישור, מה שהופך את טופולוגיית הרשת המלאה של איזון עומסים חכמה לדרך פשוטה יחסית לתצורה וניהול.

עם זאת, לארכיטקטורת Spine-Leaf יש כמה מגבלות:
חיסרון אחד הוא שמספר המתגים מגדיל את גודל הרשת. מרכז הנתונים של ארכיטקטורת רשת עלה רכס צריך להגדיל את מספר המתגים וציוד הרשת באופן פרופורציונלי למספר הלקוחות. ככל שמספר המארחים גדל, נדרש מספר גדול של מתגי עלה כדי להתחבר למתג הרכס.
החיבור הישיר בין מתגי רכס ומתגי עלה דורש התאמה, ובאופן כללי, יחס רוחב הפס הסביר בין מתגי עלה ומתגי רכס אינו יכול לעלות על 3:1.
לדוגמה, ישנם 48 לקוחות בקצב 10Gbps במתג העלה עם קיבולת פורטים כוללת של 480Gb/s. אם ארבעת פורטי ה-uplink של 40G של כל מתג עלה מחוברים למתג הרכס של 40G, תהיה לו קיבולת uplink של 160Gb/s. היחס הוא 480:160, או 3:1. uplinks של מרכז נתונים הם בדרך כלל 40G או 100G וניתן להעביר אותם לאורך זמן מנקודת התחלה של 40G (Nx 40G) ל-100G (Nx 100G). חשוב לציין שה-uplink צריך תמיד לפעול מהר יותר מה-downlink כדי לא לחסום את קישור הפורטים.

 יחס רוחב פס של מתג שדרה-עלה

לרשתות Spine-Leaf יש גם דרישות חיווט ברורות. מכיוון שכל צומת עלה חייב להיות מחובר לכל מתג Spine, עלינו להניח יותר כבלי נחושת או סיבים אופטיים. מרחק החיבור מעלה את העלות. בהתאם למרחק בין המתגים המחוברים, מספר המודולים האופטיים המתקדמים הנדרשים על ידי ארכיטקטורת Spine-Leaf גבוה פי עשרות מזה של הארכיטקטורה המסורתית בת שלוש השכבות, מה שמגדיל את עלות הפריסה הכוללת. עם זאת, הדבר הוביל לצמיחה של שוק המודולים האופטיים, במיוחד עבור מודולים אופטיים במהירות גבוהה כמו 100G ו-400G.


זמן פרסום: 26 בינואר 2026