متخصصان شبکه در هنگام اضافه کردن افزونگی در طراحی شبکه، از جمله تجهیزات شبکه، پروتکلها، پشتیبانگیری، پردازش و اتصالات زیرشبکه، عوامل متعددی را باید در نظر بگیرند.
وقتی شبکه قطع میشود، همه چیز متوقف میشود. برای برخی از شرکتها، حتی چند دقیقه قطعی نیز مقدور نیست. برای برخی دیگر، از جمله کسانی که کسب و کارشان وابسته به یک وبسایت است، چند دقیقه قطعی به معنای از دست دادن درآمد و احتمالاً از دست رفتن مشتریان است.
برای این شرکتها بسیار مهم است که شبکهای را طراحی کنند که علیرغم خرابی بخشی از آن، همچنان فعال بماند.
شرکتهایی که حتی یک قطعی کوتاه در آنها تأثیر عمدهای دارد، باید تجهیزات بیشتری اضافه کنند. اما اضافه کردن افزونگی شبکه، هزینه و پیچیدگیهای آن را افزایش میدهد. هر شرکت باید قبل از اضافه کردن تجهیزات بیشتر، هزینههای خرابی را با هزینه افزودن دستگاهها و خدمات مقایسه کند.
در ادامه 7 عاملی که تیمهای شبکه باید هنگام بررسی طرحهای افزونگی شبکه خود ارزیابی کنند، آورده شده است.
1. سوییچها و روترها
سوییچها و روترها کاملاً قابل اعتماد هستند، اما گاهی خراب میشوند. کافی است سازمانها یک سوئیچ یا روتر اضافی داشته باشند تا در صورت خرابی بتوانند به سرعت آن را تعویض کنند.
2. پروتکلهای شبکه
سازمانهایی با شبکه استانداردسازی شده، پروتکلهای شبکهای را توسعه دادهاند که در صورت بروز نقص، امکان تعویض سریع به دستگاههای پشتیبان را فراهم میکنند. اضافه کردن افزونگی در لایه 2 مستلزم آن است که تیمها بیش از یک سوییچ را به هر بخش زیر شبکه متصل کنند.
این سوییچهای اضافی چندین مسیر را از طریق شبکه ایجاد میکنند و در نتیجه، شبکه با چندین نسخه از هر بسته پر میشود.
الگوریتم Spanning Tree روشی برای تعیین یک مسیر واحد از طریق شبکه را ارائه میدهد. متأسفانه، Spanning Tree میتواند تقریباً یک دقیقه طول بکشد تا یک مسیر جدید را تعیین کند. این بازه زمانی ممکن است برای برخی از شبکهها قابل قبول باشد، اما برخی دیگر نیاز به بازیابی سریعتری دارند.
پروتکلهای جدیدی، از جمله MLAG ،ا TRILL وا SPB، برای پشتیبانی از بازیابی سریعتر توسعه یافتهاند. تیمهای شبکهای که طرحهای افزونگی شبکه را میسازند و به بازیابی سریعتری نیاز دارند، باید تعیین کنند که کدام گزینه برای شبکه آنها بهترین کارایی را دارد.

3. اتصالات زیر شبکه
گام بعدی در افزودن افزونگی، اتصال زیرشبکهها است. باز هم، لازم است چندین مسیر بین زیرشبکهها ارائه شود. روترها، زیرشبکهها را در یک شبکه و به مقاصد خارجی متصل میکنند.
هر زیر شبکه باید به چندین روتر متصل باشد تا افزونگی ایجاد شود. پروتکلهایی مانند OSPF و EIGRP تعیین میکنند که چگونه روترها یکدیگر را از مسیر بهینه فعلی به هر مقصد مطلع کنند.
روترها تصور میکنند که اگر برای چند ثانیه هیچ بروزرسانی از روتر همسایه دریافت نشود، روتر همسایه از کار افتاده است. با این حال، OSPF و EIGRP نسبت به برخی از شبکهها میتوانند زمان بیشتری را برای بازیابی بپذیرند. پروتکل HSRP و پروتکل VRRP برای کاهش زمان لازم برای بازیابی از خرابی روتر در دسترساند.
اتصال شبکه میتواند به دلایل مختلفی قطع شود مثلا کسی سیم اشتباهی را میکشد، هنگام اضافه کردن یک اتصال جدید، اتصال را قطع میکند یا در حین جابجایی تجهیزات، کابلها را مرتب میکند. IEEE 802.3ad link aggregation نحوه استفاده از دو کابل را برای یک اتصال مشخص میکند.
تا زمانی که هر دو کابل به هم متصل باشند، میتوان ترافیک را بین دو کابل به اشتراک گذاشت، اما اگر یکی از آنها قطع شود، همچنان به کار خود ادامه میدهد.
4. پشتیبان گیری
خرابی دیسک که منجر به از دست دادن اطلاعات شود میتواند یک شرکت را فلج کند. پشتیبانگیری روزانه برای برخی از سازمانها کافی است، درحالیکه برخی دیگر حتی نم توانند از دست رفتن دادههای یک روز و زمان لازم برای بازیابی آن را بپذیرند.
RAID در برابر خرابی یک دیسک محافظت ایجاد میکند. چندین سطح حفاظت وجود دارد و هر آیتم داده را میتوان روی دو دیسک مختلف نوشت.
سطوح حفاظتی بالاتر، روشهایی را برای افزودن دیسکهای اضافی و اطلاعات همسان تعریف میکنند، که به تیمها امکان میدهد تا در صورتی که دو دیسک حاوی دادههای یکسانی بودند، دادههای صحیح را بازیابی کنند.
پشتیبان گیری ابری پیوسته، نسبت به بالاترین سطوح RAID مزیتهایی دارد، زیرا ارسال هر بروزرسانی داده به ابر یعنی هیچ دادهای از بین نخواهد رفت.
هر دیسک RAID در یک کابینت نصب میشود، به این معنی که آسیب به آن کابینت میتواند همه دیسکها را از بین ببرد. در عین حال، لازم است به صورت دورهای از مجموعه، نسخه پشتیبان تهیه کنید؛ اما دادههای جمعآوری شده پس از آخرین نسخه پشتیبان از بین خواهند رفت.
5. پردازندهها
پردازندهها میتوانند درست مانند سایر اجزاء از کار بیفتند، بنابراین مهم است که آنها را در طراحیهای افزونگی شبکه در نظر بگیرید. علاوه بر احتمال خرابی، پردازندهها باید به طور مرتب با آخرین نسخه نرم افزار سیستم بروز شوند. لازم است سازمانها منابع پردازشی اضافی لازم برای تضمین عملکرد مداوم شبکه را در نظر بگیرند.
انتقال تمام پردازشها و ذخیرهسازی به یک ابر عمومی میتواند کار طراحی افزونگی را سادهتر کند. ابرها دارای پردازندهها و واحدهای ذخیرهسازی زیادی هستند، برنامهها میتوانند به سرعت در صورت خرابی به پردازنده دیگری منتقل شوند و ذخیرهسازی اضافی را میتوان پیکربندی کرد.
اگر رویدادی باعث اختلال یا خاموشی کل یک مرکز شود، پردازش میتواند به یک مکان دیگر منتقل شود.
6. برق
بدیهی است که هیچ چیز بدون برق کار نمیکند که آن هم میتواند به دلیل طوفان، سقوط تیر یا هر دلیل دیگری از کار بیفتد. در صورت خرابی، پشتیبان باتری میتواند به سرعت کار را به دست گیرد، اما این گزینه ممکن است برای تاسیسات بزرگ نیاز به تعداد زیادی واحد پشتیبان داشته باشد.
تعویض به ژنراتور زمان بیشتری میبرد، اما اگر خاموشی بیش از ظرفیت باتری طول بکشد، ژنراتور میتواند بار بیشتری را تحمل کند. در برخی موارد، امکان اتصال به دو مدار مختلف تامین کننده نیز وجود دارد تا از آسیب سیم در یکی از مسیرهای تامین کننده در امان بمانید.
7. WAN و SD-WAN
رشد محاسبات ابری و اهمیت کاربران از راه دور، قابلیت اطمینان WAN را به طور فزایندهای حیاتی کرده است. یک گزینه برای شرکتها این است که امکان اتصال به دو ارائه دهنده خدمات شبکه مختلف را فراهم کنند. با وجودی که این امر باعث افزایش هزینهها میشود، از خرابی در طول لینک به ارائهدهنده و شکست در شبکه ارائهدهنده محافظت میکند.
SD-WAN یک راه دیگر برای اضافه کردن افزونگی شبکه فراهم میکند. مدارهای MPLS کاملا قابل اعتماد هستند و سطح مشخصی از کیفیت خدمات (QoS) را تضمین میکنند، اما ممکن است از کار بیفتند.
یک کنترلر SD-WAN میتواند در صورت خرابی، ترافیک را به اینترنت تغییر دهد. با وجود اینکه اینترنت عمومی سطح یکسانی از قابلیت اطمینان یا تضمین QoS را ارائه نمیدهد، اما راهی برای رساندن دادهها به مقصد را فراهم میآورد.
مزیت دیگر SD-WAN این است که به جای اینکه تیمها مجبور باشند برای حداکثر سطح پهنای باند MPLS مورد نیاز در طول سال قرارداد ببندند، میتوانند ترافیک کم اهمیت را در زمانهای حداکثر بار به اینترنت منتقل کنند.
اضافه کردن افزونگی هزینه و پیچیدگی را افزایش میدهد. طراحان نباید افزونگی شبکه را بیش از حد لازم لحاظ کنند، اما از طرفی نیز نباید در مورد آن کوتاهی کنند، زیرا حتی یک اختلال کوتاه میتواند به منزله موفقیت یا شکست یک سازمان باشد.