تاب‌آوری خطا

تحمل‌پذیری اشکال یا عیب‌تابی[1] (به انگلیسی: Fault tolerance) ویژگی ای است که سامانه را قادر می‌سازد تا با به وجود آمدن اشکال (یک یا چندین اشکال) در اجزایش، به صورت صحیح به کار خود ادامه دهد. در این دسته از سامانه‌ها در صورت بروز اشکال، در صورتی که کیفیت عملکرد کلی سامانه کاهش یابد، میزان این کاهش متناسب با میزان بزرگی شدت اشکال است، در حالی که در طراحی‌های ساده‌تر، این اشکال‌ها می‌توانند به‌طور کلی موجب از کار افتادن سامانه شوند. توجه به موضوع تحمل پذیری اشکال بعد از پیدایش سامانه‌های همیشه روشن و ایمن بحران اهمیت ویژه‌ای یافت. از ویژگی ادامهٔ کارکرد سامانه‌ها با وجود کارکرد ناصحیح بعضی از بخش‌های آن ها، تحت عنوان شکست امن یاد می‌شود.[2]

دلایل

دلایل نیاز به تحمل خطا[3]

  1. اتکا پذیری: کارکرد بلادرنگ سیستم بدون هیچ وقفه‌ای
  2. دسترسی: دسترسی به اطلاعات در هر زمان
  3. امنیت: جلوگیری از دسترسی‌های غیرمجاز

دلایل به وجود آمدن خطا

  1. خطاهای نرم‌افزاری یا سخت‌افزاری
  2. دسترسی غیرمجاز

طراحی مقاوم در برابر خطا

طراحی مقاوم در برابر خطا به طراحی ای گفته می‌شود که به سامانه این امکان را می‌دهد در مواجه با خطا در بعضی از بخش هایش، کارکرد خود را در همان سطح یا در سطحی پایین‌تر ادامه دهد و از کار افتادن کلی سامانه جلوگیری کند.[4] این طراحی در بحث‌های مربوط به معماری رایانه به‌طور معمول به این برمیگردد که در صورت کاهش عملکرد رایانه، با کاهش توان عملیاتی یا افزایش زمان پاسخ دهی به کار خود ادامه دهد. این طراحی در هر دو حوزهٔ سخت‌افزار و نرم‌افزار وجود دارد.

روش‌های تحمل‌پذیری اشکال

به‌طور عمومی تحمل اشکال می‌تواند با دو روش عمومی حاصل شود:

خود تثبیت

در این روش طراحان شرایطی را که ممکن است سامانه دچار خطا شود را تشخیص می‌دهند و سامانه را به گونه‌ای طراحی می‌کنند که از پس این شرایط بتواند برآید. در نهایت هدف اصلی طراحان در این روش رسیدن به یک سامانهٔ خود تثبیت است تا هیچوقت دچار خطا نشود.

معایب: مشکلات اصلی این روش وقتی است که سلسله‌ای از خطاهای حیاتی در سامانه رخ دهد یا هزینهٔ سامانه با ضریب اطمینان بالا خیلی زیاد شود.

نسخه برداری

در این روش سامانه به صورتی طراحی می‌شود که در صورت بروز هر گونه خطای حیاتی بتواند به حالت ایمن قبلی بازگردد. راهبرد این روش به این گونه است که از حالت قبلی خود نسخهٔ دخیره دارد و در صورت لزوم می‌تواند آن را بازیابی کند. این روش معایب کمتری نسبت به روش خودتثبیت دارد.

روش‌های تحمل‌پذیری اشکال در نرم‌افزار

درخت رویکرد نرم‌افزار در رابطه با تحمل‌پذیری اشکال.

روش‌های تحمل اشکال در حوزهٔ نرم‌افزار به سه دستهٔ کلی تقسیم می‌شود:[5]

  • جلوگیری یا اجتناب از خطا
  • حذف خطا
  • پیش‌بینی خطا
  • تحمل اشکال

جلوگیری یا اجتناب از خطا

این روش رویکردی شبه خودتثبیت دارد و نرم‌افزاری بدون خطا طراحی می‌شود.

حذف خطا

این رویکرد به این صورت است که بعد از طراحی نرم‌افزار، آزمون‌های زیادی بر روی آن انجام می‌شود تا نرم‌افزار نهایی بدون هرگونه خطا شود.

پیش بینی خطا

پیش‌بینی خطاهای احتمالی در نرم‌افزار و شرایط رخدادشان و خطرهای احتمالی ناشی از آن‌ها.

تحمل خطا

در این روش طراحان با این تفکر که خطا وجود دارد سامانه را به گونه‌ای که بتواند در این شرایط هم عملکرد صحیح داشته باشد، طراحی می‌کنند.

رویکرد تحمل‌پذیری اشکال

در زمان رخداد خطا دو راه حل وجود دارد:[6]

  • درمان خطا: تلاش می‌کند که از بروز خطاها ی بعدی جلو گیری کند و قبل از خرابکاری و رسیدن به شرایط بحرانی، به اتمام برسد.
  • پردازش خطا: در این رویکرد سامانه دو راه دارد، یا به دنبال پاک کردن خطا است که بازیابی خطا نام دارد یا با استفاده از نسخه برداری این کار را انجام می‌دهد که جبران خطا نام دارد.

روش‌های تحمل‌پذیری اشکال در دیسک‌ها

RAID 1 نسخه ی دوم از هر داده را بر روی دیسک کمکی ذخیره می کند.

اصلی‌ترین روش در این حوزه به کارگیری آرایه چندگانه دیسک‌های مستقل (به انگلیسی:redundant array of independent disks) یا RAID است.

از اصلی‌ترین اهداف این فناوری:

  1. افزایش توان کارکرد از راه تکنیکی به نامdata striping(خواندن و نوشتن داده‌ها بر روی چند دیسک به صورت موازی)
  2. افزایش توان تحمل در برابر اشکال (fault-tolerance) از راه نسخه برداری و تصحیح گرهای داده‌ها (Error correcting).

منابع

  1. «سامانهٔ عیب‌تاب» [رایانه و فنّاوری اطلاعات] هم‌ارزِ «fault-tolerant system»؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر پنجم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۹۶۴-۷۵۳۱-۷۶-۴ (ذیل سرواژهٔ سامانهٔ عیب‌تاب)
  2. Oscar González (1997, University of Massachusetts - Amherst). «Adaptive Fault Tolerance and Graceful Degradation». تاریخ وارد شده در |تاریخ= را بررسی کنید (کمک)
  3. Sumit jain (jul 2, 2014). «Fault tolerance in distributed systems». تاریخ وارد شده در |تاریخ= را بررسی کنید (کمک)
  4. "Johnson, B. W. "Fault-Tolerant Microprocessor-Based Systems"". IEEE Micro, vol. 4, no. 6, pp. 6–21. 1984.
  5. «Laura L. Pullum "Software Fault Tolerance Techniques and "Implementation». Artech House. ۲۰۰۱.
  6. «Techniques for Fault Tolerance in Software». بایگانی‌شده از اصلی در ۸ مه ۲۰۱۷. دریافت‌شده در ۲۰۱۷-۰۴-۲۵.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.