يندرج البحث في مجال التسامح مع الأعطال في البيئات التفرعية الواسعة مثل
الحوسبة الشبكية (grid) و عناقيد الحواسيب (cluster) بهدف إيجاد أفضل الطرق
للتعامل مع الأخطاء المتعقلة بتعطل أحد الأجهزة الموجودة في البيئة أو الناتجة عن
انقطاع شبكة الاتصال و
ذلك لضمان استمرارية عمل التطبيقات المتوازية المنفذة ضمن هذه
البيئة في ظل وجود الأعطال.
قمنا في البحث بدراسة لنموذج البيئة التفرعية المعتمد و التطبيقات المتوازية المنفذة ضمنه،
ثم قدمنا آلية تخزين / استرجاع تمكننا من ضمان استمرارية التطبيق في حال ظهور أي
عطل باستخدام التمثيل المجرد لحالة التطبيق على المعالجات و المتمثل بمخطط تدفق
البيانات (macro dataflow) للتطبيقات التي تستخدم خوارزمية سرقة العمل ( work
stealing ) لتوزيع المهام بين المعالجات و تُنفذ في بيئات تفرعية واسعة غير متجانسة
و ديناميكية، و ذلك بكلفة بسيطة مضافة لكلفة التنفيذ المتوازي نتيجة حفظ جزء من العمل
خلال التنفيذ الطبيعي (fault-free execution) فضلاً عن ذلك تم تقديم نموذج
رياضي لحساب التعقيد الزمني (الكلفة) لهذه الآلية المقترحة .
نقدم في هذا البحث دراسة حول الكلفة الزمنية المضافة إلى بيئة الحوسبة الشبكية نتيجة
استخدام آلية تخزين / استرجاع متناسقة للتسامح مع الأعطال في هذه البيئة، لنصل من
خلال هذه الدراسة إلى نموذج رياضي يحدد لنا الوقت الأنسب لحفظ نقاط التخزين
للتطبيق بهدف
تحقيق أقل زمن لانتهاء تنفيذ التطبيق المتوازي، و كان ذلك عن طريق
نمذجة تسلسلية باستخدام المعادلات التفاضلية لكل من الأعطال المدروسة و بيئة التنفيذ
و أخيرا آلية التسامح مع الأعطال المختارة.