يندرج البحث في مجال التسامح مع الأعطال في البيئات التفرعية الواسعة مثل
الحوسبة الشبكية (grid) و عناقيد الحواسيب (cluster) بهدف إيجاد أفضل الطرق
للتعامل مع الأخطاء المتعقلة بتعطل أحد الأجهزة الموجودة في البيئة أو الناتجة عن
انقطاع شبكة الاتصال و
ذلك لضمان استمرارية عمل التطبيقات المتوازية المنفذة ضمن هذه
البيئة في ظل وجود الأعطال.
قمنا في البحث بدراسة لنموذج البيئة التفرعية المعتمد و التطبيقات المتوازية المنفذة ضمنه،
ثم قدمنا آلية تخزين / استرجاع تمكننا من ضمان استمرارية التطبيق في حال ظهور أي
عطل باستخدام التمثيل المجرد لحالة التطبيق على المعالجات و المتمثل بمخطط تدفق
البيانات (macro dataflow) للتطبيقات التي تستخدم خوارزمية سرقة العمل ( work
stealing ) لتوزيع المهام بين المعالجات و تُنفذ في بيئات تفرعية واسعة غير متجانسة
و ديناميكية، و ذلك بكلفة بسيطة مضافة لكلفة التنفيذ المتوازي نتيجة حفظ جزء من العمل
خلال التنفيذ الطبيعي (fault-free execution) فضلاً عن ذلك تم تقديم نموذج
رياضي لحساب التعقيد الزمني (الكلفة) لهذه الآلية المقترحة .
سنقدم في هذا البحث استراتيجية ذاتية التكيف تمكننا من كتابة خوارزمية متوازية تتكيف
مع عدد الموارد المتوفرة على البيئة التفرعية المخصصة لتنفيذ البرنامج المتوازي. إن
التطبيقات المتوازية المدروسة و المعنية بالبحث هي تطبيقات ممثلة بمخطط تدفق البيانات
ا
لمبني ديناميكياً خلال التنفيذ. تقوم الطريقة المقترحة هنا على المزاوجة بين خوارزمية
تسلسلية و أخرى متوازية معتمدين على مبدأ سرقة العمل في جدولة المهام. و نقدم دراسة
لتعقيد هذه الخوارزمية المتكيفة و تحليل لأدائها على معالج و مقارنته مع خوارزمية
تفرعية تقليدية.