توضیحات
ABSTRACT
As fault tolerance is the ability of a system to perform its function correctly even in the presence of faults. Therefore, different fault tolerance techniques (FTTs) are critical for improving the efficient utilization of expensive resources in high performance grid computing systems, and an important component of grid workflow management system. This paper presents a performance evaluation of most commonly used FTTs in grid computing system. In this study, we considered different system centric parameters, such as throughput, turnaround time, waiting time and network delay for the evaluation of these FTTs. For comprehensive evaluation we setup various conditions in which we vary the average percentage of faults in a system, along with different workloads in order to find out the behavior of FTTs under these conditions. The empirical evaluation shows that the workflow level alternative task techniques have performance priority on task level checkpointing techniques. This comparative study will help to grid computing researchers in order to understand the behavior and performance of different FTTs in detail.
INTRODUCTION
Grid computing enables it users to use Grid for large-scale compute and data intensive applications, in science, engineering and commerce . Such applications include, molecular modeling for drug design, brain activity analysis , high energy physics, protein modeling, ray tracing and weather forecasting, etc. Grid computing enables these compute intensive applications to integrate large scale, geographically distributed and heterogeneous resources in different administrative domains with different resource usage and security policies in order to compute their jobs. Fault tolerance or graceful degradation is the property of distributed computing system which distinguishes it from sequential computing. This property enables distributed computation to carry on it computation even on individual component’s failure without terminating the entire computation . Due to the diverse nature of grid and large scale applications on grid, fault tolerance becomes a challenge on developing, deploying and running applications on the grid environment . Thus, the inclusion of fault tolerance related features in grid computing system is not a supplementary optional feature rather a prerequisite. Due to scale of complexity and heterogeneous nature of grid as compared to traditional computing systems, existing fault tolerance techniques of traditional systems are not enough to manage the faults in grid computing. Therefore, we require additional fault tolerance technique that could work well in complex and heterogeneous nature of grid.
چکیده
به عنوان تحمل خطا، توانایی یک سیستم برای انجام درست عملکرد آن است حتی در حضور گسل. بنابراین، تکنیک های تحمل گسل (FTTs) برای بهبود بهره وری کارآمد منابع گران قیمت در سیستم های محاسباتی شبکه با کارایی بالا و بخش مهمی از سیستم مدیریت گردش کار شبکه ضروری است. این مقاله ارزیابی عملکرد از FTT های اغلب استفاده شده در سیستم محاسبات شبکه را ارائه می دهد. در این مطالعه، پارامترهای سیستم محوری مختلفی نظیر بازده، زمان چرخش، زمان انتظار و تاخیر شبکه برای ارزیابی این FTT ها مورد بررسی قرار گرفت. برای ارزیابی جامع ما شرایط مختلفی را ایجاد می کنیم که در آن درصد درصد متوسط گسل ها در یک سیستم را با بارهای مختلف کاری تغییر می دهیم تا رفتار FTT ها را در این شرایط مشخص کنیم. ارزیابی تجربی نشان می دهد که روش های کار جایگزین سطح کار، اولویت کارایی در تکنیک های بازپرداخت سطح کار است. این مطالعه مقایسه ای به محققان شبکه محاسباتی کمک می کند تا جزئیات رفتار و عملکرد FTT های مختلف را درک کنند.
مقدمه
محاسبات گرید آن را کاربران را قادر می سازد از Grid برای برنامه های کاربردی محاسبات و داده های سنگین در علوم، مهندسی و تجارت استفاده کنند. چنین برنامه هایی شامل مدل سازی مولکولی برای طراحی دارو، تجزیه و تحلیل فعالیت مغز، فیزیک انرژی بالا، مدل سازی پروتئین، ردیابی اشعه و پیش بینی آب و هوا و … می باشد. محاسبات گرید، این برنامه های کاربردی فشرده محاسباتی را قادر می سازد تا در مقیاس وسیع، منابع جغرافیایی توزیع شده و ناهمگن در حوزه های مختلف اداری با استفاده از منابع مختلف و سیاست های امنیتی برای محاسبه شغل خود. تحمل شکست و یا تضعیف ظریف، ویژگی سیستم توزیع محاسباتی است که آن را از محاسبات متوالی متمایز می کند. این ویژگی محاسبات توزیع را قادر می سازد تا محاسبات را حتی بدون شکستن کامپوننت کامپوننت بدون پایان تمام محاسبات انجام دهد. با توجه به ماهیت متنوع برنامه های شبکه و در مقیاس بزرگ در شبکه، تحمل گسل به یک چالش در توسعه، اعمال و اجرای برنامه ها در محیط شبکه تبدیل می شود. بنابراین، ورودی ویژگی های مرتبط با تحمل خطا در سیستم محاسبات شبکه یک ویژگی اختیاری تکمیلی نیست بلکه یک پیش شرط نیست. با توجه به مقیاس پیچیدگی و ماهیت ناهمگونی شبکه در مقایسه با سیستم های محاسبات سنتی، تکنیک های تحمل گسل های موجود در سیستم های سنتی برای مدیریت گسل های محاسبات شبکه کافی نیست. بنابراین، ما نیاز به تکنیک تحمل گسل بیشتر است که می تواند به خوبی در طبیعت پیچیده و ناهمگن شبکه.
Year: 2010
Publisher : ELSEVIER
By : Fiaz Gul Khan , Kalim Qureshi , Babar Nazir
File Information: English Language/ 12 Page / size: 1.74 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1389
ناشر : ELSEVIER
کاری از : فیاض گل خان، کلام قریشی، بابر ناصر
اطلاعات فایل : زبان انگلیسی / 12 صفحه / حجم : KB 1.74
نقد و بررسیها
هنوز بررسیای ثبت نشده است.