Chameleon A Resource Scheduler in A Data Grid Environment[taliem.ir]

Chameleon: A Resource Scheduler in A Data Grid Environment

ABSTRACT

Grid computing is moving into two ways. The Computational Grid focuses on reducing execution time of applications that require a great  number of computer processing cycles. The Data Grid provides the way to solve large scale data management problems. Data intensive  applications such as High Energy Physics and Bioinformatics require both Computational and Data Grid features. Job scheduling in Grid has been mostly discussed from the perspective of computational Grid. However, scheduling on Data Grid is just a recent focus of Grid computing activities. In Data Grid environment, effective scheduling mechanism considering both computational and data storage resources must be provided for large scale data intensive applications. In this paper, we describe new scheduling model that considers both amount of   computational resources and data availability in Data Grid environment. We implemented a scheduler, called Chameleon, based on the  proposed application scheduling model. Chameleon shows performance  improvements in data intensive applications that require both large number of processors and data replication mechanisms. The results achieved from Chameleon are presented .

INTRODUCTION

A Grid is large scale resource sharing and problem solving mechanism in virtual organizations . We can consider Grid service as two parts, Computational and Data Grids. A large number of computers are linked globally to form a computational Grid . A transparent access to  Computational Grid is provided so that users can achieve better performance, especially in terms of speed and throughput. A Data Grid  provides two basic services, a secure, reliable, and efficient data transport protocol and replica management. In high energy physics,  bioinformatics, and earth observation applications, we encounter huge amounts of data. By its nature, we can achieve better performance (access time) by replicating data in geographically distributed data stores. Computationally intensive data . We can achieve performance improvement by using Computational Grid that provides large number of processors and Data Grid that provides efficient data transport protocol and data replication mechanisms. In such environments, effective resource scheduling is a challenging research issue. analysis is also required.

چکیده

محاسبات گرید به دو روش حرکت می کند. شبکه محاسباتی بر کاهش زمان اجرای برنامه های کاربردی که نیاز به تعداد زیادی چرخه پردازش کامپیوتر دارد تمرکز دارد. شبکه داده راه حل برای حل مشکلات مدیریت داده در مقیاس بزرگ را فراهم می کند. برنامه های کاربردی پر کاربرد مانند فیزیک انرژی بالا و بیوانفورماتیک نیاز به ویژگی های محاسباتی و داده ای دارند. برنامه ریزی شغلی در Grid بیشتر از منظر Grid محاسباتی مورد بحث قرار گرفته است. با این حال، برنامه ریزی در شبکه داده تنها تمرکز اخیر در فعالیت های محاسبات گرید است. در محيط Data Grid، مکانيزم برنامه ريزي موثر با توجه به منابع محاسباتي و ذخيره اطلاعاتي بايد براي برنامه هاي کاربردي پرقدرت داده اي ارائه شود. در این مقاله، ما مدل برنامه ریزی جدیدی را معرفی می کنیم که هر دو مقدار منابع محاسباتی و دسترسی به داده ها را در محدوده Data Grid در نظر می گیرند. ما برنامه زمانبندی را به نام Chameleon اجرا کردیم که براساس مدل پیشنهادی برنامه کاربردی ارائه شده است. Chameleon بهبود عملکرد در برنامه های کاربردی پر سرعت را نشان می دهد که نیاز به تعداد زیادی پردازنده و مکانیسم های تکرار داده است. نتایج حاصل از Chameleon ارائه شده است.

مقدمه

شبکه یک شبکه گسترده در مقیاس منابع و مکانیزم حل مسائل در سازمان های مجازی است. ما می توانیم خدمات شبکه را به عنوان دو قسمت، شبکه های محاسباتی و داده ها در نظر بگیریم. تعداد زیادی از رایانه ها در سراسر جهان برای ایجاد Grid محاسباتی مرتبط هستند. دسترسی شفاف به شبکه محاسباتی ارائه شده است به طوری که کاربران می توانند عملکرد بهتر، به خصوص از نظر سرعت و توانایی، به دست آورند. یک Grid Data دو سرویس اساسی، یک پروتکل حمل و نقل امن، قابل اعتماد و کارآمد فراهم می کند و مدیریت ماکت را فراهم می کند. در فیزیک انرژی بالا، بیوانفورماتیک، و برنامه های مشاهده زمین، ما مقدار زیادی از داده ها روبرو هستیم. با طبیعت ما می توانیم عملکرد بهتر (زمان دسترسی) را با تکرار داده ها در فروشگاه های داده توزیع جغرافیایی به دست آوریم. داده های فشرده محاسباتی. ما می توانیم با استفاده از شبکه محاسباتی که تعداد زیادی از پردازنده ها و شبکه داده ها را فراهم می کند که پروتکل انتقال داده ها و مکانیسم های تکرار داده را فراهم می کند، بهبود عملکرد را به دست آوریم. در چنین شرایطی، برنامه ریزی منابع موثر مسئله تحقیق چالش برانگیز است. تجزیه و تحلیل نیز مورد نیاز است.

Year: 2008

Publisher : IEEE

By : Sang-Min Park,  Jai-Hoon Kim

File Information: English Language/ 8 Page / size: 201 KB

Download

سال : 1387

ناشر : IEEE

کاری از : سان پارک مین، جی هون کیم

اطلاعات فایل : زبان انگلیسی / 8 صفحه / حجم : KB 201

لینک دانلود

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگو شرکت کنید؟
نظری بدهید!

دیدگاهتان را بنویسید