توضیحات
ABSTRACT
Grid computing is moving into two ways. The Computational Grid focuses on reducing execution time of applications that require a great number of computer processing cycles. The Data Grid provides the way to solve large scale data management problems. Data intensive applications such as High Energy Physics and Bioinformatics require both Computational and Data Grid features. Job scheduling in Grid has been mostly discussed from the perspective of computational Grid. However, scheduling on Data Grid is just a recent focus of Grid computing activities. In Data Grid environment, effective scheduling mechanism considering both computational and data storage resources must be provided for large scale data intensive applications. In this paper, we describe new scheduling model that considers both amount of computational resources and data availability in Data Grid environment. We implemented a scheduler, called Chameleon, based on the proposed application scheduling model. Chameleon shows performance improvements in data intensive applications that require both large number of processors and data replication mechanisms. The results achieved from Chameleon are presented .
INTRODUCTION
A Grid is large scale resource sharing and problem solving mechanism in virtual organizations . We can consider Grid service as two parts, Computational and Data Grids. A large number of computers are linked globally to form a computational Grid . A transparent access to Computational Grid is provided so that users can achieve better performance, especially in terms of speed and throughput. A Data Grid provides two basic services, a secure, reliable, and efficient data transport protocol and replica management. In high energy physics, bioinformatics, and earth observation applications, we encounter huge amounts of data. By its nature, we can achieve better performance (access time) by replicating data in geographically distributed data stores. Computationally intensive data . We can achieve performance improvement by using Computational Grid that provides large number of processors and Data Grid that provides efficient data transport protocol and data replication mechanisms. In such environments, effective resource scheduling is a challenging research issue. analysis is also required.
چکیده
محاسبات گرید به دو روش حرکت می کند. شبکه محاسباتی بر کاهش زمان اجرای برنامه های کاربردی که نیاز به تعداد زیادی چرخه پردازش کامپیوتر دارد تمرکز دارد. شبکه داده راه حل برای حل مشکلات مدیریت داده در مقیاس بزرگ را فراهم می کند. برنامه های کاربردی پر کاربرد مانند فیزیک انرژی بالا و بیوانفورماتیک نیاز به ویژگی های محاسباتی و داده ای دارند. برنامه ریزی شغلی در Grid بیشتر از منظر Grid محاسباتی مورد بحث قرار گرفته است. با این حال، برنامه ریزی در شبکه داده تنها تمرکز اخیر در فعالیت های محاسبات گرید است. در محيط Data Grid، مکانيزم برنامه ريزي موثر با توجه به منابع محاسباتي و ذخيره اطلاعاتي بايد براي برنامه هاي کاربردي پرقدرت داده اي ارائه شود. در این مقاله، ما مدل برنامه ریزی جدیدی را معرفی می کنیم که هر دو مقدار منابع محاسباتی و دسترسی به داده ها را در محدوده Data Grid در نظر می گیرند. ما برنامه زمانبندی را به نام Chameleon اجرا کردیم که براساس مدل پیشنهادی برنامه کاربردی ارائه شده است. Chameleon بهبود عملکرد در برنامه های کاربردی پر سرعت را نشان می دهد که نیاز به تعداد زیادی پردازنده و مکانیسم های تکرار داده است. نتایج حاصل از Chameleon ارائه شده است.
مقدمه
شبکه یک شبکه گسترده در مقیاس منابع و مکانیزم حل مسائل در سازمان های مجازی است. ما می توانیم خدمات شبکه را به عنوان دو قسمت، شبکه های محاسباتی و داده ها در نظر بگیریم. تعداد زیادی از رایانه ها در سراسر جهان برای ایجاد Grid محاسباتی مرتبط هستند. دسترسی شفاف به شبکه محاسباتی ارائه شده است به طوری که کاربران می توانند عملکرد بهتر، به خصوص از نظر سرعت و توانایی، به دست آورند. یک Grid Data دو سرویس اساسی، یک پروتکل حمل و نقل امن، قابل اعتماد و کارآمد فراهم می کند و مدیریت ماکت را فراهم می کند. در فیزیک انرژی بالا، بیوانفورماتیک، و برنامه های مشاهده زمین، ما مقدار زیادی از داده ها روبرو هستیم. با طبیعت ما می توانیم عملکرد بهتر (زمان دسترسی) را با تکرار داده ها در فروشگاه های داده توزیع جغرافیایی به دست آوریم. داده های فشرده محاسباتی. ما می توانیم با استفاده از شبکه محاسباتی که تعداد زیادی از پردازنده ها و شبکه داده ها را فراهم می کند که پروتکل انتقال داده ها و مکانیسم های تکرار داده را فراهم می کند، بهبود عملکرد را به دست آوریم. در چنین شرایطی، برنامه ریزی منابع موثر مسئله تحقیق چالش برانگیز است. تجزیه و تحلیل نیز مورد نیاز است.
Year: 2008
Publisher : IEEE
By : Sang-Min Park, Jai-Hoon Kim
File Information: English Language/ 8 Page / size: 201 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1387
ناشر : IEEE
کاری از : سان پارک مین، جی هون کیم
اطلاعات فایل : زبان انگلیسی / 8 صفحه / حجم : KB 201
نقد و بررسیها
هنوز بررسیای ثبت نشده است.