توضیحات
ABSTRACT
The era of column-oriented database systems has truly begun with open source database systems like C-Store, MonetDb, LucidDb and commercial ones like Vertica. Column-oriented database stores data column-by-column which means it stores information of single attributecollectively. The need for Column-oriented database arose from the need of business intelligence for efficient decision making where traditional row-oriented database gives poor performance. PostgreSql is an open source row-oriented and most widely used relational database management system which does not have facility for storing data in column-oriented fashion. In our work we propose the best method for implementing column-store on top of rowstore in PostgreSql along with successful design and implementation of the same
INTRODUCTION
Traditional Row-store DBMS stores data tuple by tuple i.e. all attribute values of an entity will be stored together rather sequentially one after the other. Hence, row-store should be used where information is required from DBMS on a granularity of an entity. But if we are required to access only some of the attributes of a relation then using row-store degrades the performance of these queries . Whenever data is read in row-store, irrelevant attributes will also be accessed due to their fundamental structure of storing an entire entity together. But column-store can access only the required attribute/attributes effortlessly since they store information of an attribute separately thus increasing read query performance. Due to this fundamental difference between these two type of databases, inserting, deleting, updating rows is optimized in row-stores i.e. modifying a tuple becomes easy since attribute values of a tuple are stored contiguously and selecting data is optimized in column-stores i.e. reading only required data becomes easy. Hence, row-stores are called write-optimized where as column-stores are called read optimized. Using row-store or column-store for any application thus depends on the nature of type of query workloads. For usual business processing, row-stores are best considering their performance. But when it comes to analytical applications, column-stores prove to be the best. Business organizations have to handle large amount of data and extract meaningful information from that data for efficient decision making which is commonly termed as Business Intelligence.
چکیده
عصر سیستم های پایگاه داده ستون ها واقعا با سیستم های پایگاه داده منبع باز مانند C-Store، MonetDb، LucidDb و تجاری مانند Vertica آغاز شده است. پایگاه داده ستون گرا اطلاعات ستون ستون را ذخیره می کند که بدین معنی است که اطلاعات مربوط به ویژگی های تک به صورت جمع آوری شده را ذخیره می کند. نیاز به پایگاه داده ستون گرا از نیاز به اطلاعات کسب و کار برای تصمیم گیری کارآمد ناشی می شود که در آن پایگاه داده های سنتی ردیف عملکرد عملکرد ضعیفی دارند. PostgreSQL یک منبع باز با ریشه و به طور گسترده استفاده شده است که سیستم مدیریت پایگاه داده رابطه ای است که امکان ذخیره داده ها را در حالت ستون گرا ندارد. در کار ما پیشنهاد بهترین روش برای اجرای ستون فروشگاه در بالای ردیف در PostgreSql همراه با طراحی و پیاده سازی موفق از همان.
مقدمه
DBMS روتوی سنتی فروشگاه داده ها را به ترتیب مرتب می کند، بدین ترتیب تمام مقادیر attribute از یک نهاد با هم ذخیره می شوند و به ترتیب یک پس از دیگری ذخیره می شوند. بنابراین، فروشگاه ردیف باید مورد استفاده قرار گیرد در جایی که اطلاعات از DBMS بر روی دانه بودن یک نهاد مورد نیاز است. اما اگر ما نیاز به دسترسی به برخی از ویژگی های یک رابطه داشته باشیم، پس از استفاده از store-row عملکرد این نمایش ها را تضعیف می کند. هر بار که داده ها در فروشگاه ردیف خوانده می شوند، ویژگی های نامناسب نیز به دلیل ساختار بنیادین آنها برای ذخیره سازی یک نهاد کل قابل دسترسی است. اما ستون فروشگاه تنها می تواند به آسانی به ویژگی / ویژگی های مورد نیاز دسترسی پیدا کند، زیرا اطلاعات یک ویژگی را به طور جداگانه ذخیره می کند، در نتیجه عملکرد خواندن خواندن خواندن را افزایش می دهد. با توجه به این تفاوت اساسی بین این دو نوع پایگاه داده ها، درج، حذف و به روز رسانی ردیف ها در فروشگاه های ردیف بهینه سازی شده است، به عنوان مثال اصلاح یک دوره زمانی آسان می شود از آنجا که مقادیر یکپارچگی یکپارچه ذخیره می شوند و انتخاب داده ها در ستون ها ذخیره می شود یعنی خواندن فقط اطلاعات مورد نیاز آسان می شود. از این رو، فروشگاه های سطر به نام نوشتن بهینه سازی می شوند، در حالی که به عنوان ستون های ذخیره شده به عنوان خوانده شده بهینه سازی می شوند. بنابراین استفاده از فروشگاه ردیف یا ستون برای هر برنامه بستگی به ماهیت نوع کارهای پرس و جو دارد. برای پردازش کسب و کار معمول، فروشگاههای ردیف بهترین عملکرد آنها را در نظر می گیرند. اما وقتی که به برنامه های کاربردی تحلیلی می آید، ستون های فروشگاه بهترین هستند. سازمان های تجاری باید حجم زیادی از داده ها را در اختیار بگیرند و اطلاعات مهم را از آن داده ها برای تصمیم گیری کارآمد استخراج کنند که معمولا به عنوان “اطلاعات کسب و کار” نامیده می شود.
Year: 2012
Publisher : International Conference of Advanced Computer Science & Information Technology
By : Aditi D. Andurkar
File Information: English Language/ 16 Page / size: 833 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1391
ناشر : کنفرانس بین المللی علوم کامپیوتر و فناوری اطلاعات پیشرفته
کاری از : آدیتی اندورکار
اطلاعات فایل : زبان انگلیسی / 16 صفحه / حجم : KB 833
نقد و بررسیها
هنوز بررسیای ثبت نشده است.