NoSQL Systems for Big Data Management[taliem.ir]

NoSQL Systems for Big Data Management

ABSTRACT

The advent of Big Data created a need for out-of-the-box horizontal scalability for data management systems. This ushered in an array of  choices for Big Data management under the umbrella term NoSQL. In this paper, we provide a taxonomy and unified perspective on NoSQL systems. Using this perspective, we compare and contrast various NoSQL systems using multiple facets including system architecture, data model, query language,  client API, scalability, and availability. We group current NoSQL systems into seven broad categories: Key-Value,Table-type/Column, Document, Graph, Native XML, Native Object, and Hybrid databases. We also describe application scenarios for each category to help the reader in choosing an appropriate NoSQL system for a given application. We conclude the paper by indicating future research directions.

INTRODUCTION

Until recently, relational database management systems (RDBMS) were the mainstay for managing all types of data irrespective of their  naturally fit to the relational data model. The emergence of Big Data and mobile computing necessitated new database functionality to support applications such as real-time logfile analysis, cross-selling in eCommerce, location based services, and micro-blogging. Many of these applications exhibit a preponderance of insert and retrieve operations on a very large scale. Relational databases were found to be inadequate in handling the scale and varied structure of data. The above requirements ushered in an array of choices for Big Data management under the umbrella term NoSQL . NoSQL (meaning ‘not only SQL’) has come to describe a large class of databases which do not have properties of  traditional relational databases and are generally not queried with SQL (structured query language). NoSQL systems provide data partitioning and replication as built-in features. They typically run on cluster computers made from commodity hardware and provide horizontal scalability.Developing applications using NoSQL systems is quite different from the process used with RDBMS . NoSQL databases require developer-centric approach from the application inception to completion. For example, data modeling is done by the application architector developer, whereas in RDBMS based applications, data architects and data modelers complete the data modeling tasks. They begin by constructing conceptual and logical data models.

چکیده

ظهور داده های بزرگ نیاز به مقیاس پذیری افقی خارج از جعبه برای سیستم های مدیریت داده ایجاد کرد. این در مجموعه ای از گزینه های برای مدیریت داده های بزرگ در زیر اصطلاح NoSQL معرفی شده است. در این مقاله، ما یک طبقه بندی و دیدگاه یکپارچه در سیستم های NoSQL ارائه می دهیم. با استفاده از این دیدگاه، ما سیستم های NoSQL مختلفی را با استفاده از چندین جنبه از جمله معماری سیستم، مدل داده، زبان پرس و جو، API سرویس گیرنده، مقیاس پذیری و قابلیت دسترسی مقایسه می کنیم. ما سیستم های NoSQL فعلی را به 7 مجموعه گسترده ای تقسیم می کنیم: Key-Value، Table-Type / Column، Document، Graph، XML Bative، Object Native، and Hybrid Databases. ما همچنین سناریوهای کاربردی را برای هر دسته توصیف می کنیم تا به خواننده در انتخاب سیستم مناسب NoSQL برای یک برنامه کاربردی داده شود. مقاله را با نشان دادن مسیرهای تحقیقاتی آینده نتیجه می گیریم.

مقدمه

تا همین اواخر، سیستم های مدیریت پایگاه داده ارتباطی (RDBMS) اصلی برای مدیریت انواع داده ها بود، صرف نظر از اینکه آنها به طور طبیعی به مدل داده های رابطه ای مرتبط بودند. ظهور داده های بزرگ و رایانه های کامپیوتری نیازمند قابلیت پایگاه داده جدید برای پشتیبانی از برنامه های کاربردی مانند تجزیه و تحلیل منطقی در زمان واقعی، فروش متقابل در تجارت الکترونیک، خدمات مبتنی بر مکان، و میکرو وبلاگ نویسی است. بسیاری از این برنامه ها دارای غلبه بر عملیات درج و بازیابی در مقیاس بسیار بزرگ هستند. در ارتباط با مقیاس و ساختار متنوع داده ها، پایگاه های ارتباطی به اندازه کافی ناکافی بودند. الزامات فوق در مجموعه ای از گزینه ها برای مدیریت داده های بزرگ در زیر اصطلاح NoSQL ارائه شده است. NoSQL (به معنی نه تنها SQL) برای توصیف یک کلاس بزرگ از پایگاه های داده ای است که دارای خواص پایگاه های داده های روابط سنتی نیستند و معمولا با SQL query (زبان پرس و جو ساختار یافته) مورد سوال قرار نمی گیرند. سیستم های NoSQL پارتیشن بندی و تکرار داده ها را به عنوان ویژگی های داخلی ارائه می دهند. آنها به طور معمول در کامپیوترهای خوشه ای ساخته شده از سخت افزار کالا اجرا می شوند و مقیاس پذیری افقی را فراهم می کنند. برنامه های توسعه با استفاده از سیستم های NoSQL کاملا متفاوت از فرآیند مورد استفاده با RDBMS هستند. پایگاه داده های NoSQL نیاز به رویکرد توسعه محور از زمان شروع برنامه تا اتمام دارد. به عنوان مثال، مدل سازی داده ها توسط توسعه دهنده نرم افزار معماری انجام می شود، در حالی که در برنامه های مبتنی بر RDBMS، معماران داده ها و مدل سازان داده، وظایف مدل سازی داده را تکمیل می کنند. آنها با ساخت مدل های داده های مفهومی و منطقی شروع می شوند.

Year: 2014

Publisher : IEEE

By :  Venkat N Gudivada, Dhana Rao, Vijay V. Raghavan

File Information: English Language/ 8 Page / size: 163 KB

Download

سال : 1393

ناشر : IEEE

کاری از : Venkat N Gudivada, Dhana Rao, Vijay V. Raghavan

اطلاعات فایل : زبان انگلیسی / 8 صفحه / حجم : KB 163

 

لینک دانلود

 

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگو شرکت کنید؟
نظری بدهید!

دیدگاهتان را بنویسید