نوشته‌ها

Big.Data-Enabled.Nursing.Education.[taliem.ir]

Big Data-Enabled Nursing

ABSTRACT

  Attention on “big data” spans nursing and the health sciences, and extends as well to engineering/computer sciences through to the liberal arts in professional literature. A current Google search (3 Nov 2016) of “big  data” yields 288 million entries. A focused search of “big data and nursing” yields more than 3.9 million  entries. Thus we ask, “Why big data? Why nursing?” The focus of this chapter is to provide an overview of why big data has emerged now and to make the case for how big data has the capacity to change health, healthcare systems, and nursing. This chapter lays a foundation for the chapters and case studies to follow that explore what data, knowledge, and transformation processes are needed to put information and knowledge into the hands of nursing wherever nurses are working. In this chapter we examine the big data sources within and beyond nursing and healthcare that can be collected and analyzed to improve nursing and patient, family and community health. This chapter entices the reader to examine “Why big data now?” and “Why big data in the future?” This chapter is meant to stir curiosity for “Why should I be  knowledgeable?” Whether the reader’s role is in clinical practice, education, research, industry, or policy, the applied uses of big data analytics are empowering change at an exponential speed across all domains. Big data has the capacity to illuminate nursing’s discovery of new knowledge and best practices that are safe, effective and lead to improved outcomes including well-being of providers; it also can expand nursing’s vision and future possibilities through increasing awareness of what nursing doesn’t know. The importance of  nursing’s lens on the new discoveries obtained through big data and data science is critical to the  transformation of health and healthcare systems. This transformation completes the challenge of placing the person at the center of all care initiatives and actions.

INTRODUCTION

Big data has been described as a revolution. Mayer-Schönberger and Cukier (2013) defne big data as the new raw material for discovery and innovation. As such, big data is one of the hottest trends in technology and is predicted to have a dramatic impact on the economy, science, and society at large. The authors cite the powerful example of Google’s prediction of the spread of the winter flu (H1N1) in the United States. Analytics demonstrated that a combination of 45 search terms (from the 50 million search terms), processed by a mathematical model, resulted in a strong correlation between the Google prediction and the U.S.  Centers for Disease Control and Prevention’s (CDC) fgures nationwide.

چکیده

توجه به “داده های بزرگ” شامل مراقبت های پرستاری و علوم بهداشتی است و همچنین به علوم مهندسی / کامپیوتر به وسیله هنرهای لیبرال در ادبیات حرفه ای گسترش می یابد. جستجوی جاری گوگل (۲۰۱۶ نوامبر ۳) از “داده های بزرگ”، ۲۸۸ میلیون اثر را به دست می آورد. جستجوی متمرکز “داده های بزرگ و پرستاری” بیش از ۳٫۹ میلیون اثر را انجام می دهد. بنابراین ما می خواهیم، ​​”چرا داده های بزرگ؟ چرا مراقبت از پرستار؟ “تمرکز این فصل این است که ارائه یک دید کلی از این که داده های بزرگ در حال حاضر ظهور کرده اند و برای اینکه چگونه داده های بزرگ ظرفیت تغییر سلامت، سیستم های مراقبت های بهداشتی و پرستاری را نشان می دهد. این فصل پایه ای برای فصل ها و مطالعات موردی است که به دنبال آن است که کشف کند که چه اطلاعات، دانش و فرآیندهای تحول نیاز به قرار دادن اطلاعات و دانش در دست پرستاری وجود دارد، در هر زمان پرستاران کار می کنند. در این فصل، منابع اطلاعاتی بزرگ در داخل و خارج از پرستاری و مراقبت های بهداشتی مورد بررسی قرار می گیرد که می تواند برای بهبود پرستاری و سلامت بیماران، خانواده و جامعه، جمع آوری و تحلیل شود. این فصل خواننده را به بررسی “چرا داده های بزرگ در حال حاضر؟” و “چرا داده های بزرگ در آینده است؟” این فصل به محرک کنجکاوی برای “چرا من باید دانش؟” آیا خواننده نقش در عمل بالینی، آموزش و پرورش ، تحقیق، صنعت و یا سیاست، استفاده های کاربردی از تجزیه و تحلیل داده های بزرگ، توانایی تغییر در سرعت نمایش در تمام دامنه ها است. داده های بزرگ توانایی تشخیص کشف دانش جدید و بهترین روش های پرستاری را دارند که ایمن، موثر و منجر به نتایج بهتر از جمله رضایت دهندگان خدمات می شود. همچنین می تواند چشم انداز پرستاری و فرصت های آینده را از طریق افزایش آگاهی از آنچه پرستار نمی داند، گسترش دهد. اهمیت لنز پرستاری بر اکتشافات جدید که از طریق داده ها و داده های بزرگ به دست آمده است، برای تغییر سیستم های بهداشت و سلامت بسیار مهم است. این تحول، چالش قرار دادن فرد در مرکز همه ابتکارات و اقدامات مراقبت را کامل میکند.

مقدمه

داده های بزرگ به عنوان یک انقلاب توصیف شده است. Mayer-Schönberger و Cukier (2013) داده های بزرگ را به عنوان مواد خام جدید برای کشف و نوآوری محسوب می کنند. به همین ترتیب، داده های بزرگ یکی از داغ ترین روند تکنولوژی هستند و پیش بینی می شود تا تاثیر قابل توجهی بر اقتصاد، علم و جامعه داشته باشد. نویسندگان مثال قدرتمند از پیش بینی گوگل در مورد گسترش فصل زمستان (H1N1) در ایالات متحده را ذکر می کنند. تجزیه و تحلیل نشان داد که ترکیبی از ۴۵ عبارت جستجو (از ۵۰ میلیون کلمه جستجو)، که توسط یک مدل ریاضی پردازش شده است، منجر به همبستگی قوی بین پیش بینی Google و مراکز کنترل بیماری و پیشگیری (CDC) ایالات متحده در سراسر کشور شد.

Year: ۲۰۱۶

Publisher: SPRINGER

By :  Connie W. Delaney, Charlotte A. Weaver ,Judith J. Warren , Thomas R. Clancy,Roy L. Simpson

File Information: English Language/ 504 Page / size: 4.09 MB

Download

سال : ۱۳۹۵

ناشر : SPRINGER

کاری از : کنی والت دلانی، شارلوت آویوور، جودیت وارن، توماس کلنسی، روی لوپ سیمپسون

اطلاعات فایل : زبان انگلیسی / ۵۰۴ صفحه / حجم : MB 4.09

لینک دانلود

Big Data[taliem.ir]

Big Data: The Management Revolution

ABSTRACT

There’s much wisdom in that saying, which has been attributed to both W. Edwards Deming and Peter Drucker, and it explains why the recent explosion of digital data is so important. Simply put, because of big data, managers can measure, and hence know, radically more about their businesses, and directly translate that knowledge into improved decision making and performance. Consider retailing. Booksellers in physical stores could always track which books sold and which did not. If they had a loyalty program, they could tie some of those purchases to individual customers. And that was about it. Once shopping moved online, though, the understanding of customers increased dramatically. Online retailers could track not only what customers bought, but also what else they looked at; how they navigated through the site; how much they were influenced by promotions, reviews, and page layouts; and similarities across individuals and groups. Before long, they developed algorithms to predict what books individual customers would like to read next—algorithms that performed better every time the customer responded to or ignored a recommendation. Traditional retailers simply couldn’t access this kind of information, let alone act on it in a timely manner. It’s no wonder that Amazon has put so many brick-and-mortar bookstores out of business.

INTRODUCTION

The familiarity of the Amazon story almost masks its power. We expect companies that were born digital to accomplish things that business executives could only dream of a generation ago. But in fact the use of big data has the potential to transform traditional businesses as well. It may offer them even greater  opportunities for competitive advantage (online businesses have always known that they were competing on how well they understood their data). As we’ll discuss in more detail, the big data of this revolution is far more powerful than  the analytics that were used in the past. We can measure and therefore manage more  precisely than ever before. We can make better predictions and smarter decisions. We can target more- effective interventions, and can do so in areas that so far have been dominated by gut and intuition rather than by data and rigor.

چکیده

در این گفتار، عقل بسیار زیادی وجود دارد که به W. Edwards Deming و Peter Drucker مربوط می شود و توضیح می دهد که چرا انفجار اطلاعات دیجیتال اخیر بسیار مهم است. به سادگی، به دلیل داده های بزرگ، مدیران می توانند اندازه گیری کنند و از این رو عمیق تر در مورد کسب و کار خود بفهمند و این دانش را به طور مستقیم به تصمیم گیری و عملکرد بهبود می بخشد. خرده فروشی را در نظر بگیرید. کتابفروشی ها در فروشگاه های فیزیکی همیشه می توانند کتاب هایی را که فروخته اند و نمی دانستند. اگر آنها یک برنامه وفاداری داشتند، می توانست برخی از این خرید ها را به مشتریان فرد متصل کند. و این در مورد آن بود. با این حال، هنگامی که خرید آنلاین شد، درک مشتریان به طور چشمگیری افزایش یافت. خرده فروشان آنلاین می توانند نه تنها مشتریان را خریداری کنند، بلکه همچنین آنچه را که آنها در نظر داشتند، می شناسند. چگونه آنها را از طریق سایت هدایت کردید چقدر از تبلیغات، بررسی ها و پوسته های صفحه استفاده می شود؛ و شباهت ها در میان افراد و گروه ها. پیش از این، آنها الگوریتمی را برای پیش بینی آنچه که مشتریان فردی مایل به خواندن الگوریتم های بعدی می کردند، انجام دادند که هر بار که مشتری به یک توصیه پاسخ داده یا نادیده گرفته، بهتر عمل کند. خرده فروشان سنتی به سادگی نمی توانند به این نوع اطلاعات دسترسی داشته باشند، بجز اینکه به موقع به آن عمل کنند. جای تعجب نیست که آمازون کتاب فروشی های آجر و ملات را از کار بیرون آورده است.

مقدمه

آشنایی با داستان آمازون تقریبا قدرت آن را مخفی می کند. ما انتظار داریم که شرکت هایی که دیجیتال متولد شده اند برای انجام کارهایی که مدیران اجرایی می توانند تنها یک نسل پیش از آن رویای خود را به انجام رسانند. اما در واقع استفاده از داده های بزرگ پتانسیل برای تبدیل کسب و کارهای سنتی را نیز دارد. ممکن است فرصت های بیشتری را برای مزیت رقابتی ارائه دهند (کسب و کارهای آنلاین همواره شناخته شده اند که رقابت می کنند که چگونه اطلاعات آنها را درک می کنند). همان طور که در مورد جزئیات بیشتر بحث خواهیم کرد، داده های بزرگ این انقلاب بسیار قدرتمند تر از تحلیل هایی است که در گذشته استفاده شده است. ما می توانیم اندازه گیری کنیم و بنابراین دقیق تر از هر زمان دیگری مدیریت کنیم. ما می توانیم پیش بینی های بهتر و تصمیمات دقیق تر انجام دهیم. ما می توانیم مداخلات مؤثرتری را هدف قرار دهیم، و می تواند در مناطقی که تا کنون توسط روده و شهود غلبه کرده اند، به جای داده ها و سختی ها، انجام شود.

Year: ۲۰۱۲

Publisher : ۰

By : Andrew McAfee and Erik Brynjolfsson

File Information: English Language/ 9 Page / size: 2.01 KB

Download

سال : ۱۳۹۱

ناشر : ۰

کاری از : اندرو مک آفی و اریک برین جلفسون

اطلاعات فایل : زبان انگلیسی / ۹ صفحه / حجم : KB 2.01

لینک دانلود

ONLINE RECEPTION ANALYSIS[atliem.ir]

ONLINE RECEPTION ANALYSIS: BIG DATA IN QUALITATIVE MARKETING RESEARCH

ABSTRACT

Purpose  The purpose of this paper is to forward an extension of reception analysis as a way to incorporate and give insight to social media mediations and big data in a qualitative marketing perspective .We propose a research method that focuses on discursive developments in consumer debates for example on YouTube  a large-scale openaccess social media platform  as opposed to the closed and tightknit communities  investigated by netnography. Methodology/approach  Online reception analysis Findings  Using a  combination of qualitative and quantitative methods, we find that big data can enrich online reception  analyses by showing new aspects of weak tie online networks and consumers meaning making. Research limitations/implications  The potential of online reception analysis is to encompass a discursive perspective on consumer interactions on large-scale open-access social media and to be able to analyze  socialities that do not represent shared cultures but are more representative of transitory everyday interactions. Originality/value of paper  Our method contributes to the current focus to define levels of analysis beyond research centered on individuals and individual interactions within groups to investigate other larger socialities. Further, our method also contributes by incorporating and investigating the mediatization of interaction that social media contributes with and therefore our methods actively work with the possibilities of social media. Hence, by extending the advances made by netnography into online spaces, online reception analysis can potentially inform the current status of big data research with a sociocultural methodological perspective .

INTRODUCTION

Big data is the big issue in marketing at the moment. It is proclaimed to bethe solution to end all marketing  problems in the future (Manyika et al., 2011). Some even claim that with big data we can dispense with the “why” questions (Mayer-Scho¨ nberger & Cukier, 2013), however others warn against trusting big data at the same time as they worry about the surveillance that big data also represents (Boyd & Crawford, 2011). In this paper, we investigate how big data can give perspective to analyses of consumers’ interactions on large-scale open-access social media. They present a challenge to qualitative consumer research, because of the numbers of consumers interacting and their transitory engagement.

چکیده

هدف هدف از این مقاله، پیشبرد تحلیل تجزیه و تحلیل پذیرش به عنوان راهی برای ترکیب و ارائه بینش به رسانه های اجتماعی اجتماعی و داده های بزرگ در یک دیدگاه بازاریابی کیفی است. ما پیشنهاد روش تحقیقاتی که بر روی تحولات گفتمان در بحث های مصرف کننده، یوتیوب پلت فرم رسانه های اجتماعی openaccess در مقیاس بزرگ؟ به عنوان مخالفت با جوامع بسته و تنگ که توسط Netnography بررسی شده است. روش شناسی / رویکرد؟ نتایج آنلاین تجزیه و تحلیل پذیرش؟ با استفاده از ترکیبی از روش های کیفی و کمی، ما می بینیم که داده های بزرگ می توانند تجزیه و تحلیل پذیرش آنلاین را با نشان دادن جنبه های جدید شبکه های آنلاین ضعیف و مصرف کنندگان به معنای ساختن، غنی سازی کنند. محدودیت های تحقیق / پیامدها؟ پتانسیل تجزیه و تحلیل پذیرش آنلاین این است که چشم انداز تفسیری را در مورد تعاملات مصرف کننده در رسانه های اجتماعی با دسترسی آزاد به وسیله وسیع در نظر بگیریم و بتوانیم به تجزیه و تحلیل سوسیالیسم هایی که فرهنگ های مشترک را نشان نمی دهند اما بیشتر نمایانگر تعاملات روزمره گذرا باشند. اصالت / ارزش کاغذ؟ روش ما به تمرکز فعلی برای تعریف سطوح تجزیه و تحلیل فراتر از تحقیقات متمرکز بر افراد و تعاملات فردی درون گروه ها برای بررسی سایر اجتماعات بزرگتر کمک می کند. علاوه بر این، روش ما نیز با ترکیب و تحقیق رسانه سازی تعامل که رسانه های اجتماعی با آن همراه هستند، کمک می کند و بنابراین روش های ما به طور فعال با امکانات رسانه های اجتماعی کار می کند. از این رو، با گسترش پیشرفت های انجام شده توسط netnography به فضاهای آنلاین، تجزیه و تحلیل پذیرش آنلاین می تواند به طور بالقوه وضعیت فعلی تحقیقات داده های بزرگ را با دیدگاه روش شناسی اجتماعی فرهنگی مطلع است.

مقدمه

داده های بزرگ موضوع مهم در بازاریابی در حال حاضر است. این اعلام شده است که راه حل برای پایان دادن به تمام مشکلات بازاریابی در آینده اعلام (Manyika et al.، ۲۰۱۱). برخی حتی ادعا می کنند که با داده های بزرگ ما می توانیم با سوالات “چرا” (Mayer-Scho¨nberger & Cukier، ۲۰۱۳) کنار بیاییم، با این وجود دیگران در مورد اعتماد به اطلاعات بزرگ در همان زمان هشدار می دهند که نگران نظارت هستند که داده های بزرگ نیز نشان دهنده آن هستند (Boyd & Crawford، ۲۰۱۱). در این مقاله، ما بررسی می کنیم که چگونه داده های بزرگ می توانند به تجزیه و تحلیل تعاملات مصرف کنندگان در رسانه های اجتماعی دسترسی آزاد دسترسی پیدا کنند. آنها با توجه به تعداد مصرف کنندگان در تعامل و تعامل گذرا از آنها، چالش هایی را برای تحقیقات مصرف کننده کیفی ارائه می دهند.

Year: 2016

Publisher : IEEE

By : Gry Høngsmark Knudsen and Dannie Kjeldgaard

File Information: English Language/ 21 Page / size: 247 KB

Download

سال : ۱۳۹۵

ناشر : IEEE

کاری از : Gry Høngsmark Knudsen و Dannie Kjeldgaard

اطلاعات فایل : زبان انگلیسی / ۲۱ صفحه / حجم : KB 247

لینک دانلود

Validating viral marketing strategies in Twitter[taliem.ir]

Validating viral marketing strategies in Twitter via Agent-based Social Simulation

ABSTRACT

A number of marketing phenomena are too complex for conventional analytical or empirical approaches. This makes marketing a costly process of trial and error: proposing, imagining, trying in the real world, and seeing  results. Alternatively, Agent-based Social Simulation (ABSS) is becoming the most popular approach to model and study these phenomena. This research paradigm allows modeling a virtual market to: design,  understand, and evaluate marketing hypotheses before taking them to the real world. However, there are  shortcomings in the specialized literature such as the lack of methods, data, and implemented tools to deploy   realistic virtual market with ABSS. To advance the state of the art in this complex and interesting problem, this paper is a seven-fold contribution based on a (1) method to design and validate viral marketing  strategies in Twitter by ABSS. The method is illustrated with the widely studied problem of rumor diffusion in  social networks. After (2) an extensive review of the related works for this problem, (3) an innovative spread  model is proposed which rests on the exploratory data analysis of two different rumor datasets in Twitter.  Besides, (4) new strategies are proposed to control malicious gossips. (5) The experimental results validate  the realism of this new propagation model with the datasets and (6) the strategies performance is evaluated  over this model. (7) Finally, the article is complemented by a free and open-source simulator.

INTRODUCTION
Marketing is building your brand, convincing people that your brand (meaning your product/service /company) is the best and protecting the relationships you build with your customers (Cohen, 2015).  Marketing phenomena usually are too complex for conventional analytical or empirical approaches such as analytical modeling or consumer behavior experiments (Rand & Rust, 2011). Particularly, these approaches do not allow researchers to state “what-if” scenarios to test their hypotheses. This makes marketing a costly process of trial and error: proposing a theory, imagining its effects in the market, trying in the real world, and seeing results (Statell, 2015).

چکیده

تعدادی از پدیده های بازاریابی برای رویکردهای تحلیلی یا تجربی سنتی بسیار پیچیده هستند. این باعث می شود که بازاریابی یک فرایند پر هزینه از آزمایش و خطا باشد: پیشنهاد، تصور، تلاش در دنیای واقعی و مشاهده نتایج. به همین ترتیب، شبیه سازی اجتماعی مبتنی بر عامل (ABSS) تبدیل به محبوب ترین روش برای مدل سازی و مطالعه این پدیده ها می شود. این پارادایم تحقیقاتی امکان مدل سازی یک بازار مجازی را برای طراحی، درک و ارزیابی فرضیه های بازاریابی می دهد تا آنها را به دنیای واقعی تبدیل کند. با این حال، در ادبیات تخصصی مانند کمبود روش ها، داده ها و ابزارهای پیاده سازی شده برای راه اندازی بازار مجازی واقع بینانه با ABSS، کاستی ها وجود دارد. برای پیشبرد وضعیت هنر در این مسئله پیچیده و جالب، این مقاله هفت بار سهم بر اساس یک روش (۱) برای طراحی و اعتبار استراتژی های بازاریابی ویروسی در توییتر توسط ABSS است. این روش با مسئله گسترده ای از انتشار شایعه در شبکه های اجتماعی نشان داده شده است. پس از (۲) بررسی گسترده ای از کارهای مربوط به این مشکل، (۳) یک مدل گسترش نوآورانه ارائه شده است که بر روی تجزیه و تحلیل داده های اکتشافی از دو مجموعه داده شایعه در توییتر استوار است. علاوه بر این، (۴) استراتژی های جدید برای کنترل سخنان مخرب پیشنهاد شده است. (۵) نتایج تجربی معتبر بودن واقع گرایی این مدل جدید انتشار با مجموعه داده ها و (۶) عملکرد استراتژی بر این مدل ارزیابی می شود. (۷) در نهایت مقاله با یک شبیه ساز منبع آزاد و متنباز تکمیل شده است.

مقدمه

بازاریابی در حال ساخت نام تجاری شما، متقاعد کردن مردم است که نام تجاری شما (به معنی محصول / خدمات / شرکت شما) بهترین و محافظت از روابط شما با مشتریان خود را (Cohen، ۲۰۱۵). پدیده های بازاریابی معمولا برای رویکردهای تحلیلی یا تجربی معمولی مانند مدل سازی تحلیلی یا آزمایش رفتار مصرف کننده بسیار پیچیده است (Rand & Rust، ۲۰۱۱). به ویژه، این رویکردها به محققان اجازه نمی دهد که سناریوهای “چه چیزی” را برای تست فرضیه هایشان بیان کنند. این باعث می شود بازاریابی فرایند پر هزینه از آزمایش و خطا: پیشنهاد یک نظریه، تصورات آن در بازار، تلاش در دنیای واقعی و دیدن نتایج (Statell، ۲۰۱۵).

Year: ۲۰۱۶

Publisher : ELSEVIER

By :   Emilio Serrano a Carlos A. Iglesias

File Information: English Language/ 26 Page / size: 7.96 KB

Download

سال : ۱۳۹۵

ناشر : ELSEVIER

کاری از : امیلیو سروانو کارلوس A. ایگلسیاس

اطلاعات فایل : زبان انگلیسی / ۲۶ صفحه / حجم : KB 7.96

لینک دانلود

Big Data A Survey[taliem.ir]

Big Data: A Survey

ABSTRACT

In this paper, we review the background and state-of-the-art of big data. We first introduce the general background of big data and review related technologies, such as could computing, Internet of Things, data centers, and Hadoop. We then focus on the four phases of the value chain of big data, i.e., data generation, data acquisition, data storage, and data analysis. For each phase, we introduce the general background,  discuss the technical challenges, and review the latest advances. We finally examine the several representative applications of big data, including enterprise management, Internet of Things, online social networks, medial applications, collective intelligence, and smart grid. These discussions aim to provide a comprehensive overview and big-picture to readers of this exciting area. This survey is concluded with a  discussion of open problems and future directions.

INTRODUCTION

Over the past 20 years, data has increased in a large scale in various fields. According to a report from  International Data Corporation (IDC), in 2011, the overall created and copied data volume in the world was 1.8ZB (۱۰۲۱B), which increased by nearly nine times within five years . This figure will double at least every other two years in the near future. Under the explosive increase of global data, the term of big data is mainly used to describe enormous datasets. Compared with traditional datasets, big data typically includes masses of unstructured data that need more real-time analysis. In addition, big data also brings about new  opportunities for discovering new values, helps us to gain an in-depth understanding of the hidden values, and also incurs new challenges, e.g., how to effectively organize and manage such datasets.

چکیده

در این مقاله، پس زمینه و حالت پیشرفته داده های بزرگ را بررسی می کنیم. ابتدا زمینه کلی داده های بزرگ و بررسی فن آوری های مرتبط، مانند محاسبات، اینترنت چیزها، مراکز داده و Hadoop را معرفی می کنیم. سپس در چهار مرحله زنجیره ارزش داده های بزرگ، یعنی تولید داده ها، جمع آوری داده ها، ذخیره سازی داده ها و تجزیه و تحلیل داده ها تمرکز می کنیم. برای هر مرحلهای، ما پیشینه عمومی را معرفی میکنیم، در مورد چالشهای فنی بحث میکنیم و آخرین پیشرفتها را بررسی میکنیم. ما در نهایت چندین برنامه نمایشی داده های بزرگ، از جمله مدیریت سازمانی، اینترنت چیزها، شبکه های اجتماعی آنلاین، برنامه های رسانه ای، هوش جمعی و شبکه های هوشمند را بررسی می کنیم. این مباحث به منظور ارائه یک مرور جامع و تصویر بزرگ برای خوانندگان این منطقه هیجان انگیز است. این نظرسنجی با بحث درباره مسائل باز و جهت های آینده انجام شده است.

مقدمه

در طول ۲۰ سال گذشته، داده ها در مقیاس وسیع در زمینه های مختلف افزایش یافته است. بر اساس گزارشی از شرکت بین المللی داده (IDC)، در سال ۲۰۱۱، حجم کلی ایجاد شده و کپی شده در جهان ۱٫۸ZB (≈ ۱۰۲۱B) بود که تقریبا نه برابر ظرف پنج سال افزایش یافت. این رقم حداقل دو سال دیگر در آینده نزدیک دو برابر خواهد شد. تحت افزایش انفجاری داده های جهانی، اصطلاح داده های بزرگ به طور عمده برای توصیف مجموعه های داده های عظیم استفاده می شود. در مقایسه با مجموعه داده های سنتی، داده های بزرگ معمولا شامل توده های داده های غیر ساختاری هستند که نیاز به تجزیه و تحلیل زمان واقعی دارند. علاوه بر این، داده های بزرگ نیز فرصت های جدیدی برای کشف ارزش های جدید به ارمغان می آورد، به ما کمک می کند تا درک عمیق ارزش های پنهان را بدست آوریم، و همچنین چالش های جدیدی را به وجود می آورد، مانند چگونگی سازماندهی و مدیریت چنین مجموعه های داده ای.

Year: ۲۰۱۴

Publisher : SPRINGER

By : Min Chen · Shiwen Mao · Yunhao Liu

File Information: English Language/ 39 Page / size: 1.01 KB

Download

سال : ۱۳۹۳

ناشر : SPRINGER

کاری از : مین چن · شیوان مائو · یوناهو لیو

اطلاعات فایل : زبان انگلیسی / ۳۹ صفحه / حجم : KB 1.01

لینک دانلود

A Survey of Security and Privacy in Big Data[taliem.ir]

A Survey of Security and Privacy in Big Data

ABSTRACT

Big data has been arising a growing interest in both scientific and industrial fields for its potential value.  However, before employing big data technology into massive applications, a basic but also principle topic should be investigated: security and privacy. In this paper, the recent research and development on security and privacy in big data is surveyed. First, the effects of characteristics of big data on information security and
privacy are described. Then, topics and issues on security are discussed and reviewed. Further, privacy-preserving trajectory data publishing is studied due to its future utilization, especially in telecom operation.

INTRODUCTION

Big data has emerged to a new paradigm for data applications. Due to significant benefits, big data arises a growing interest in many industry fields, such as telecom operation , healthcare  and so on. Many efforts on big data have been working on the data storage, data mining, and data application. However, the widespread usage of big data relies not only on the promising solutions and mechanisms of data analysing, but also on security protection and privacy preserving. Information security can be improved by big data technology, which is beneficial from security tools such as network monitoring, security information, and event  management , . However, on the down-side, there are additional security challenges brought by the big data technology, including cryptography algorithms, data provenance, secure data storage, access control, real time monitoring and so on . Identifying and analysing the security issues will bring a better usage of big data. Thus, in this paper, we will first survey existing research on security and privacy. Then, we will focus on an essential type of data: trajectory.  Trajectory data represents the mobility of moving objects, such as people, vehicles, and so on. Spatio-temporal trajectories provide significant and valuable information, and  foster a broad range of applications, such as intelligent transportation system, commercial site planning and so on. Therefore, trajectory data mining has become an increasingly interesting research topic, attracting attentions from numerous fields, especially in telecom operation.

چکیده

داده های بزرگ ناشی از افزایش علاقه به هر دو علم و صنعت برای ارزش بالقوه آن است. با این حال، قبل از استفاده از تکنولوژی داده های بزرگ در برنامه های کاربردی عظیم، باید یک موضوع اساسی اما همچنین موضوع اصلی مورد بررسی قرار گیرد: امنیت و حریم خصوصی. در این مقاله، تحقیق و توسعه اخیر در مورد امنیت و حریم خصوصی در داده های بزرگ مورد بررسی قرار گرفته است. اول، اثرات ویژگی های داده های بزرگ بر روی امنیت اطلاعات و حریم خصوصی توضیح داده شده است. سپس موضوعات و مسائل مربوط به امنیت مورد بحث و بررسی قرار می گیرد. علاوه بر این، انتشار اطلاعات مسیر حفظ حریم خصوصی به علت استفاده از آینده آن، به ویژه در عملیات مخابراتی مورد مطالعه قرار گرفته است.

مقدمه

داده های بزرگ به یک پارادایم جدید برای برنامه های داده تبدیل شده است. با توجه به مزایای قابل توجه، داده های بزرگ باعث افزایش علاقه در بسیاری از زمینه های صنعتی مانند عملیات مخابراتی، مراقبت های بهداشتی و غیره می شود. بسیاری از تلاش ها بر روی داده های بزرگ بر روی ذخیره سازی داده ها، داده کاوی و برنامه های داده کار می کنند. با این حال، استفاده گسترده از داده های بزرگ نه تنها به راه حل های امیدوار کننده و مکانیسم تجزیه و تحلیل داده ها، بلکه در حفظ امنیت و حفظ حریم خصوصی نیز متکی است. امنیت اطلاعات را می توان با تکنولوژی داده بزرگ بهبود داد که از ابزارهای امنیتی مانند نظارت بر شبکه، اطلاعات امنیتی و مدیریت رویداد سودمند است. با این حال، در سمت پایین، چالش های امنیتی اضافی با تکنولوژی داده های بزرگ، از جمله الگوریتم های رمزنگاری، پرونده های داده، ذخیره سازی داده های امن، کنترل دسترسی، نظارت بر زمان واقعی و غیره، وجود دارد. شناسایی و تجزیه و تحلیل مسائل امنیتی استفاده بهتر از داده های بزرگ را به ارمغان می آورد. بنابراین، در این مقاله ابتدا تحقیقات موجود در مورد امنیت و حریم خصوصی را مورد بررسی قرار خواهیم داد. سپس، ما بر روی یک نوع ضروری داده تمرکز می کنیم: مسیر. داده های مسیر نشان دهنده تحرک اشیاء متحرک مانند افراد، وسایل نقلیه و غیره است. مسیرهای اسپرتیا – زمانی اطلاعات مهمی و ارزشمند ارائه می دهند و طیف گسترده ای از برنامه های کاربردی مانند سیستم حمل و نقل هوشمند، برنامه ریزی سایت تجاری و غیره را توسعه می دهند. بنابراین، داده کاوی مسیریابی تبدیل به موضوع تحقیق به طور فزاینده جالب توجه است، جذب توجه از زمینه های متعدد، به خصوص در عملیات مخابراتی است.

Year: ۲۰۱۶

Publisher : IEEE

By :  Haina Ye, Xinzhou Cheng, Mingqiang Yuan, Lexi Xu, Jie Gao, and Chen Cheng

File Information: English Language/ 5 Page / size: 249 KB

Download

سال : ۱۳۹۴

ناشر : IEEE

کاری از : Haina Ye, Xinzhou Cheng, Mingqiang Yuan, Lexi Xu, Jie Gao, and Chen Cheng

اطلاعات فایل : زبان انگلیسی / ۵ صفحه / حجم : KB 249

لینک دانلود

Research-note-Machinery-manumission-and-economic-machinationstaliem.ir_

Research note: Machinery, manumission, and economic machinations

ABSTRACT

This research note reports upon advancements in computerization and big data creation within the off- highway plant and machinery sector. A thematic literature review synthesizes a disparate range of research initiatives and industrial developments and highlights specific examples of technological developments. A  discussion regarding impact upon future employment concludes that rather than creating mass  unemployment, computerization will change the employment horizon and continue to shape the global economic community. Education is quintessentially important to humanity which must master the machine and not become a slave to technology. Future proofing of educational provisions will therefore feature heavily in tomorrow’s employment market. This provocative research note advances new ideas and  theoretical perspectives that are specifically designed to stimulate academic debate in this novel and rapidly developing area of scientific endeavor.

INTRODUCTION

The rapid pace of computerization has created a digital economy to challenge the modern capitalist  economy; societal, political and economic ramifications of this change are profound, not least upon employment, education and prosperity (Parayil, 2005). The digital economy manifests from two key sources: i) the transformation effects of general purpose technologies (hardware) in the field of information and communication; and ii) the overwhelmingly vast inter-connectivity afforded by the internet. Unlike the  Industrial Revolution, the digital age is maturing at an exponential pace. In 2010, the internet contained an estimated five hundred billion gigabytes of digital content but increasingly, experts refer to digital content in yottabytes (i.e. a trillion terabytes) (Bollier, 2010). This growth trend is fueled by the rise in internet traffic which is doubling every two to three years, with mobile internet traffic doubling every year (EU, 2014). Ross (2016) reports that the currently estimated 16 billion internet connected devices will increase to 40 billion by 2020. The voluminous data generated (and knowledge contained  within such) signifies that whilst iron represented the Industrial Revolution’s raw material, data constitutes the raw material of the  information age. As well as fueling prosperity, the information age has also created opportunities for cybercrime and terrorists. The number, cost and sophistication of these attacks is increasing at an alarming rate and the value of crime is estimated to cost the global economy billions of pounds (UK Sterling) each year (Ablon, Libicki, & Golay,  ۲۰۱۴).

چکیده

این یادداشت تحقیق در مورد پیشرفت های کامپیوتری و ایجاد داده های بزرگ در بخش کارخانه ماشین آلات و بخش ماشین آلات گزارش شده است. بررسی ادبیات موضوعی، گستره ای متفاوت از طرح های تحقیقاتی و تحولات صنعتی را به وجود می آورد و نمونه های خاصی از پیشرفت های تکنولوژیکی را نشان می دهد. بحث در مورد تاثیر بر اشتغال آتی نتیجه می گیرد که به جای ایجاد بیکاری عظیم، کامپیوتر سازی افق اشتغال را تغییر خواهد داد و همچنان جامعه جهانی اقتصادی را شکل می دهد. آموزش و پرورش به طور عمده برای بشریت مهم است که باید دستگاه را اداره کند و نه به عنوان یک برده به فناوری. بنابراین اثبات آینده اموال آموزشی به شدت در بازار کار فردا به چشم می خورد. این یادداشت تحریک آمیز پیشرفته ایده های جدید و دیدگاه های نظری است که به طور خاص طراحی شده اند تا تحول بحث های دانشگاهی در این رمان و به سرعت در حال توسعه منطقه تلاش های علمی است.

مقدمه

سرعت سریع کامپیوتری یک اقتصاد دیجیتالی را برای چالش بر اقتصاد سرمایه داری مدرن ایجاد کرده است؛ تأثیرات اجتماعی، سیاسی و اقتصادی این تغییرات عمیق است، بخصوص در اشتغال، آموزش و رفاه (Parayil، ۲۰۰۵). اقتصاد دیجیتالی از دو منبع کلیدی ظاهر می شود: i) اثرات تحول فناوری های عمومی (سخت افزار) در زمینه اطلاعات و ارتباطات؛ و (ii) اتصال بین وسیع و گسترده ای که توسط اینترنت فراهم می شود. بر خلاف انقلاب صنعتی، عصر دیجیتال به سرعت رشد می کند. در سال ۲۰۱۰، اینترنت حاوی حدود پنج صد میلیارد گیگابایت دیجیتالی بود، اما به طور فزاینده، کارشناسان به محتوای دیجیتال در yottabytes (یعنی یک تریلیون ترابایت) اشاره می کنند (Bollier، ۲۰۱۰). این روند رشد با افزایش ترافیک اینترنت همراه است که هر دو تا سه سال دوبرابر می شود و هر ساله اینترنت دو برابر شده است (EU، ۲۰۱۴). راس (۲۰۱۶) گزارش می دهد که در حال حاضر حدود ۱۶ میلیارد دستگاه به اینترنت متصل شده تا سال ۲۰۲۰ به ۴۰ میلیارد افزایش خواهد یافت. داده های حجم یافته تولید شده (و دانش موجود در چنین مواردی) نشان می دهد که در حالی که آهن مواد اولیه خام صنعتی را نشان می دهد، عصر اطلاعات. عصر اطلاعات همچنین باعث افزایش فرصت های شغلی برای جرایم سایبری و تروریست ها شده است. تعداد، هزینه و پیچیدگی این حملات به میزان قابل ملاحظه ای افزایش می یابد و ارزش جرم و جنایت برآورد می شود که هر سال به میلیاردها پوند (انگلستان استرلینگ) هزینه می شود (Ablon، Libicki & Golay، ۲۰۱۴).

Year: 2016

Publisher : ELSEVIER

By :  David J. Edwards , Erika Pärn , Peter E.D. Love , Hatem El-Gohary

File Information: English Language/ 5 Page / size: 277 KB

Only site members can download free of charge after registering and adding to the cart

Download tutorial

سال : ۱۳۹۵

ناشر : ELSEVIER

کاری از : دیوید ادواردز، اریکا پرن، پیتر E.D. عشق، حاطم القوچی

اطلاعات فایل : زبان انگلیسی / ۵صفحه / حجم : KB 277

فقط اعضای سایت پس از ثبت نام و اضافه کردن به سبد خرید می توانند دانلود رایگان کنند.خوشحال می شویم به ما پبیوندید

آموزش دانلود

A big data analytics framework for scientific data management[taliem.ir]

A big data analytics framework for scientific data management

ABSTRACT

The Ophidia project is a research effort addressing big data analytics requirements, issues, and challenges for
eScience. We present here the Ophidia analytics framework, which is responsible for atomically processing, transforming and manipulating array-based data. This framework provides a common way to run on large clusters analytics tasks applied to big datasets. The paper highlights the design principles, algorithm, and most relevant implementation aspects of the Ophidia analytics framework. Some experimental results, related to a couple of data analytics operators in a real cluster environment, are also presented
.

INTRODUCTION

In several eScience domains  the analysis and mining of large volumes of data is increasingly becoming central to scientific discovery. The multidimensionality, volume, complexity, and variety of scientific data need  specific solutions able to (i) support the management and analysis of large datasets , (ii) provide array-based functionalities, and (iii) support the scientific analysis process through parallel solutions able to deliver results in (near) real-time . Unfortunately, the tools, libraries and frameworks used in many scientific domains are  mostly sequential today. This barrier strongly limits scientific productivity, slowing down or entirely preventing data analysis activities on large datasets. In the climate science context few tools exploit parallel paradigms for analysis and visualization , making urgent the need for new (big) data intensive parallel frameworks. Relevant projects in this area like ParCAT , ParNCL, and ParGAS , share this scientific goal, but provide a toolkit rather than a framework. Scientific data needs data warehouse-like platforms to perform data analytics. However, current general-purpose (enterprise-based) On Line Analytical Processing (OLAP) systems are not suitable for eScience due to their limited scalability, a lack of support for parallel solutions and for the analysis of large volumes of data, and their inadequate support for numerical and mathematical libraries. Additionally, specific array-based support (which is key for n-dimensional scientific data) is not sufficient both in terms of data types and data analysis primitives to address scientist needs and use cases.

چکیده

پروژه Ophidia یک تلاش تحقیقاتی است که با توجه به نیازها، مسائل و چالش های پیش رو برای دانش های اطلاعاتی، مورد نیاز است. ما در اینجا چارچوب تحلیلی Ophidia را ارائه می دهیم، که مسئول پردازش اتمی، تبدیل و دستکاری داده های مبتنی بر آرایه است. این چارچوب یک راه معمول برای اجرای وظایف تجزیه و تحلیل خوشه های بزرگ در مورد مجموعه داده های بزرگ فراهم می کند. این مقاله، اصول طراحی، الگوریتم و جنبه های پیاده سازی مرتبط با چارچوب تحلیلی Ophidia را برجسته می کند. بعضی از نتایج تجربی، مربوط به چند اپراتور تجزیه و تحلیل داده ها در یک محیط خوشه واقعی، نیز ارائه شده است.

مقدمه

در حوزه های مختلف eScience تجزیه و تحلیل و استخراج حجم زیادی داده ها به طور فزاینده ای به عنوان کشف علمی تبدیل شده است. چند بعدی بودن، حجم، پیچیدگی و انواع داده های علمی نیاز به راه حل های خاصی دارند که قادر به (i) پشتیبانی از مدیریت و تجزیه و تحلیل مجموعه داده های بزرگ، (ii) ارائه قابلیت های مبتنی بر آرایه، و (iii) پشتیبانی از روند تجزیه و تحلیل علمی از طریق راه حل های موازی قادر به ارائه نتایج در (در نزدیکی) زمان واقعی است. متأسفانه، ابزارها، کتابخانه ها و چارچوب هایی که در بسیاری از حوزه های علمی مورد استفاده قرار می گیرند، بیشتر امروزه دنباله دار هستند. این مانع شدید بهره وری علمی را کاهش می دهد، فعالیت های تجزیه و تحلیل داده ها را در مجموعه داده های بزرگ تضعیف می کند یا به طور کامل جلوگیری می کند. در زمینه علمی اقلیمی، ابزارهای چندگانه از پارادایم های موازی برای تحلیل و تجسم استفاده می کنند و نیاز به چارچوب موازی فشرده اطلاعات جدید (بزرگ) را ضروری می سازد. پروژه های مرتبط در این زمینه مانند ParCAT، ParNCL، و ParGAS، این هدف علمی را به اشتراک می گذارند، اما یک ابزار نه یک چارچوب را ارائه می دهند. داده های علمی به سیستم های اطلاعاتی مانند انبار نیاز دارند تا تجزیه و تحلیل داده ها را انجام دهند. با این حال، سیستم های پردازش خطی تحلیلی (OLAP) عمومی (مبتنی بر سازمانی) به دلیل مقیاس پذیری محدود، عدم پشتیبانی از راه حل های موازی و تجزیه و تحلیل حجم زیادی از داده ها و ناکافی بودن آنها پشتیبانی از کتابخانه های عددی و ریاضی. علاوه بر این، پشتیبانی خاص مبتنی بر آرایه (که کلیدی برای داده های علمی n بعدی است) از نظر نوع داده ها و ابتدای تجزیه و تحلیل داده ها کافی برای پاسخگویی به نیازهای دانش آموز و موارد استفاده نیست.

Year: 2013

Publisher : IEEE

By :  Sandro Fiore , Cosimo Palazzo , Alessandro D’Anca , Ian Foster , Dean N. Williams , Giovanni Aloisio

File Information: English Language/ 8 Page / size: 1.10 KB

Only site members can download free of charge after registering and adding to the cart

Download tutorial

سال : ۱۳۹۲

ناشر : IEEE

کاری از : ساندرو فیور، کیمو پالازو، الساندرو دکانا، یان فاستر، دین نیل ویلیامز، جیووانی آلوسیو

اطلاعات فایل : زبان انگلیسی / ۸صفحه / حجم : KB 1.10

فقط اعضای سایت پس از ثبت نام و اضافه کردن به سبد خرید می توانند دانلود رایگان کنند.خوشحال می شویم به ما پبیوندید

آموزش دانلود

A Secure Cloud Computing Based Framework[taliem.ir]

A Secure Cloud Computing Based Framework for Big Data Information Management of Smart Grid

ABSTRACT

Smart grid is a technological innovation that improves efficiency, reliability, economics, and sustainability of electricity services. It plays a crucial role in modern energy infrastructure. The main challenges of smart grids, however, are how to manage different types of front-end intelligent devices such as power assets and smart meters efficiently; and how to process a huge amount of data received from these devices. Cloud computing, a technology that provides computational resources on demands, is a good candidate to address these challenges since it has several good properties such as energy saving, cost saving, agility, scalability, and flexibility. In this paper, we propose a secure cloud  computing based framework for big data information management in smart grids, which we call “Smart-Frame.” The main idea of our framework is to build a hierarchical structure of cloud computing centers to provide different types of computing services for information management and big data analysis. In addition to this structural framework, we present a security solution based on identity-based  encryption, signature and proxy re-encryption to address critical security issues of the proposed framework.

INTRODUCTION

MART renovation plans of many countries, replacing traditional grids have recently been adopted in electronic grid power grids. One of the reasons is that compared to traditional power grids, smart grids bring significant improvement in the efficiency, reliability, economics, and substantiality of electricity services . As an example, the ENEL Telegestore project in Italy, which is widely regarded as the first commercial  project using smart grid technology, delivers annual savings of approximately 500 million Euros . Following the success of Telegestore, several other smart grid projects have been proposed. They include the Hydro One project in Canada, the Evora InovGrid project  in Portugal, andthe Modellstadt Mannheim (Moma) project  in Germany. While smart grids bring in several benefits to electrical power grids, their deployment is often limited to small  regions (e.g., within a city or a small province). There are several challenges that prevent smart grids to be deployed at a larger scale (e.g., in the whole country), one of which is information management that is related to information gathering, information storing, and information processing. Since there are a large number of front-end intelligent devices, managing a huge amount of information received from these devices is not an easy task.

چکیده

شبکه هوشمند یک نوآوری تکنولوژیک است که باعث بهبود کارایی، قابلیت اطمینان، اقتصاد و پایداری خدمات برق می شود. این نقش مهمی در زیرساخت های انرژی مدرن دارد. چالش اصلی شبکه های هوشمند، چگونگی مدیریت انواع مختلف دستگاه های هوشمند جلویی مانند دارایی های قدرت و متراکم هوشمند است. و نحوه پردازش مقدار زیادی از داده های دریافت شده از این دستگاه ها. محاسبات ابر، یک فن آوری که منابع محاسباتی را براساس تقاضا ارائه می دهد، یک کاندیدا خوب برای رسیدگی به این چالش ها است، زیرا دارای چندین ویژگی خوب مانند صرفه جویی در مصرف انرژی، صرفه جویی در هزینه، چابکی، مقیاس پذیری و انعطاف پذیری است. در این مقاله، یک چارچوب مبتنی بر محاسبات ابری امن برای مدیریت داده های بزرگ داده در شبکه های هوشمند پیشنهاد می کنیم که ما آن را “Smart-Frame” می نامیم. ایده اصلی چارچوب ما این است که ساختار سلسله مراتبی مراکز محاسبات ابری برای ارائه انواع مختلف خدمات محاسبات برای مدیریت اطلاعات و تجزیه و تحلیل داده های بزرگ. علاوه بر این چارچوب ساختاری، ما یک راه حل امنیتی مبتنی بر رمزگذاری مبتنی بر هویت، امضا و رمزگذاری مجدد پروکسی را برای حل مسائل امنیتی بحرانی چارچوب پیشنهادی ارائه می کنیم.

مقدمه

طرح های بازسازی MART از بسیاری از کشورها، جایگزین شبکه های سنتی اخیرا در شبکه های برق شبکه های برق به کار گرفته شده است. یکی از دلایل این است که در مقایسه با شبکه های قدرت سنتی، شبکه های هوشمند بهبود قابل توجهی در کارایی، قابلیت اطمینان، اقتصاد، و الزام آور خدمات برق ارائه می دهد. به عنوان مثال، پروژه ENEL Telegestore در ایتالیا که به طور گسترده ای به عنوان اولین پروژه تجاری با استفاده از تکنولوژی شبکه هوشمند است، صرفه جویی سالیانه حدود ۵۰۰ میلیون یورو را ارائه می دهد. پیروی از موفقیت Telegestore، چندین طرح دیگر شبکه هوشمند ارائه شده است. این پروژه شامل پروژه Hydro One در کانادا، پروژه Evora InovGrid در پرتغال و پروژه Modellstadt Mannheim (Moma) در آلمان است. در حالی که شبکه های هوشمند مزایای متعددی را برای شبکه های برق تامین می کنند، اغلب آنها به مناطق کوچک محدود می شود (مثلا در یک شهر یا یک استان کوچک). چالش های متعددی وجود دارد که مانع گسترش شبکه های هوشمند در مقیاس وسیع (مثلا در کل کشور) می شود، یکی از آنها مدیریت اطلاعات است که مربوط به جمع آوری اطلاعات، ذخیره سازی اطلاعات و پردازش اطلاعات است. از آنجا که تعداد زیادی از دستگاه های هوشمند جلویی وجود دارد، مدیریت مقدار زیادی از اطلاعات دریافت شده از این دستگاه کار ساده ای نیست.

Year: ۲۰۱۵

Publisher : IEEE

By :  Joonsang Baek, Quang Hieu Vu, Joseph K. Liu, Xinyi Huang, and Yang Xiang

File Information: English Language/ 12 Page / size: 628 KB

Download

سال : ۱۳۹۴

ناشر : IEEE

کاری از : جونسانگ باک، کوانگ هوو وو، جوزف لی لی، Xinyi Huang و یانگ شیانگ

اطلاعات فایل : زبان انگلیسی / ۱۲ صفحه / حجم : KB 628

لینک دانلود

 

NoSQL Systems for Big Data Management[taliem.ir]

NoSQL Systems for Big Data Management

ABSTRACT

The advent of Big Data created a need for out-of-the-box horizontal scalability for data management systems. This ushered in an array of  choices for Big Data management under the umbrella term NoSQL. In this paper, we provide a taxonomy and unified perspective on NoSQL systems. Using this perspective, we compare and contrast various NoSQL systems using multiple facets including system architecture, data model, query language,  client API, scalability, and availability. We group current NoSQL systems into seven broad categories: Key-Value,Table-type/Column, Document, Graph, Native XML, Native Object, and Hybrid databases. We also describe application scenarios for each category to help the reader in choosing an appropriate NoSQL system for a given application. We conclude the paper by indicating future research directions.

INTRODUCTION

Until recently, relational database management systems (RDBMS) were the mainstay for managing all types of data irrespective of their  naturally fit to the relational data model. The emergence of Big Data and mobile computing necessitated new database functionality to support applications such as real-time logfile analysis, cross-selling in eCommerce, location based services, and micro-blogging. Many of these applications exhibit a preponderance of insert and retrieve operations on a very large scale. Relational databases were found to be inadequate in handling the scale and varied structure of data. The above requirements ushered in an array of choices for Big Data management under the umbrella term NoSQL . NoSQL (meaning ‘not only SQL’) has come to describe a large class of databases which do not have properties of  traditional relational databases and are generally not queried with SQL (structured query language). NoSQL systems provide data partitioning and replication as built-in features. They typically run on cluster computers made from commodity hardware and provide horizontal scalability.Developing applications using NoSQL systems is quite different from the process used with RDBMS . NoSQL databases require developer-centric approach from the application inception to completion. For example, data modeling is done by the application architector developer, whereas in RDBMS based applications, data architects and data modelers complete the data modeling tasks. They begin by constructing conceptual and logical data models.

چکیده

ظهور داده های بزرگ نیاز به مقیاس پذیری افقی خارج از جعبه برای سیستم های مدیریت داده ایجاد کرد. این در مجموعه ای از گزینه های برای مدیریت داده های بزرگ در زیر اصطلاح NoSQL معرفی شده است. در این مقاله، ما یک طبقه بندی و دیدگاه یکپارچه در سیستم های NoSQL ارائه می دهیم. با استفاده از این دیدگاه، ما سیستم های NoSQL مختلفی را با استفاده از چندین جنبه از جمله معماری سیستم، مدل داده، زبان پرس و جو، API سرویس گیرنده، مقیاس پذیری و قابلیت دسترسی مقایسه می کنیم. ما سیستم های NoSQL فعلی را به ۷ مجموعه گسترده ای تقسیم می کنیم: Key-Value، Table-Type / Column، Document، Graph، XML Bative، Object Native، and Hybrid Databases. ما همچنین سناریوهای کاربردی را برای هر دسته توصیف می کنیم تا به خواننده در انتخاب سیستم مناسب NoSQL برای یک برنامه کاربردی داده شود. مقاله را با نشان دادن مسیرهای تحقیقاتی آینده نتیجه می گیریم.

مقدمه

تا همین اواخر، سیستم های مدیریت پایگاه داده ارتباطی (RDBMS) اصلی برای مدیریت انواع داده ها بود، صرف نظر از اینکه آنها به طور طبیعی به مدل داده های رابطه ای مرتبط بودند. ظهور داده های بزرگ و رایانه های کامپیوتری نیازمند قابلیت پایگاه داده جدید برای پشتیبانی از برنامه های کاربردی مانند تجزیه و تحلیل منطقی در زمان واقعی، فروش متقابل در تجارت الکترونیک، خدمات مبتنی بر مکان، و میکرو وبلاگ نویسی است. بسیاری از این برنامه ها دارای غلبه بر عملیات درج و بازیابی در مقیاس بسیار بزرگ هستند. در ارتباط با مقیاس و ساختار متنوع داده ها، پایگاه های ارتباطی به اندازه کافی ناکافی بودند. الزامات فوق در مجموعه ای از گزینه ها برای مدیریت داده های بزرگ در زیر اصطلاح NoSQL ارائه شده است. NoSQL (به معنی نه تنها SQL) برای توصیف یک کلاس بزرگ از پایگاه های داده ای است که دارای خواص پایگاه های داده های روابط سنتی نیستند و معمولا با SQL query (زبان پرس و جو ساختار یافته) مورد سوال قرار نمی گیرند. سیستم های NoSQL پارتیشن بندی و تکرار داده ها را به عنوان ویژگی های داخلی ارائه می دهند. آنها به طور معمول در کامپیوترهای خوشه ای ساخته شده از سخت افزار کالا اجرا می شوند و مقیاس پذیری افقی را فراهم می کنند. برنامه های توسعه با استفاده از سیستم های NoSQL کاملا متفاوت از فرآیند مورد استفاده با RDBMS هستند. پایگاه داده های NoSQL نیاز به رویکرد توسعه محور از زمان شروع برنامه تا اتمام دارد. به عنوان مثال، مدل سازی داده ها توسط توسعه دهنده نرم افزار معماری انجام می شود، در حالی که در برنامه های مبتنی بر RDBMS، معماران داده ها و مدل سازان داده، وظایف مدل سازی داده را تکمیل می کنند. آنها با ساخت مدل های داده های مفهومی و منطقی شروع می شوند.

Year: ۲۰۱۴

Publisher : IEEE

By :  Venkat N Gudivada, Dhana Rao, Vijay V. Raghavan

File Information: English Language/ 8 Page / size: 163 KB

Download

سال : ۱۳۹۳

ناشر : IEEE

کاری از : Venkat N Gudivada, Dhana Rao, Vijay V. Raghavan

اطلاعات فایل : زبان انگلیسی / ۸ صفحه / حجم : KB 163

 

لینک دانلود