توضیحات
ABSTRACT
In the proposed paper, we described the approach to building Data Lake based knowledge discovery platform. The proposal is focused on integrating Data Lake based storage, built on Hadoop framework and NoSQL systems, into traditional data warehouse discovery platform, preserving the well proven and robust data warehouse decision support and analytic tools. The proposed knowledge discovery platform processes data from all hierarchical control levels in manufacturing and can be used to address the main manufacturing issues in the knowledge discovery domain.
INTRODUCTION
The current trend in manufacturing is marked by the large increase in amount of data, originating from the field level of hierarchical control. This increase is mainly due to implementation of new automation technologies and machines based on internet of things concept, a part of Industry 4.0, enabling direct communication with upper control levels. Each parameter of manufacturing process is represented by a large amount of production data applicable in information or control systems at various levels. Despite the fact that most of manufacturing companies gather these data, they are not further used as information or knowledge in decision support process. This was one of the reasons resulting in the urgent need for storing and processing large quantities of data and yet, it will be possible to work with them flexibly. These needs are reflected by current big data technologies based on NoSQL systems and Hadoop framework. However, integrating these new technologies into a company structure disrupts the wellestablished architecture based on data warehouses. This structure represents proven and robust solution from the company decision support point of view. Therefore, these new technologies must be integrated into manufacturing companies in a way allowing users to preserve the currently used solutions based on the data warehouse concept, while exploiting the advantages of the deployed NoSQL or Hadoop solution. Current information and control systems primarily employ hierarchical (pyramid) architecture integrated as a whole with elements of physical and logical distribution thus providing open and scalable solutions.
چکیده
در مقاله پیشنهادی ما رویکردی برای ساختن پلت فرم شناخت دانش شناخته شده در Data Lake را توصیف کردیم. این پیشنهاد بر روی یکپارچه سازی ذخیره سازی Data Lake بر اساس چارچوب Hadoop و سیستم NoSQL به پلت فرم کشف انبار داده های سنتی متمرکز شده است، حفظ پشتیبانی از تصمیمات انبارها و ابزار تحلیلی به خوبی اثبات شده و قوی. پلاتفرم شناسی پیشنهاد شده پردازش داده ها از تمام سطوح کنترل سلسله مراتبی در تولید است و می تواند برای رفع مسائل اصلی تولید در دامنه ی کشف دانش استفاده شود.
مقدمه
روند فعلی در تولید با افزایش چشمگیر میزان داده ها، ناشی از سطح میدان کنترل سلسله مراتبی است. این افزایش عمدتا به دلیل اجرای فن آوری های جدید اتوماسیون و ماشین های مبتنی بر اینترنت مفهوم چیزها، بخشی از صنعت 4.0 است، که ارتباط مستقیم با سطوح کنترل بالا را فراهم می کند. هر پارامتر فرایند تولید با مقدار زیادی از داده های تولید در سیستم های اطلاعاتی و کنترل در سطوح مختلف نمایش داده می شود. علیرغم این واقعیت که بسیاری از شرکت های تولیدی این اطلاعات را جمع آوری می کنند، آنها به عنوان اطلاعات یا دانش در فرآیند پشتیبانی تصمیم مورد استفاده قرار نمی گیرند. این یکی از دلایلی بود که نیاز فوری به ذخیره و پردازش داده های بزرگ را داشت و با این حال امکان کار با آنها را با انعطاف پذیری فراهم می کند. این نیازها از طریق تکنولوژی های داده های جاری بر اساس سیستم های NoSQL و چارچوب Hadoop منعکس می شوند. با این حال، ادغام این فناوری های جدید به ساختار شرکت، معماری به خوبی ایجاد شده بر اساس انبار داده ها را مختل می کند. این ساختار راه حل اثبات شده و قوی از نقطه نظر پشتیبانی تصمیم گیری شرکت است. بنابراین، این فن آوری های جدید باید به شرکت های تولیدی متصل شوند تا بتوانند راه حل های در حال حاضر که بر مبنای مفهوم انبار داده ذخیره می شوند را حفظ کند، در حالی که بهره گیری از مزایای راه حل مستقيم NoSQL يا Hadoop. سیستم اطلاعات جاری و سیستم های کنترل در درجه اول معماری سلسله مراتبی (هرم) را به طور کامل با عناصر توزیع فیزیکی و منطقی یکپارچه می کند، بنابراین راه حل های باز و مقیاس پذیر ارائه می شود.
Year: 2014
Publisher : ISBN
By : Lukas Spendla, Lukas Hrcka, Pavol Tanuska
File Information: English Language/ 6 Page / size: 693 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1393
ناشر : ISBN
کاری از : لوکاس اسپندلا، لوکاس هراکا، پاول تانوسکا
اطلاعات فایل : زبان انگلیسی / 6 صفحه / حجم : KB 693
نقد و بررسیها
هنوز بررسیای ثبت نشده است.