توضیحات
ABSTRACT
Big data integration process faced structural heterogeneity and semantic heterogeneity problems. An ontology is an explicit specification of a conceptualization, which is the core of semantic web technologies that can be used to describe the semantics of the metadata. This paper builds a big data model based on ontology by exploiting semantic web technology, and propose an ontology-based semantic model and ontology-based Key/Value storage model, meanwhile giving detailed steps for building the model. The model proposed try to solve the issue of understanding between heterogeneous data systems. Finally, we give an example of the semantic model application, which has been verified on HBase-based prototype system.
INTRODUCTION
ecently, Big Data has been getting increasingly attention and recognition due to its broad research and application prospects . Big data generally refers to large-scale, rapid changes in many types. The data sets are usually integrated data from different sources in a structured, semi-structured, and unstructured data collection. The unstructured and semi-structured data more than 85%. Big Data applications often involve multiple data sources, there are structural heterogeneity and semantic heterogeneity problems between the data sources . Refers to structural heterogeneity of different data stored in the data model could not be directly mapped to each other. Semantic heterogeneous data that describe the terms inconsistent with each other could not understand each other, and unable to reflect the link between the data sets. How to solve the problem of structural heterogeneity and semantic heterogeneity is one of the major challenges facing big data. There are already some big data applications research will introduce the Semantic Web technology, semantic links, the establishment of a unified data model for big data, such as RDF (Resource Description Framework) model. RDF model is a simple ontology model can provide analysis based on the “knowledge” . Ontology is the core of the Semantic Web technology, which is also an important method to conceptualize domain knowledge and modeling that can be used to describe the semantics of the data.
چکیده
فرآیند ادغام داده بزرگ با ناهمگونی ساختاری و مشکلات ناهمگنی معنایی مواجه شد. هستیشناسی یک مشخصه صریح مفهومی است که هسته فن آوری های وب معنایی است که می تواند برای توصیف معانی متادیتا استفاده شود. این مقاله یک مدل داده بزرگ بر مبنای هستی شناسی با استفاده از فناوری وب معنایی ایجاد می کند و یک مدل معنایی مبتنی بر هستی شناسی و مدل ذخیره سازی کلید / ارزش مبتنی بر هستی شناسی را پیشنهاد می دهد و در عین حال مراحل دقیق برای ساختن مدل را ارائه می دهد. مدل پیشنهاد شده سعی در حل مسئله درک بین سیستم های داده های ناهمگن دارد. در نهایت، ما نمونه ای از برنامه کاربردی مدل معنایی که براساس سیستم نمونه اولیه مبتنی بر HBase تأیید شده است، ارائه می کنیم.
مقدمه
به طور محسوسی، داده های بزرگ با توجه به تحقیقات گسترده و چشم انداز برنامه های کاربردی، به طور فزاینده ای توجه و شناخت بیشتر شده است. داده های بزرگ به طور کلی به تغییرات در مقیاس بزرگ، تغییرات سریع در بسیاری از انواع اشاره دارد. مجموعه داده ها معمولا داده های یکپارچه از منابع مختلف را در یک جمع آوری اطلاعات ساختاری، نیمه ساخت یافته و غیر ساختاری فراهم می کنند. داده های ساختار یافته و نیمه ساخت یافته بیش از 85٪. برنامه های داده بزرگ اغلب شامل چندین منبع داده هستند، ناهمگونی ساختاری و مشکلات ناهمگنی معنایی بین منابع داده وجود دارد. اشاره به ناهمگونی ساختاری داده های مختلف ذخیره شده در مدل داده نمی تواند مستقیما به یکدیگر متصل شود. داده های ناهمگونی معنایی که شرایط نامناسب را با یکدیگر تعریف می کنند نمی توانند یکدیگر را درک کنند و قادر به بازنویسی ارتباط بین مجموعه داده ها نیستند. چگونگی حل مسئله ناهمگونی ساختاری و ناهمگنی معنایی یکی از چالش های عمده ای است که با داده های بزرگ مواجه است. در حال حاضر تحقیقات زیادی در زمینه استفاده از داده ها وجود دارد، فن آوری وب معنایی، لینک های معنایی، ایجاد یک مدل داده یکپارچه برای داده های بزرگ، مانند RDF (چارچوب توضیح منابع)، معرفی خواهد شد. مدل RDF یک مدل هستی شناسی ساده می تواند تجزیه و تحلیل را بر اساس “دانش” ارائه دهد. هستیشناسی هسته فن آوری وب معنایی است که همچنین یک روش مهم برای مفهوم سازی دانش دامنه و مدل سازی است که می تواند برای توصیف معنایی داده ها استفاده شود.
Year: 2014
Publisher : ISSN
By : Li Kang, Li Yi, LIU Dong
File Information: English Language/ 6 Page / size: 681 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1393
ناشر : ISSN
کاری از : لی کانگ، لی یی، لیو دونگ
اطلاعات فایل : زبان انگلیسی / 6 صفحه / حجم : KB 681
نقد و بررسیها
هنوز بررسیای ثبت نشده است.