Semantic Management of Streaming Data[taliem.ir]

Semantic Management of Streaming Data

ABSTRACT

One of the fundamental challenges facing the unprecedented data deluge produced by the sensor networks  is how to manage time-series streaming data so that they can be reasoning-ready and provenance-aware.  Semantic web technology shows great promise but lacks adequate support for the notion of time. We present a system for the representation, indexing and querying of time-series data, especially streaming data, using the semantic web approach. This system incorporates a special RDF vocabulary and a semantic  interpretation for time relationships. The resulting framework, which we refer to as Time-Annotated RDF,  provides basic functionality for the representation and querying of time-related data. The capabilities of Time-Annotated RDF were implemented as a suite of Java APIs on top of Tupelo, a semantic content management middleware, to provide transparent integration among heterogeneous data, as present in streams and other data sources, and their metadata. We show how this system supports commonly used time-related queries using TimeAnnotated SPARQL introduced in this paper as well as an analysis of the TA-RDF data model. Such prototype system has already seen successful usage in a virtual sensor project where near-real-time radar  data streams need to be fetched, indexed, processed and re-published as new virtual sensor streams.

INTRODUCTION

  In this paper we present a semantic stream manager aimed at the problem of integrating streaming data into RDF and semantic-web enabled infrastructure and applications. We introduce TA-RDF, a formal model to  semantically represent streams and a software implementation to efficiently access those streams.  This has enabled integration of stream data with other data and metadata, including documents, imagery, workflows, provenance, and annotations. The TA-RDF model remains translatable/compatible with regular RDF by  means of an special RDF vocabulary, which allows the use of existing RDF tools and technologies.  The necessity for such model becomes evident when observing the rapid development and deployment of  various scales of sensor networks for various observation purposes, which have resulted in an  unprecedented data deluge. One of the major challenges is to support various temporal relationship queries. In addition, sensor data streams publishing and re-publishing after certain processing require provenance support for validation and verification . It would be advantageous to manage streaming data and their provenance (meta data about the causal relationship, history linkage etc.) coherently.

چکیده

یکی از چالش های اساسی که موجب بی نظمی داده های تولید شده توسط شبکه های حسگر شده است، نحوه مدیریت جریان داده های سری زمانی است تا بتوانند به صورت منطقی آماده و آگاه باشند. تکنولوژی وب معنایی، وعده بزرگ را نشان می دهد، اما از لحاظ زمان، پشتیبانی کافی از آن را ندارد. ما یک سیستم برای نمایندگی، نمایه سازی و پرس و جو از داده های سری زمانی، به ویژه جریان داده ها، با استفاده از رویکرد وب معنایی ارائه می کنیم. این سیستم دارای یک واژگان RDF ویژه و یک تفسیر معنایی برای روابط زمان است. چارچوب حاصل، که ما آن را به عنوان RDF تعریف شده با زمان اشاره می کنیم، قابلیت های اساسی برای نمایش و پرس و جو از اطلاعات مرتبط با زمان را فراهم می کند. قابلیت RDF با عنوان خوانده شده به عنوان مجموعه ای از API های جاوا در بالای Tupelo، middleware مدیریت معنایی محتوا، برای ارائه یکپارچگی شفاف بین داده های ناهمگن، مانند موجود در جریان ها و سایر منابع داده ها و ابرداده آنها، اجرا شد. ما نشان می دهیم که چگونه این سیستم از درخواست های مرتبط با زمان مورد استفاده با استفاده از SPARQL TimeAnnotated معرفی شده در این مقاله و همچنین تجزیه و تحلیل مدل داده TA-RDF پشتیبانی می کند. چنین سیستم نمونه اولیه قبلا استفاده موفق در یک پروژه حسگر مجازی را دیده است که جریان داده های رادار را در نزدیکی زمان واقعی باید به عنوان جدید جریان مجازی مجازی به دست آورد، نشان داده شده، پردازش شده و مجددا منتشر شود.

مقدمه

در این مقاله ما یک مدیر جریان معنایی با هدف حل یکپارچه سازی داده های جریان داده به RDF و زیرساخت ها و برنامه های کاربردی تحت وب تحت وب معنایی ارائه می کنیم. ما TA-RDF را معرفی می کنیم که یک مدل رسمی برای نشان دادن روان شناختی و اجرای نرم افزاری برای دسترسی موثر به آن جریان است. این امر ادغام داده های جریان داده را با سایر داده ها و فراداده ها، از جمله اسناد، تصاویر، جریان های کاری، پروژۀ و حاشیه نویسی، فعال کرده است. مدل TA-RDF همچنان قابل ترجمه / سازگاری با RDF به طور منظم با استفاده از یک واژگان RDF خاص است که اجازه استفاده از ابزار و فن آوری RDF موجود را می دهد. لزوم چنین مدل در هنگام مشاهده توسعه سریع و استقرار مقیاس های مختلف شبکه های حسگر برای اهداف مختلف مشاهده، که منجر به انفجار داده های بی سابقه ای می شود، آشکار می شود. یکی از مهمترین چالش ها، پشتیبانی از نمایش های مختلف زمانی است. علاوه بر این، جریان های داده های سنسور انتشارات و مجددا انتشار پس از پردازش خاص نیاز به حمایت از پرونده برای اعتبار سنجی و تایید. سودمند است برای مدیریت داده های جریان و مبدا آنها (متا اطلاعات مربوط به رابطه علی، پیوند تاریخ و غیره) هماهنگ.

Year: 2009

Publisher : ELSEVIER

By :  Alejandro Rodr´ıguez, Robert McGrath, Yong Liu, and James Myers

File Information: English Language/ 16 Page / size: 304 KB

Download

سال : 1388

ناشر : ELSEVIER

کاری از : الجاندرو رودریگز، رابرت مک گرات، یونگ لیو و جیمز مایرز

اطلاعات فایل : زبان انگلیسی / 16 صفحه / حجم : KB 304

لینک دانلود

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگو شرکت کنید؟
نظری بدهید!

دیدگاهتان را بنویسید