توضیحات
ABSTRACT
Video semantic concept detection is considered as an important research problem by the multimedia industry in recent years. Classification is the most accepted method used for concept detection, where, the output of the classification system is interpreted as semantic concepts. These concepts can be employed for automatic indexing, searching and retrieval of video objects. However, employed features have high dimensions and thus, concept detection with the existing classifiers experiences high computation complexity. In this paper, a new approach is proposed to reduce the classification complexity and the required time for learning and classification by choosing the most important features. For this purpose genetic algorithms are employed as a feature selector. Simulation results illustrate improvements in the behavior of the classifier.
INTRODUCTION
With the explosive growth of data (including text, sound and video), the need for automatic indexing, searching ,organizing, and categorizing of data is increased . Most of this data are multimedia ones including sound and videos. Hence, one of the most important research problems in this field is video concept detection. The main goal of video concept detection is to determine the presence (or absence) of certain semantic concepts such as “outdoor”, “airplane”, “car” and “person” in a video frame .Too much effort has been reported in the literature in order to decrease the semantic gap between the low-level features and the high-level ones. Examples include automatic concept detection and high-level feature extraction . The most popular approach in concept detection is to use a classification method to determine if a concept exists in a video frame or not. The most famous classifier for this type of problem is Support Vector Machine (SVM) . The output of the classification system can be interpreted as high-level semantic concepts used for retrieval and filtering in different types of videos.
چکیده
تشخیص مفهوم معنایی ویدئو به عنوان یک مسئله مهم تحقیق در صنعت چند رسانه ای در سال های اخیر در نظر گرفته شده است. طبقه بندی روش پذیرفته ترین روش برای شناسایی مفهوم است، در حالی که خروجی سیستم طبقه بندی به عنوان مفاهیم معنایی تفسیر می شود. این مفاهیم را می توان برای نمایه سازی خودکار، جستجو و بازیابی اشیاء ویدئویی استفاده کرد. با این حال، ویژگی های شغلی دارای ابعاد بالایی هستند و بنابراین شناسایی مفهوم با طبقه بندی های موجود، پیچیدگی محاسبات بالا را تجربه می کند. در این مقاله، یک روش جدید برای کاهش پیچیدگی طبقه بندی و زمان مورد نیاز برای یادگیری و طبقه بندی با انتخاب مهمترین ویژگی ها پیشنهاد شده است. برای این منظور الگوریتم های ژنتیکی به عنوان یک انتخابگر به کار گرفته می شوند. نتایج شبیه سازی نشان دهنده بهبود در رفتار طبقه بندی است.
مقدمه
با رشد انفجاری داده ها (از جمله متن، صدا و ویدئو)، نیاز به نمایه سازی خودکار، جستجو، سازماندهی و طبقه بندی داده افزایش می یابد. اکثر این داده ها شامل موارد چند رسانه ای از جمله صدا و ویدیو هستند. از این رو، یکی از مهمترین مشکلات تحقیقاتی در این زمینه شناسایی مفهوم ویدئو است. هدف اصلی شناسایی مفهوم ویدئو تعیین حضور (یا عدم) مفاهیم معانی خاصی از قبیل “در فضای باز”، “هواپیما”، “ماشین” و “شخص” در یک قاب ویدئویی است. تلاش های زیادی در ادبیات به منظور کاهش فاصله معنایی بین ویژگی های سطح پایین و سطح بالایی آن. نمونه هایی از جمله تشخیص مفهوم خودکار و استخراج ویژگی های سطح بالا است. رویکرد رایج ترین در شناسایی مفهوم استفاده از یک روش طبقه بندی برای تعیین اینکه آیا یک مفهوم در یک قاب ویدئویی وجود دارد یا نه. معروف ترین سازنده این نوع مشکل، پشتیبانی از Vector Machine (SVM) است. خروجی سیستم طبقه بندی می تواند به عنوان مفاهیم معنایی سطح بالا مورد استفاده برای بازیابی و فیلتر کردن در انواع مختلف فیلم ها تفسیر شود.
Year: 2010
Publisher : Eighteenth International Energy Conference of Iran
By : Marjan Momtazpour , Mohammad Hossein Saraee , and Maziar Palhang
File Information: English Language/ 6 Page / size: 818 KB
سال :1389
ناشر : هجدهمین کنفرانس بین المللی برق ایران
کاری از : مرجان ممتاز پور، محمدحسین سارای و مازیار پالانگ
اطلاعات فایل : زبان انگلیسی / 6 صفحه / حجم : KB 818
نقد و بررسیها
هنوز بررسیای ثبت نشده است.