• 0سبد خرید فروشگاه
تعلیم
  • صفحه اصلی
  • محصولات
    • همه تعلیم ها
      • اقتصاد-Economy
        • علوم بورس-Science stock
        • علوم بانکداری-Banking science
        • علوم تجارت-Business Sciences
      • علوم برق-Electrical Sciences
        • مقالات برق-Electrical Articles
        • علوم الکترونیک-Electronic science
      • علوم زیست شناسی-Biological Sciences
        • زمین شناسی-Geology
          • مقالات جغرافیا-Geography Papers
      • علوم اجتماعی-social Sciences
      • علوم ایمنی و بهداشت-Health and safety
        • مقالات ایمنی و بهداشت – Health and safety
      • علوم پزشکی-Medical Sciences
        • علوم روانشناسی-Psychological Science
          • روانشناسی موفقیت-Psychology of success
        • مقالات پزشکی-medical articles
        • مقالات آنتی بیوتیک-Articles antibiotics
        • مقالات دندانپزشکی-Dental articles
      • علوم ریاضیات و فیزیک-Science, mathematics and physics
        • مقالات ریاضی – Mathematical articles
        • مقالات فیزیک-Physics articles
      • علوم زبان انگلیسی-Science in English
      • علوم سیاسی-political science
      • علوم شیمی-Chemical Sciences
        • مقالات شیمی-Chemistry Articles
        • مقالات پتروشیمی-Petrochemical articles
      • علوم صنایع غذایی-Food Industry Science
        • علوم تغذیه-nutrition science
      • علوم صنایع-Industrial science
        • مهندسی مواد-Materials Engineering
          • مقالات متالورژی- Metallurgy Articles
      • علوم عمران-Civil Sciences
        • مقالات عمران-Civil Articles
      • علوم کامپیوتر-computer science
        • مقالات فناوری اطلاعات-Articles of Information Technology
        • مقالات کامپیوتر-Computer Articles
          • دیتابیس-database
          • داده کاوی-Data Mining
          • داده های عظیم-Big data
          • رایانش ابری-cloud computing
          • هادوپ-Hadoop
          • سیستم فازی-Fuzzy System
      • علوم کشاورزی-Agricultural Sciences
        • مقالات کشاورزی-Agricultural Articles
        • مقالات شیلات-Fisheries Articles
        • مقالات محیط زیست-Environmental articles
      • علوم مالی و اداری-Financial and Administrative Science
        • مقالات حسابداری-Accountant Articles
      • علوم مدیریت-Management Sciences
        • مدیریت کسب و کار-business management
        • مقالات مدیریت-Management Articles
        • مقالات کارآفرینی-Entrepreneurship articles
      • علوم تربیت بدنی-Physical Education Sciences
      • علوم ورزشی-Sports Sciences
      • علوم معماری-Architectural Science
      • علوم هنر-Art Science
      • علوم مکانیک-Mechanical Sciences
        • مقالات مکانیک-Mechanical Articles
      • مذهبی-Religious
      • ادبیات-Literature
        • مقالات زبان فارسی-Articles in Persian language
  • مجله اینترنتی
  • حساب کاربری من
  • آموزش دانلود
  • قوانین سایت
  • درباره ما
  • جستجو
  • منو منو
A hybrid evolutionary algorithm for attribute selection in data mining[taliem.ir]

A hybrid evolutionary algorithm for attribute selection in data mining

۰ تومان

Real life data sets are often interspersed with noise, making the subsequent data mining process difficult. The task of the classifier could be simplified by eliminating attributes that are deemed to be redundant for classification, as the retention of only pertinent attributes would reduce the size of the dataset and subsequently allow more comprehensible analysis of the extracted patterns or rules. In this article, a new hybrid approach comprising of two conventional machine learning algorithms has been proposed to carry out attribute selection. Genetic algorithms (GAs) and support vector machines (SVMs) are integrated  effectively based on a wrapper approach. Specifically, the GA component searches for the best attribute set by applying the principles of an evolutionary process. The SVM then classifies the patterns in the reduced datasets, corresponding to the attribute subsets represented by the GA chromosomes. The proposed GA- SVM hybrid is subsequently validated using datasets obtained from the UCI machine learning repository.  Simulation results demonstrate that the GA-SVM hybrid produces good classification accuracy and a higher level of consistency that is comparable to other established algorithms. In addition, improvements are made to the hybrid by using a correlation measure between attributes as a fitness measure to replace the weaker members in the population with newly formed chromosomes. This injects greater diversity and increases the overall fitness of the population. Similarly, the improved mechanism is also validated on the same data sets used in the first stage. The results justify the improvements in the classification accuracy and demonstrate its potential to be a good classifier for future data mining purposes.

دسته: داده کاوی-Data Mining, علوم کامپیوتر-computer science, مقالات کامپیوتر-Computer Articles, مقالات-Article برچسب: Attribute selection, data mining., Evolutionary algorithms, Pattern classification, support vector machines
  • توضیحات
  • نظرات (0)

توضیحات

ABSTRACT

Real life data sets are often interspersed with noise, making the subsequent data mining process difficult. The task of the classifier could be simplified by eliminating attributes that are deemed to be redundant for classification, as the retention of only pertinent attributes would reduce the size of the dataset and subsequently allow more comprehensible analysis of the extracted patterns or rules. In this article, a new hybrid approach comprising of two conventional machine learning algorithms has been proposed to carry out attribute selection. Genetic algorithms (GAs) and support vector machines (SVMs) are integrated  effectively based on a wrapper approach. Specifically, the GA component searches for the best attribute set by applying the principles of an evolutionary process. The SVM then classifies the patterns in the reduced datasets, corresponding to the attribute subsets represented by the GA chromosomes. The proposed GA- SVM hybrid is subsequently validated using datasets obtained from the UCI machine learning repository.  Simulation results demonstrate that the GA-SVM hybrid produces good classification accuracy and a higher level of consistency that is comparable to other established algorithms. In addition, improvements are made to the hybrid by using a correlation measure between attributes as a fitness measure to replace the weaker members in the population with newly formed chromosomes. This injects greater diversity and increases the overall fitness of the population. Similarly, the improved mechanism is also validated on the same data sets used in the first stage. The results justify the improvements in the classification accuracy and demonstrate its potential to be a good classifier for future data mining purposes.

INTRODUCTION

In today’s context, data mining has developed into an important application due to the abundance of data and the imperative to extract useful information from raw data. Many useful data patterns can be selected out, which helps predict outcomes of unprecedented scenarios. The knowledge gained from data mining can also be subsequently used for different applications ranging from business management to medical diagnosis. Decision makers can hence make a more accurate assessment of situations based on this attained  knowledge. Support vector machines (SVMs) have recently gained recognition as a powerful data mining technique to tackle the problem of knowledge extraction (Burges Christopher, 1998). SVMs use kernel  functions to transform input features from lower to higher dimensions. Many practical applications exploit the efficiency and accuracy of SVMs, such as intrusion detection (Mukkamala, Janoski, & Sung, 2002) and  bioinformatics where the input features are of very high dimensions.

چکیده

مجموعه داده های واقعی زندگی اغلب با سر و صدا ظاهر می شود، و فرآیند پردازش داده ها پس از آن دشوار است. وظیفه طبقه بندی می تواند با حذف ویژگی هایی که برای طبقه بندی بیش از حد مورد توجه قرار می گیرد، ساده می شود، زیرا حفظ تنها ویژگی های مرتبط، اندازه مجموعه داده را کاهش می دهد و پس از آن امکان تجزیه و تحلیل قابل درک بیشتر از الگوهای یا قوانین استخراج را فراهم می کند. در این مقاله، یک روش ترکیبی جدید شامل دو الگوریتم یادگیری ماشین متداول برای انجام ویژگی انتخاب ارائه شده است. الگوریتم های ژنتیکی (GAs) و ماشین های بردار پشتیبانی (SVM ها) به صورت مؤثر بر مبنای رویکرد بسته بندی می شوند. به طور خاص، کامپوننت GA برای بهترین مشخصه ای که با استفاده از اصول یک فرایند تکاملی تعیین می شود، جستجو می کند. SVM سپس الگوها را در مجموعه داده های کاهش یافته طبقه بندی می کند، که مربوط به زیر مجموعه های ویژگی های نشان داده شده توسط کروموزوم های GA می باشد. ترکیبی پیشنهاد شده GA-SVM پس از آن با استفاده از مجموعه داده های به دست آمده از مخزن یادگیری ماشین UCI تأیید می شود. نتایج شبیه سازی نشان می دهد که ترکیبی GA-SVM دقت طبقه بندی خوب و سطح بالاتر سازگاری را می دهد که قابل مقایسه با سایر الگوریتم های ایجاد شده است. علاوه بر این، با استفاده از یک معیار همبستگی بین صفات به عنوان اندازه گیری تناسب اندام برای جایگزینی اعضای ضعیف در جمعیت با کروموزوم های تازه شکل گرفته، به ترکیبی تبدیل می شود. این باعث تنوع بیشتری می شود و تناسب کلی جمعیت را افزایش می دهد. به طور مشابه، مکانیزم بهبود یافته نیز بر روی مجموعه داده های مشابه در مرحله اول تأیید شده است. نتایج بهبود پیشرفت در دقت طبقه بندی را توجیه می کنند و توان بالقوه خود را برای طبقه بندی مناسب برای اهداف داده های آینده نشان می دهد.

مقدمه

در زمینه امروز، داده کاوی به دلیل فراوانی داده ها و ضرورت استخراج اطلاعات مفید از داده های خام به یک برنامه مهم تبدیل شده است. بسیاری از الگوهای اطلاعات مفید می توانند انتخاب شوند، که به پیش بینی نتایج سناریوهای بی سابقه کمک می کند. دانش مورد استفاده در استخراج داده ها همچنین می تواند برای برنامه های کاربردی مختلف از جمله مدیریت کسب و کار تا تشخیص پزشکی استفاده شود. از این رو تصمیم گیرندگان می توانند ارزیابی دقیق تر از شرایط مبتنی بر این دانش به دست آورد. ماشین های بردار پشتیبانی (SVM ها) اخیرا به عنوان یک روش قدرتمند داده کاوی برای مقابله با مشکل استخراج دانش به رسمیت شناخته شده اند (Burges Christopher، 1998). SVM ها از توابع هسته برای تبدیل ویژگی های ورودی از ابعاد پایین تر به بالاتر استفاده می کنند. بسیاری از کاربردهای عملی بهره وری از کارایی و دقت SVM ها، از جمله تشخیص نفوذ (Mukkamala، Janoski، & Sung، 2002) و بیوانفورماتیک که ویژگی های ورودی از ابعاد بسیار بالایی است، بهره می برند.

Year: 2009

Publisher : ELSEVIER

By :  K.C. Tan , E.J. Teoh , Q. Yu , K.C. Goh

File Information: English Language/ 15 Page / size: 568 KB

Only site members can download free of charge after registering and adding to the cart

Download tutorial

سال : 1388

ناشر : ELSEVIER

کاری از : K.C. قهوهای مایل به زرد، E.J. Teoh، Q. Yu، K.C. گوه

اطلاعات فایل : زبان انگلیسی / 15 صفحه / حجم : KB 568

فقط اعضای سایت پس از ثبت نام و اضافه کردن به سبد خرید می توانند دانلود رایگان کنند.خوشحال می شویم به ما پبیوندید

آموزش دانلود

نقد و بررسی‌ها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین کسی باشید که دیدگاهی می نویسد “A hybrid evolutionary algorithm for attribute selection in data mining” لغو پاسخ

برای فرستادن دیدگاه، باید وارد شده باشید.

محصولات مرتبط

  • کتاب آموزش بوت استرپ

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • دانلودکتاب آموزش MVC

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • کتاب آموزشی ویژوال بیسیک

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • کتاب کلان داده (bigdata)

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات

درباره فروشگاه

  • ایران
  • تعلیم مرکزی از دانش و علم و فناوریست ،جایی است که کلی مقاله و پروپزال رایگان در اختیار شما کاربران عزیز قرار می گیرد
  • info[at]taliem.ir

دوست عزیز شما می توانید فایل های رایگانی از جمله : نرم افزار ، کتاب ، جزوه ، مقاله و پروپوزال و غیره را از سایت تعلیم دانلود کنید و لازم به ذکر است که 80 در صد محصولات سایت تعلیم به صورت کاملا رایگان ارائه می شود.

در صورتی که فایل یا مقاله ای در سایت نشر داده شده است که دارای حق نشر می باشد خواهشمند است نویسنده یا ناشر با ایمیل زیر ما را در جریان قرار دهد تا از سایت حذف گردد

                taliemsite[@]gmail.com

شما را از پربازدید ترین مقالات مطلع می کنیم

دوست خوبم در صورت هر سوال یا مشکل از طریق تلفن یا پست الکترونیکی زیر می توانیم بهترین خدمات را به شما ارائه دهیم و مطمئن باشید تمام سعی خود را جهت ارائه بهترین خدمت به شما تقدیم خواهیم کرد.

تلفن:07734236086[دور کار-با ایمیل باشما هستیم]

پست الکترونیک : info[@]taliem.ir

اینستاگرام : taliemsit

تعلیم دانشگاهی برای تمام علوم
  • Facebook
  • Twitter
  • LinkedIn
  • Instagram
  • Pinterest
  • Reddit
Grey wolf optimization applied to economic load dispatch problemsGrey wolf optimization applied to economic load dispatch problems[taliem.ir]Energy Efficient Green Routing Protocol for[taliem.ir]Energy Efficient Green Routing Protocol for Internet of Multimedia Things
رفتن به بالا