توضیحات
چکیده
علم داده کاوی و کشف اطلاعات ارزشمند از حجم عظیم داده ها، یکی از حوزه های تحقیقاتی جذاب و پرکاربردی است که طی دو ده ه گذشته بسیار توسعه پیدا کرده است. در میان تکنیک های مختلف داده کاوی، قوانین وابستگی به دلیل کاربرد وسیع در بازاریابی و همچنین تحلیل سبد خرید مشتریان بسیار مورد توجه قرار گرفته است.علاوه بر مباحث بازاریابی، محققان موارد بسیار زیادی از کاربردهای قوانین وابستگی در حوزه های مختلف علمی یافته اند که در این میان می توان به کاربرد این تکنیک در حوزه های پزشکی، اقتصادی، و همچنین مدیریت تولید و بهبود کیفیت تولیدات اشاره نمود.استفاده از قواعد وابستگی یکی از زیر شاخه های علم داده کاوی است که می تواند بر اساس رفتار داده ها در مواجه با داده های گذشته به پیش بینی رفتار آینده آنها بپردازد. لذا پیش بینی رفتار در هر مکان و علمی از اهمیت فوق العاده بالایی برخوردار خواهد بود.به همین دلیل در این بخش به بررسی الگوریتم های موجود در داده کاوی که در بحث استفاده از قواعد وابستگی کاربرد دارند پرداخته و در انتها بهترین الگوریتم را که برای پیش بینی و تشخیص نفوذ کاربرد دارد مورد ارزیابی با سایر الگوریتم ها قرار می دهیم.
مقدمه
قوانين وابستگی اولين بار توسط اگراوال در سال 1993معرفی شد و پس از آن بسياری از محققان آن را توسعه دادند. یک قانون وابستگی به صورت یک عبارت X →Yبيان می شود كه در آن Xمجموعه ای از اقلام و Yیک قلم می باشد؛ و به این که اگر مجموعه اقلام X رخ دهد آنگاه قلم Y با احتمال مشخصی رخ خواهد داد. اگر مجموعه اقلام Xرخ دهد آنگاه قلم Yبا احتمال مشخصی رخ خواهد داد. به عنوان مثال عبارت (نان → پنير، شير )در تحليل سبد خرید آنگاه مشتریان بيانگر این اس كه اگر مشتری پنير و شير را به طور همزمان خریداری كند، آنگاه نان را هم با احتمال مشخصی خریداری می كند. وظيفه اصلی قوانين وابستگی، شناسایی الگوهای پنهان ميان اقلام موجود در پایگاه داده های بزرگ می باشد. در الگوریتم قوانين وابستگی استاندارد جه یافتن قوانين جذاب و كارا، برای هر قانون دو مقدار عددی پشتيبانی و اطمينان به صورت زیر محاسبه می شود: (sup) پشتيبانی: نسب تعداد تراكنش ها 1با همه اقلام موجود در قانون به تعداد تراكنش ها (conf) اطمينان:نسبت تعداد تراكنش ها با همه اقلام موجود در قانون به تعداد تراكنش ها با اقلام موجود در جمله شرط.
ABSTRACT
The science of data mining and the discovery of valuable information from the massive amount of data is one of the most attractive and popular research areas that has developed considerably over the past two decades. Among the various data mining techniques, affiliate laws have become very much considered due to their widespread use in marketing as well as customer shopping cartography. In addition to marketing topics, researchers have found many cases of applications of dependency laws in various scientific domains. The use of this technique in medical, economic, as well as production management and product quality improvement can be mentioned. Using dependency rules is one of the sub-branches of data mining that can be based on the data behavior. With past data to predict their future behavior. Therefore, prediction of behavior in any location and science will be extremely important. For this reason, in this section, we examine the algorithms used in data mining, which are used in the discussion of the use of dependency rules, and finally, the best algorithm for Prediction and Intrusion Detection are being evaluated with other algorithms.
INTRODUCTION
The laws of affiliation were first introduced by Aragwaal in 1993, and subsequently developed by many researchers. If the set of items X occurs, then the pen Y will occur with a certain probability. The main task of the dependency rules is to identify hidden patterns among the items in the large databases. The algorithm association rules Standard What laws charming and efficient, for each of the two numeric value the support and confidence to be calculated: (sup) support to apply the number of transactions 1. All items in the number of transactions (conf) Confidence: The ratio of the number of transactions with all items in the law to the number of transactions with the items in the sentence.
Year: 2018
Publisher : Second National Conference on Knowledge and Technology of Electrical Engineering, Computer and Mechanics of Iran
By : Mostafa Shahijanpour, Marzieh Kabouri, Hossein Omidi and Zahra Rahmatipour
File Information: English Language/ 10 Page / size: 444 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1397
ناشر : دومین همایش ملی دانش و فناوری مهندسی برق، کامپیوتر و مکانیک ایران
کاری از : مصطفی شاهیجانپور ،مرضیه نگهداری ، هوشیار امیدی و زهرا رحمتی پور
اطلاعات فایل : زبان فارسی / 10 صفحه / حجم : KB 444
نقد و بررسیها
هنوز بررسیای ثبت نشده است.