• سبد خرید فروشگاه سبد خرید فروشگاه
    0سبد خرید فروشگاه
تعلیم
  • صفحه اصلی
  • محصولات
    • همه تعلیم ها
      • فنی و مهندسی-Engineering Science
        • علوم برق-Electrical Sciences
          • مقالات برق-Electrical Articles
          • علوم الکترونیک-Electronic science
        • مهندسی مواد-Materials Engineering
          • مقالات متالورژی- Metallurgy Articles
        • علوم عمران-Civil Sciences
          • مقالات عمران-Civil Articles
        • علوم کامپیوتر-computer science
          • مقالات فناوری اطلاعات-Articles of Information Technology
          • مقالات کامپیوتر-Computer Articles
            • دیتابیس-database
            • داده کاوی-Data Mining
            • داده های عظیم-Big data
            • رایانش ابری-cloud computing
            • هادوپ-Hadoop
            • سیستم فازی-Fuzzy System
        • علوم مکانیک-Mechanical Sciences
          • مقالات مکانیک-Mechanical Articles
        • علوم معماری-Architectural Science
        • علوم کشاورزی-Agricultural Sciences
          • مقالات کشاورزی-Agricultural Articles
          • مقالات شیلات-Fisheries Articles
          • مقالات محیط زیست-Environmental articles
        • علوم شیمی-Chemical Sciences
          • مقالات شیمی-Chemistry Articles
          • مقالات پتروشیمی-Petrochemical articles
        • علوم صنایع-Industrial science
      • علوم انسانی-Humanities Science
        • اقتصاد-Economy
          • علوم بورس-Science stock
          • علوم بانکداری-Banking science
          • علوم تجارت-Business Sciences
        • علوم مدیریت-Management Sciences
          • مدیریت کسب و کار-business management
          • مقالات مدیریت-Management Articles
          • مقالات کارآفرینی-Entrepreneurship articles
        • علوم تربیت بدنی-Physical Education Sciences
          • علوم ورزشی-Sports Sciences
        • علوم اجتماعی-social Sciences
        • علوم مالی و اداری-Financial and Administrative Science
          • مقالات حسابداری-Accountant Articles
        • علوم زبان انگلیسی-Science in English
        • ادبیات-Literature
          • مقالات زبان فارسی-Articles in Persian language
        • علوم سیاسی-political science
        • مذهبی-Religious
        • علوم هنر-Art Science
      • علوم پایه-Base Science
        • علوم ریاضیات و فیزیک-Science, mathematics and physics
          • مقالات ریاضی – Mathematical articles
          • مقالات فیزیک-Physics articles
      • علوم پزشکی-Medical Sciences
        • علوم روانشناسی-Psychological Science
          • روانشناسی موفقیت-Psychology of success
        • مقالات پزشکی-medical articles
        • مقالات آنتی بیوتیک-Articles antibiotics
        • مقالات دندانپزشکی-Dental articles
      • علوم تجربی-experimental Science
        • علوم زیست شناسی-Biological Sciences
          • زمین شناسی-Geology
            • مقالات جغرافیا-Geography Papers
        • علوم صنایع غذایی-Food Industry Science
          • علوم تغذیه-nutrition science
        • علوم ایمنی و بهداشت-Health and safety
          • مقالات ایمنی و بهداشت – Health and safety
  • مجله اینترنتی
  • حساب کاربری من
  • آموزش دانلود
  • قوانین سایت
  • درباره ما
  • Click to open the search input field Click to open the search input field جستجو
  • منو منو
datamining.

روش های داده کاوی برای یافتن داده های تکراری در پایگاه داده های بزرگ

10,000 تومان

داده کاوی، پایگاه ها و مجموعه های حجیم داده را برای کشف و استخراج دانش، مورد تحلیل قرار می دهد. در سال های اخیر داده کاوی، با توجه به دسترسی گسترده به مقادیر بسیار زیاد داده و نیاز به تبدیل چنین داده هایی به اطلاعات و دانش مفید، در صنعت اطلاعات و در کل جامعه، توجه زیادی را به خود جلب کرده است. اطلاعات و دانش حاصل می تواند برای برنامه های کاربردی نظیر تجزیه و تحلیل بازار، تشخیص تقلب، حفظ مشتری، کنترل تولید و اکتشاف علمی و … استفاده شود. یکی از مشهورترین تکنیک های داده کاوی برای تصمیم گیرندگان تجاری در پایگاه داده های بزرگ استخراج قوانین وابستگی است. کشف قوانین وابستگی در قلب داده کاوی قرار دارد. پیدا کردن مجموعه داده های تکراری، فرآیند اصلی در یافتن قانون وابستگی است. الگوریتم های بسیار زیادی برای پیدا کردن الگوهای تکراری وجود دارند که در این مقاله تعدادی از آن ها ارایه شده است. Apriori و FP-tree متداول ترین روش ها برای یافتن آیتم های مکرر هستند. روش های دیگر از جمله Apriori TID، AIS، SETM و TR-FCTM² می باشند. Apriori با استفاده از تولید کاندیدا با تعداد بیشتری از اسکن های پایگاه داده، تعداد قابل ملاحظه ای آیتم تکراری پیدا می کند. FP-tree برای پیدا کردن آیتم های تکراری از دو اسکن پایگاه داده بدون استفاده از تولید کاندید استفاده می کند. روش TR-FCTM با ایجاد یکباره ی کاندیدها به منظور تشکیل جدول شمارش تکرار با یک اسکن پایگاه داده، آیتم های تکراری را پیدا می کند. بررسی ها نشان می دهد که الگوریتم TR-FCTM عملکرد بهتری نسبت به Apriori و FP-tree دارد.

دسته: داده کاوی-Data Mining, علوم کامپیوتر-computer science, مقالات-Article برچسب: اقلام تکراری, پایگاه داده بزرگ, تولید کاندید, داده کاوی, قانون وابستگی
  • توضیحات
  • نظرات (0)

توضیحات

چکیده

داده کاوی، پایگاه ها و مجموعه های حجیم داده را برای کشف و استخراج دانش، مورد تحلیل قرار می دهد. در سال های اخیر داده کاوی، با توجه به دسترسی گسترده به مقادیر بسیار زیاد داده و نیاز به تبدیل چنین داده هایی به اطلاعات و دانش مفید، در صنعت اطلاعات و در کل جامعه، توجه زیادی را به خود جلب کرده است. اطلاعات و دانش حاصل می تواند برای برنامه های کاربردی نظیر تجزیه و تحلیل بازار، تشخیص تقلب، حفظ مشتری، کنترل تولید و اکتشاف علمی و … استفاده شود. یکی از مشهورترین تکنیک های داده کاوی برای تصمیم گیرندگان تجاری در پایگاه داده های بزرگ استخراج قوانین وابستگی است. کشف قوانین وابستگی در قلب داده کاوی قرار دارد. پیدا کردن مجموعه داده های تکراری، فرآیند اصلی در یافتن قانون وابستگی است. الگوریتم های بسیار زیادی برای پیدا کردن الگوهای تکراری وجود دارند که در این مقاله تعدادی از آن ها ارایه شده است. Apriori و FP-tree متداول ترین روش ها برای یافتن آیتم های مکرر هستند. روش های دیگر از جمله Apriori TID، AIS، SETM و TR-FCTM² می باشند. Apriori با استفاده از تولید کاندیدا با تعداد بیشتری از اسکن های پایگاه داده، تعداد قابل ملاحظه ای آیتم تکراری پیدا می کند. FP-tree برای پیدا کردن آیتم های تکراری از دو اسکن پایگاه داده بدون استفاده از تولید کاندید استفاده می کند. روش TR-FCTM با ایجاد یکباره ی کاندیدها به منظور تشکیل جدول شمارش تکرار با یک اسکن پایگاه داده، آیتم های تکراری را پیدا می کند. بررسی ها نشان می دهد که الگوریتم TR-FCTM عملکرد بهتری نسبت به Apriori و FP-tree دارد.

 

مقدمه

در سالهای اخیر با بیشتر شدن کارهای کامپیوتری، پیشرفتی نمایی در تولید و کنترل اطلاعات الکترونیک به وجود آمده است. هر سازمان یا شرکتی به این نتیجه رسیده است که اطلاعات بشه دست آمده در طی سالیان متوالی یک مزیت استراتژیک با اهمیت است و نتایج مفید بالقوهی بسیاری در این مقادیر بسیار زیاد داده وجود نیازمند تکنیک دارند. از این رو هایی برای استخراج اطلاعات ارزشمند از این مجموعه داده ها هستیم .

 

ABSTRACT

Data mining, databases, and massive data collections for discovering and extracting knowledge. In recent years, data mining has attracted much attention in the information industry and in the whole society, given the vast amount of access to large amounts of data and the need to turn such data into useful information and knowledge. The resulting information and knowledge can be used for applications such as market analysis, fraud detection, customer retention, production control and scientific discovery. One of the most famous data mining techniques for business decision makers in large databases is extracting dependency laws. The discovery of dependency laws is at the heart of data mining. Finding duplicate datasets is the main process in finding dependency law. There are many algorithms to find duplicate patterns, some of which are presented in this article. Apriori and FP-tree are the most common ways to find items. Other methods include Apriori TID, AIS, SETM and TR-FCTM². Apriori finds a significant number of duplicate items using the candidate’s production with more database scans. FP-tree uses two scans of the database without the use of candidate production to find duplicate items. The TR-FCTM method finds duplicate items by creating candidates at once to create a repeat count table with a database scan. Studies show that the TR-FCTM algorithm performs better than Apriori and FP-tree.

 

INTRODUCTION

In recent years, with the increasing number of computer tasks, there has been an improvement in the production and control of electronic information. Any organization or company has come to the conclusion that the information obtained over the years has had a strategic advantage, and many beneficial results in these large amounts of data require techniques. These are ways to extract valuable information from this data set.

 

Year: 2018

Publisher : Second National Conference on Knowledge and Technology of Engineering Sciences of Iran

By : Azadeh Pirhati

File Information: Persian Language/ 6 Page / size: 412 KB

Download tutorial

سال : 1397

ناشر : : دومین کنفرانس ملی دانش و فناوری علوم مهندسی ایران

کاری از : آزاده پیرحیاتی

اطلاعات فایل : زبان فارسی / 6 صفحه / حجم : KB 412

آموزش دانلود

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “روش های داده کاوی برای یافتن داده های تکراری در پایگاه داده های بزرگ” لغو پاسخ

برای فرستادن دیدگاه، باید وارد شده باشید.

محصولات مرتبط

  • مشتری

    کتاب چگونه کلیک‌ها را به مشتری تبدیل کنیم

    39,000 تومان
    Add to cart Add to cart افزودن به سبد خرید نمایش جزئیات نمایش جزئیات نمایش جزئیات
  • کتاب کلان داده (bigdata)

    10,000 تومان
    Add to cart Add to cart افزودن به سبد خرید نمایش جزئیات نمایش جزئیات نمایش جزئیات
  • کتاب آموزش اتوکد

    10,000 تومان
    Add to cart Add to cart افزودن به سبد خرید نمایش جزئیات نمایش جزئیات نمایش جزئیات
  • کتاب پایگاه داده PostgreSQL

    10,000 تومان
    Add to cart Add to cart افزودن به سبد خرید نمایش جزئیات نمایش جزئیات نمایش جزئیات

درباره فروشگاه

تعلیم مرکزی از دانش و علم و فناوریست ،جایی است که کلی مقاله و پروپزال و کتاب در اختیار شما کاربران عزیز قرار می گیرد

دوست عزیز شما می توانید فایل هایی از جمله :  کتاب ، جزوه ، مقاله و پروپوزال علمی را از سایت تعلیم دانلود کنید و لازم به ذکر است که تعدادی از محصولات ارزشمند سایت تعلیم به صورت کاملا رایگان ارائه می شود.

در صورتی که فایل یا مقاله ای در سایت نشر داده شده است که دارای حق نشر می باشد خواهشمند است نویسنده یا ناشر با ایمیل زیر ما را در جریان قرار دهد تا از سایت حذف گردد

            info[at]taliem.ir

ارتباط با ما

تلفن :09916860636

ایمیل : info[at]taliem.ir

ساعت پاسخگویی : 8:00-14:00 (از شنبه تا چهارشنبه)

تعلیم دانشگاهی برای تمام علوم
  • لینک به Facebook
  • لینک به X
  • لینک به LinkedIn
  • لینک به Instagram
  • لینک به Pinterest
  • لینک به Reddit
لینک به: بررسی و تحلیل امنیت ترافیک شبکه با استفاده از فناوری داده های بزرگ لینک به: بررسی و تحلیل امنیت ترافیک شبکه با استفاده از فناوری داده های بزرگ بررسی و تحلیل امنیت ترافیک شبکه با استفاده از فناوری داده های بزرگ...data لینک به: مطالعه موردی داده کاوی توزیع شده در محیط های گرید لینک به: مطالعه موردی داده کاوی توزیع شده در محیط های گرید downloadمطالعه موردی داده کاوی توزیع شده در محیط های گرید...
رفتن به بالا رفتن به بالا رفتن به بالا