• 0سبد خرید فروشگاه
تعلیم
  • صفحه اصلی
  • محصولات
    • همه تعلیم ها
      • اقتصاد-Economy
        • علوم بورس-Science stock
        • علوم بانکداری-Banking science
        • علوم تجارت-Business Sciences
      • علوم برق-Electrical Sciences
        • مقالات برق-Electrical Articles
        • علوم الکترونیک-Electronic science
      • علوم زیست شناسی-Biological Sciences
        • زمین شناسی-Geology
          • مقالات جغرافیا-Geography Papers
      • علوم اجتماعی-social Sciences
      • علوم ایمنی و بهداشت-Health and safety
        • مقالات ایمنی و بهداشت – Health and safety
      • علوم پزشکی-Medical Sciences
        • علوم روانشناسی-Psychological Science
          • روانشناسی موفقیت-Psychology of success
        • مقالات پزشکی-medical articles
        • مقالات آنتی بیوتیک-Articles antibiotics
        • مقالات دندانپزشکی-Dental articles
      • علوم ریاضیات و فیزیک-Science, mathematics and physics
        • مقالات ریاضی – Mathematical articles
        • مقالات فیزیک-Physics articles
      • علوم زبان انگلیسی-Science in English
      • علوم سیاسی-political science
      • علوم شیمی-Chemical Sciences
        • مقالات شیمی-Chemistry Articles
        • مقالات پتروشیمی-Petrochemical articles
      • علوم صنایع غذایی-Food Industry Science
        • علوم تغذیه-nutrition science
      • علوم صنایع-Industrial science
        • مهندسی مواد-Materials Engineering
          • مقالات متالورژی- Metallurgy Articles
      • علوم عمران-Civil Sciences
        • مقالات عمران-Civil Articles
      • علوم کامپیوتر-computer science
        • مقالات فناوری اطلاعات-Articles of Information Technology
        • مقالات کامپیوتر-Computer Articles
          • دیتابیس-database
          • داده کاوی-Data Mining
          • داده های عظیم-Big data
          • رایانش ابری-cloud computing
          • هادوپ-Hadoop
          • سیستم فازی-Fuzzy System
      • علوم کشاورزی-Agricultural Sciences
        • مقالات کشاورزی-Agricultural Articles
        • مقالات شیلات-Fisheries Articles
        • مقالات محیط زیست-Environmental articles
      • علوم مالی و اداری-Financial and Administrative Science
        • مقالات حسابداری-Accountant Articles
      • علوم مدیریت-Management Sciences
        • مدیریت کسب و کار-business management
        • مقالات مدیریت-Management Articles
        • مقالات کارآفرینی-Entrepreneurship articles
      • علوم تربیت بدنی-Physical Education Sciences
      • علوم ورزشی-Sports Sciences
      • علوم معماری-Architectural Science
      • علوم هنر-Art Science
      • علوم مکانیک-Mechanical Sciences
        • مقالات مکانیک-Mechanical Articles
      • مذهبی-Religious
      • ادبیات-Literature
        • مقالات زبان فارسی-Articles in Persian language
  • مجله اینترنتی
  • حساب کاربری من
  • آموزش دانلود
  • قوانین سایت
  • درباره ما
  • جستجو
  • منو منو
bannertaliem-taliem-ir

بهبود دسته بندي متون فارسي در روش همسایگی وزن دار

۰ تومان

با رشد روز افزون منابع اطلاعاتي و حجم مقالات و مطالب توليد شده در زمينه هاي مختلف و به شکل هاي متنوع اعم ازرسانه های مختلف ديجيتال نياز به دسترسي آسان اطلاعات نيز افزايش مييابد. يکي از نياز هاي اوليه در بالا بردن سرعت دسترسي که اطلاعات و پردازش اين مطالب که غالباً داراي حجم بالايي نيز ميباشند، دسته بندي اين اطلاعات در طبقات مختلف ميباشد. دسته بندي متون به عم برچسب زدن يا تفکيک يک متن در قالب يکي از دسته هاي از پيش تعیین شده گفته ميشود. در اين مقاله به بررسي عملکرد الگوريتم WKNN3با استفاده از معيار وزن دهي tf-idfميپردازيم. همچنکين براي بالابردن دقت در انتخاب طبقه صحيح و به منظور افزايش کارايي الگوريتم از روش ميانگین گيري از داده ها به عنوان معيار ارزيابي استفاده میکنیم. نتايج به دست آمده از تفکيک متون فارسی با استفاده از روش هاي فوق نشان دهنده دقت 98درصد ميباشد.

دسته: مقالات زبان فارسی-Articles in Persian language, مقالات-Article برچسب: دسته بندی متن, کامپیوتر, وزن دهی تطبیقی
  • توضیحات
  • نظرات (0)

توضیحات

چکیده

با رشد روز افزون منابع اطلاعاتي و حجم مقالات و مطالب توليد شده در زمينه هاي مختلف و به شکل هاي متنوع اعم ازرسانه های مختلف ديجيتال نياز به دسترسي آسان اطلاعات نيز افزايش مييابد. يکي از نياز هاي اوليه در بالا بردن سرعت دسترسي که اطلاعات و پردازش اين مطالب که غالباً داراي حجم بالايي نيز ميباشند، دسته بندي اين اطلاعات در طبقات مختلف ميباشد. دسته بندي متون به عم برچسب زدن يا تفکيک يک متن در قالب يکي از دسته هاي از پيش تعیین شده گفته ميشود. در اين مقاله به بررسي عملکرد الگوريتم WKNN3با استفاده از معيار وزن دهي tf-idfميپردازيم. همچنکين براي بالابردن دقت در انتخاب طبقه صحيح و به منظور افزايش کارايي الگوريتم از روش ميانگین گيري از داده ها به عنوان معيار ارزيابي استفاده میکنیم. نتايج به دست آمده از تفکيک متون فارسی با استفاده از روش هاي فوق نشان دهنده دقت 98درصد ميباشد.

 

مقدمه

با پیشرفت در علوم کامپیوتری وگسترش کاربرد ان در تمام زمینه ها , حجم ذخیره و پردازش اطلاعات افزایش یافته و امکان دسترسی به این اطلاعات از محل های دیگر نیز با استفاده از شبکه های موجود بین کامپیوترها امکان پذیر شده است . به منظور بهبود نحوه دسترسی به این اطلاعات وجود سیستم هایی برای انجام اعمالی از قبیل فیلترینگ ,طبقه بندی ,جستجو…ضروری میباشد.دسته بندی متن فرایند تصمیم گیری برای نسبت دادن یک متن به یک گروه خاص از متون میباشد. از سیستم برای دسته بندی متن ها یا سایت ها برای دسترسی آسان به اطلاعات انها استفاده میشود. به منظور دسته  بندی متون میتوان از الگوریتم های متنوعی استفاده نمود که از آن جمله میتوان به شبکه های عصبی , نزدیکترین همسایگی , Naive ، SVM Bayes
و غیره اشاره نمود.

 

 

ABSTRACT

With the increasing growth of information sources and the volume of articles and materials produced in various fields and in various forms, including various digital media, the need for easy access to information also increases. One of the primary requirements for speeding up access to information and processing of these materials, which are often high volume, is to classify this information in different categories. The categorization of texts is referred to as the purpose of tagging or separating a text in the form of one of the preset categories. In this paper, we examine the performance of the WKNN3 algorithm using the tf-idf weighing criterion. Also, we use the method of data interagency as an evaluation criterion in order to raise the accuracy of choosing the correct class and in order to increase the efficiency of the algorithm. The results obtained from the separation of Persian texts using the above methods show a precision of 98%.

INTRODUCTION

With the advancement of computer science and its application in all fields, the volume of storage and processing of information has increased and access to this information from other locations is also possible using existing networks between computers. In order to improve the access to this information, there is a need for systems to perform actions such as filtering, classifying, searching … The text field is the decision process to assign a text to a specific group of texts. The system is used to categorize texts or sites for easy access to their information. Various algorithms can be used to categorize texts, including neural networks, closest neighbors, Naive, SVM Bayes
And so on.

Year: 2012

Publisher : The first international conference on Persian language and language processing

By : Farzin Yaghmaie, Saeed Tavbadi

File Information: persian Language/ 5 Page / size: 611 KB

Only site members can download free of charge after registering and adding to the cart

Download tutorial

سال : 1391

ناشر : نخستین کنفرانس بین المللی پردازش خط و زبان فارسی

کاری از : فرزين يغمايی ،سعید تعبدی

اطلاعات فایل : زبان فارسی / 5 صفحه / حجم : KB 611

فقط اعضای سایت پس از ثبت نام و اضافه کردن به سبد خرید می توانند دانلود رایگان کنند.خوشحال می شویم به ما پبیوندید

آموزش دانلود

 

نقد و بررسی‌ها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین کسی باشید که دیدگاهی می نویسد “بهبود دسته بندي متون فارسي در روش همسایگی وزن دار” لغو پاسخ

برای فرستادن دیدگاه، باید وارد شده باشید.

محصولات مرتبط

  • روش جدید فشرده سازی سیگنال الکتروکاردیوگرام با استفاده از آستانه گذاری ضرایب تبدیل موجک دوبعدی و RLC

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • New Learning Automata based Particle Swarm Optimization Algorithms

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • Free download paper Ant Colony Optimisation for Large-Scale Water Distribution Network Optimisation

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • A Novel Method in Scam Detection and Prevention using Data Mining Approaches

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات

درباره فروشگاه

  • ایران
  • تعلیم مرکزی از دانش و علم و فناوریست ،جایی است که کلی مقاله و پروپزال رایگان در اختیار شما کاربران عزیز قرار می گیرد
  • info[at]taliem.ir

دوست عزیز شما می توانید فایل های رایگانی از جمله : نرم افزار ، کتاب ، جزوه ، مقاله و پروپوزال و غیره را از سایت تعلیم دانلود کنید و لازم به ذکر است که 80 در صد محصولات سایت تعلیم به صورت کاملا رایگان ارائه می شود.

در صورتی که فایل یا مقاله ای در سایت نشر داده شده است که دارای حق نشر می باشد خواهشمند است نویسنده یا ناشر با ایمیل زیر ما را در جریان قرار دهد تا از سایت حذف گردد

                taliemsite[@]gmail.com

شما را از پربازدید ترین مقالات مطلع می کنیم

دوست خوبم در صورت هر سوال یا مشکل از طریق تلفن یا پست الکترونیکی زیر می توانیم بهترین خدمات را به شما ارائه دهیم و مطمئن باشید تمام سعی خود را جهت ارائه بهترین خدمت به شما تقدیم خواهیم کرد.

تلفن:07734236086[دور کار-با ایمیل باشما هستیم]

پست الکترونیک : info[@]taliem.ir

اینستاگرام : taliemsit

تعلیم دانشگاهی برای تمام علوم
  • Facebook
  • Twitter
  • LinkedIn
  • Instagram
  • Pinterest
  • Reddit
Evaluation of Two Popular Models of Volatility on Financial Time SeriesEvaluation of Two Popular Models of Volatility on Financial Time[taliem.ir]bannertaliem-taliem-irداده های تعادلی هیدرات های شبه کلاتریت برای سیستم های تترا ان- بوتیل آمونیوم فل...
رفتن به بالا