• 0سبد خرید فروشگاه
تعلیم
  • صفحه اصلی
  • محصولات
    • همه تعلیم ها
      • اقتصاد-Economy
        • علوم بورس-Science stock
        • علوم بانکداری-Banking science
        • علوم تجارت-Business Sciences
      • علوم برق-Electrical Sciences
        • مقالات برق-Electrical Articles
        • علوم الکترونیک-Electronic science
      • علوم زیست شناسی-Biological Sciences
        • زمین شناسی-Geology
          • مقالات جغرافیا-Geography Papers
      • علوم اجتماعی-social Sciences
      • علوم ایمنی و بهداشت-Health and safety
        • مقالات ایمنی و بهداشت – Health and safety
      • علوم پزشکی-Medical Sciences
        • علوم روانشناسی-Psychological Science
          • روانشناسی موفقیت-Psychology of success
        • مقالات پزشکی-medical articles
        • مقالات آنتی بیوتیک-Articles antibiotics
        • مقالات دندانپزشکی-Dental articles
      • علوم ریاضیات و فیزیک-Science, mathematics and physics
        • مقالات ریاضی – Mathematical articles
        • مقالات فیزیک-Physics articles
      • علوم زبان انگلیسی-Science in English
      • علوم سیاسی-political science
      • علوم شیمی-Chemical Sciences
        • مقالات شیمی-Chemistry Articles
        • مقالات پتروشیمی-Petrochemical articles
      • علوم صنایع غذایی-Food Industry Science
        • علوم تغذیه-nutrition science
      • علوم صنایع-Industrial science
        • مهندسی مواد-Materials Engineering
          • مقالات متالورژی- Metallurgy Articles
      • علوم عمران-Civil Sciences
        • مقالات عمران-Civil Articles
      • علوم کامپیوتر-computer science
        • مقالات فناوری اطلاعات-Articles of Information Technology
        • مقالات کامپیوتر-Computer Articles
          • دیتابیس-database
          • داده کاوی-Data Mining
          • داده های عظیم-Big data
          • رایانش ابری-cloud computing
          • هادوپ-Hadoop
          • سیستم فازی-Fuzzy System
      • علوم کشاورزی-Agricultural Sciences
        • مقالات کشاورزی-Agricultural Articles
        • مقالات شیلات-Fisheries Articles
        • مقالات محیط زیست-Environmental articles
      • علوم مالی و اداری-Financial and Administrative Science
        • مقالات حسابداری-Accountant Articles
      • علوم مدیریت-Management Sciences
        • مدیریت کسب و کار-business management
        • مقالات مدیریت-Management Articles
        • مقالات کارآفرینی-Entrepreneurship articles
      • علوم تربیت بدنی-Physical Education Sciences
      • علوم ورزشی-Sports Sciences
      • علوم معماری-Architectural Science
      • علوم هنر-Art Science
      • علوم مکانیک-Mechanical Sciences
        • مقالات مکانیک-Mechanical Articles
      • مذهبی-Religious
      • ادبیات-Literature
        • مقالات زبان فارسی-Articles in Persian language
  • مجله اینترنتی
  • حساب کاربری من
  • آموزش دانلود
  • قوانین سایت
  • درباره ما
  • جستجو
  • منو منو
Hierarchy construction -taliem-ir

Hierarchy construction and text classification based on the relaxation strategy and least information model

۰ تومان

Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM  (Support VectorMachine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF∗IDF, LIT-based methods  chieves significant improvement on the classification performance.

دسته: علوم کامپیوتر-computer science, مقالات کامپیوتر-Computer Articles, مقالات-Article برچسب: computers, data, Hierarchy classification, Least Information Theory, SVM
  • توضیحات
  • نظرات (0)

توضیحات

ABSTRACT

Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM  (Support VectorMachine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF∗IDF, LIT-based methods  chieves significant improvement on the classification performance.

 

INTRODUCTION

The task of text classification is to assign a predefined category to a free text document. With more and more textual information available online, hierarchical organization of text documents is becoming increasingly important to manage the data. The research on automatic classification of documents to the categories in the hierarchy is needed. Most of the classifiers make the decision in the same flat  space. Classification performance degrades quickly with larger scale data sets and more categories, especially in terms of the classification time. On the other hand, a hierarchical classification method organizes all of the categories into a tree like structure and trains a classifier on each node in the hierarchy. The classification process begins from the root of the tree until it reaches the leaf node which denotes the final category for the document. The hierarchies are represented as binary trees mostly. During the hierarchical classification process, the document to be classified starts from the root and the next direction is determined by each node classifier.

 

چکیده

طبقه بندی سلسله مراتبی یک رویکرد موثر برای طبقه بندی داده های متنی در مقیاس بزرگ است. ما یک استراتژی آرام به روش طبقه بندی سلسله مراتبی سنتی برای بهبود عملکرد سیستم معرفی می کنیم. در طول فرایند ساختار ساختار سلسله مراتبی، روش ما تاخیر در قضاوت گره از رده نامشخص را تا زمانیکه به طور واضح طبقه بندی می شود، به تاخیر می اندازد. این رویکرد به طور موثر مشکلات “بلوک” را حل می کند که خطای طبقه بندی را از سطح بالاتر به سطح پایین تر در ساختار سلسله مراتبی انتقال می دهد. یک رویکرد نوسان براساس معیار کمترین اطلاعات (LIT) برای طبقه بندی سلسله مراتبی اتخاذ می شود. این اطلاعات را در تغییرات توزیع احتمال محاسبه می کند و یک مدل ارائه جدید سند ارائه می دهد که در آن سهم هر اصطلاح می تواند به درستی وزن باشد. نتایج تجربی نشان می دهد که روش آرام سازی یک سلسله مراتب مناسب تر را ایجاد می کند و عملکرد طبقه بندی را بهبود می بخشد. همچنین از روش های طبقه بندی دیگر مانند SVM (Support VectorMachine) از نظر بهره وری بهتر عمل می کند و روش برای کارهای طبقه بندی متن های بزرگ کارآمدتر است. در مقایسه با روش وزن گذاری کلاسیک TF * IDF، روش های مبتنی بر LIT بهبود قابل توجهی در عملکرد طبقه بندی دارد.

 

مقدمه

وظیفه طبقه بندی متن این است که یک دسته از پیش تعریف شده را به یک سند متن آزاد اختصاص دهیم. با اطلاعات بیشتر و متنوعی که در اینترنت موجود هستند، سازماندهی سلسله مراتبی اسناد متنی برای مدیریت داده ها به طور فزاینده ای مهم است. تحقیق در مورد طبقه بندی خودکار اسناد به دسته های سلسله مراتبی مورد نیاز است. اکثر طبقه بندی ها، تصمیم گیری را در همان فضای مسطح انجام می دهند. عملکرد طبقه بندی به سرعت با مجموعه داده های مقیاس بزرگتر و مقوله های بیشتر، به ویژه از نظر زمان طبقه بندی، کاهش می یابد. از سوی دیگر، یک روش طبقه بندی سلسله مراتبی، تمام دسته ها را به یک درخت مانند ساختار سازماندهی می کند و یک طبقه بندی در هر گره در سلسله مراتب را آموزش می دهد. فرآیند طبقه بندی از ریشه درخت شروع می شود تا به گره برگ برسد که طبقه بندی نهایی برای سند را نشان می دهد. سلسله مراتبها به طور عمده به عنوان درختهای باینری معرفی می شوند. در طول فرایند طبقه بندی سلسله مراتبی، سند طبقه بندی شده از ریشه شروع می شود و جهت بعدی توسط هر یک از طبقه بندی ها تعیین می شود.

Year: 2018

Publisher : ELSEVIER

 By : Yongping Du , Jingxuan Liu , Weimao Ke , Xuemei Gong

File Information: English Language/ 8 Page / size: 472 MB

Download

سال : 1396

ناشر : ELSEVIER

کاری از : Yongping Du، Jingxuan لیو، Weimao Ke، Xuemei گونگ

اطلاعات فایل : زبان انگلیسی / 8 صفحه / حجم : KB 472

لینک دانلود     

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “Hierarchy construction and text classification based on the relaxation strategy and least information model” لغو پاسخ

برای فرستادن دیدگاه، باید وارد شده باشید.

محصولات مرتبط

  • کتاب پایگاه داده PostgreSQL

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • کتاب آموزش طراحی سایت با وردپرس

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • کتاب تعمیرات موبایل

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • کتاب آموزش طراحی سایت با وردپرس

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات

درباره فروشگاه

  • ایران
  • تعلیم مرکزی از دانش و علم و فناوریست ،جایی است که کلی مقاله و پروپزال رایگان در اختیار شما کاربران عزیز قرار می گیرد
  • info[at]taliem.ir

دوست عزیز شما می توانید فایل های رایگانی از جمله : نرم افزار ، کتاب ، جزوه ، مقاله و پروپوزال و غیره را از سایت تعلیم دانلود کنید و لازم به ذکر است که 80 در صد محصولات سایت تعلیم به صورت کاملا رایگان ارائه می شود.

در صورتی که فایل یا مقاله ای در سایت نشر داده شده است که دارای حق نشر می باشد خواهشمند است نویسنده یا ناشر با ایمیل زیر ما را در جریان قرار دهد تا از سایت حذف گردد

                taliemsite[@]gmail.com

شما را از پربازدید ترین مقالات مطلع می کنیم

دوست خوبم در صورت هر سوال یا مشکل از طریق تلفن یا پست الکترونیکی زیر می توانیم بهترین خدمات را به شما ارائه دهیم و مطمئن باشید تمام سعی خود را جهت ارائه بهترین خدمت به شما تقدیم خواهیم کرد.

تلفن:07734236086[دور کار-با ایمیل باشما هستیم]

پست الکترونیک : info[@]taliem.ir

اینستاگرام : taliemsit

تعلیم دانشگاهی برای تمام علوم
  • Facebook
  • Twitter
  • LinkedIn
  • Instagram
  • Pinterest
  • Reddit
اثر اصلاح شیمیایی با ترکیبات آکریلاتی بر جذب آب آرد چوب...asar eslah shimiyahi-taliem-irSecure integration of IoT-taliem-irSecure integration of IoT and Cloud Computing
رفتن به بالا