• 0سبد خرید فروشگاه
تعلیم
  • صفحه اصلی
  • محصولات
    • همه تعلیم ها
      • اقتصاد-Economy
        • علوم بورس-Science stock
        • علوم بانکداری-Banking science
        • علوم تجارت-Business Sciences
      • علوم برق-Electrical Sciences
        • مقالات برق-Electrical Articles
        • علوم الکترونیک-Electronic science
      • علوم زیست شناسی-Biological Sciences
        • زمین شناسی-Geology
          • مقالات جغرافیا-Geography Papers
      • علوم اجتماعی-social Sciences
      • علوم ایمنی و بهداشت-Health and safety
        • مقالات ایمنی و بهداشت – Health and safety
      • علوم پزشکی-Medical Sciences
        • علوم روانشناسی-Psychological Science
          • روانشناسی موفقیت-Psychology of success
        • مقالات پزشکی-medical articles
        • مقالات آنتی بیوتیک-Articles antibiotics
        • مقالات دندانپزشکی-Dental articles
      • علوم ریاضیات و فیزیک-Science, mathematics and physics
        • مقالات ریاضی – Mathematical articles
        • مقالات فیزیک-Physics articles
      • علوم زبان انگلیسی-Science in English
      • علوم سیاسی-political science
      • علوم شیمی-Chemical Sciences
        • مقالات شیمی-Chemistry Articles
        • مقالات پتروشیمی-Petrochemical articles
      • علوم صنایع غذایی-Food Industry Science
        • علوم تغذیه-nutrition science
      • علوم صنایع-Industrial science
        • مهندسی مواد-Materials Engineering
          • مقالات متالورژی- Metallurgy Articles
      • علوم عمران-Civil Sciences
        • مقالات عمران-Civil Articles
      • علوم کامپیوتر-computer science
        • مقالات فناوری اطلاعات-Articles of Information Technology
        • مقالات کامپیوتر-Computer Articles
          • دیتابیس-database
          • داده کاوی-Data Mining
          • داده های عظیم-Big data
          • رایانش ابری-cloud computing
          • هادوپ-Hadoop
          • سیستم فازی-Fuzzy System
      • علوم کشاورزی-Agricultural Sciences
        • مقالات کشاورزی-Agricultural Articles
        • مقالات شیلات-Fisheries Articles
        • مقالات محیط زیست-Environmental articles
      • علوم مالی و اداری-Financial and Administrative Science
        • مقالات حسابداری-Accountant Articles
      • علوم مدیریت-Management Sciences
        • مدیریت کسب و کار-business management
        • مقالات مدیریت-Management Articles
        • مقالات کارآفرینی-Entrepreneurship articles
      • علوم تربیت بدنی-Physical Education Sciences
      • علوم ورزشی-Sports Sciences
      • علوم معماری-Architectural Science
      • علوم هنر-Art Science
      • علوم مکانیک-Mechanical Sciences
        • مقالات مکانیک-Mechanical Articles
      • مذهبی-Religious
      • ادبیات-Literature
        • مقالات زبان فارسی-Articles in Persian language
  • مجله اینترنتی
  • حساب کاربری من
  • آموزش دانلود
  • قوانین سایت
  • درباره ما
  • جستجو
  • منو منو
An Introduction to Variable and Feature Selection[taliem.ir]

An Introduction to Variable and Feature Selection

۰ تومان

Variable and feature selection have become the focus of much research in areas of application for which datasets with tens or hundreds of thousands of variables are available. These areas include text processing of internet documents, gene expression array analysis, and  combinatorial chemistry. The objective of variable selection is three-fold: improving the prediction performance of the predictors, providing faster and more cost-effective predictors, and providing a better understanding of the underlying process that generated the data. The contributions of this special issue cover a wide range of aspects of such problems: providing a better definition of the objective function, feature construction, feature ranking, multivariate feature selection, efficient search methods, and feature validity assessment methods.

دسته: علوم ریاضیات و فیزیک-Science, mathematics and physics, مقالات ریاضی - Mathematical articles, مقالات-Article برچسب: bioinformatics, clustering, computational biology, feature selection, filters, gene expression, genomics, information retrieval., information theory, microarray, model selection, pattern discovery, proteomics, QSAR, space dimensionality reduction, statistical testing, support vector machines, text classification, Variable selection, wrappers
  • توضیحات
  • نظرات (0)

توضیحات

ABSTRACT

Variable and feature selection have become the focus of much research in areas of application for which datasets with tens or hundreds of thousands of variables are available. These areas include text processing of internet documents, gene expression array analysis, and  combinatorial chemistry. The objective of variable selection is three-fold: improving the prediction performance of the predictors, providing faster and more cost-effective predictors, and providing a better understanding of the underlying process that generated the data. The contributions of this special issue cover a wide range of aspects of such problems: providing a better definition of the objective function, feature construction, feature ranking, multivariate feature selection, efficient search methods, and feature validity assessment methods.

INTRODUCTION

As of 1997, when a special issue on relevance including several papers on variable and feature selection was published (Blum and Langley, 1997, Kohavi and John, 1997), few domains explored used more than 40 features. The situation has changed considerably in the past few years and, in this special issue, most papers explore domains with hundreds to tens of thousands of variables or features:1 New techniques are proposed to address these challenging tasks involving many  irrelevant and redundant variables and often comparably few training examples. Two examples are typical of the new application domains and serve us as illustration throughout this introduction. One is gene selection from microarray data and the other is text categorization. In the gene selection problem, the variables are gene expression coefficients corresponding to the abundance of mRNA in a sample (e.g. tissue biopsy), for a number of patients. A typical classification task is to separate healthy patients from cancer patients, based on their gene expression “profile”. Usually fewer than 100 examples (patients) are available altogether for training and testing. But, the number of variables in the raw data ranges from 6000 to 60,000. Some initial filtering usually brings the number of variables to a few thousand.

چکیده

انتخاب متغیر و ویژگی تبدیل شده است تمرکز تحقیقات زیادی در زمینه های کاربردی که مجموعه داده ها با ده ها یا صدها هزار متغیر در دسترس هستند. این زمینه ها شامل پردازش متن از اسناد اینترنتی، تجزیه و تحلیل آرایه آرایه ژن و شیمی ترکیبی است. هدف انتخاب متغیر سه برابر است: بهبود پیش بینی عملکرد پیش بینی کننده ها، فراهم کردن پیش بینی کننده های سریع تر و ارزان تر و فراهم آوردن درک بهتر فرایند اساسی که داده ها را تولید می کنند. مشارکت در این موضوع خاص طیف گسترده ای از جنبه های چنین مشکلات را پوشش می دهد: ارائه تعریف بهتر از تابع هدف، ساخت و ساز ویژگی ها، رتبه بندی ویژگی، انتخاب ویژگی چند متغیر، روش های جستجوی کارآمد و روش های ارزیابی اعتبار ویژگی.

مقدمه

در سال 1997، هنگامی که یک موضوع خاص در رابطه با چندین مقالات در مورد انتخاب متغیر و ویژگی منتشر شد (Blum and Langley، 1997، کوهی و جان، 1997)، چندین دامنه مورد مطالعه بیش از 40 ویژگی استفاده شده است. این وضعیت در چند سال گذشته بطور قابل توجهی تغییر کرده است و در این موضوع خاص اکثر مقالات در مورد دامنه هایی با صدها تا ده ها هزار متغیر یا ویژگی ها مورد بررسی قرار می گیرند: 1 تکنیک های جدید برای پاسخگویی به این وظایف چالش برانگیز در ارتباط با بسیاری از متغیرهای نامناسب و غیرمستقیم و اغلب تعداد کمی از نمونه های آموزشی وجود دارد. دو نمونه از دامنه های کاربردی جدیدی هستند و ما را به عنوان تصویر در طول این مقدمه خدمت می کنند. یکی از انتخاب ژن از داده های میکروارگانی است و دیگری طبقه بندی متن است. در مشکل انتخاب ژن، متغیرها ضرایب بیان ژن مربوط به فراوانی mRNA در یک نمونه (به عنوان مثال بیوپسی بافتی) برای تعدادی از بیماران است. یک وظیفه طبقه بندی معمول، جدا کردن افراد سالم از بیماران مبتلا به سرطان بر اساس بیان ژن آن “مشخصات” است. معمولا کمتر از 100 نمونه (بیمار) در دسترس برای آموزش و آزمایش در دسترس هستند. اما تعداد متغیرها در داده های خام از 6000 تا 60،000 متغیر است. بعضی از فیلترهای اولیه معمولا تعداد متغیرها را به چند هزار می رساند.

Year: 2003

Publisher : ANDRE

By : Isabelle Guyon, Andre Elisseeff

File Information: English Language/ 26 Page / size: 252 KB

Only site members can download free of charge after registering and adding to the cart

Download tutorial

سال : 1382

ناشر : ANDRE

کاری از : ایزابل گویون، آندره الیسهف

اطلاعات فایل : زبان انگلیسی / 26 صفحه / حجم : KB 252

فقط اعضای سایت پس از ثبت نام و اضافه کردن به سبد خرید می توانند دانلود رایگان کنند.خوشحال می شویم به ما پبیوندید

آموزش دانلود

نقد و بررسی‌ها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین کسی باشید که دیدگاهی می نویسد “An Introduction to Variable and Feature Selection” لغو پاسخ

برای فرستادن دیدگاه، باید وارد شده باشید.

محصولات مرتبط

  • Introduction to Numerical Simulation of Stochastic[taliem.ir]

    Introduction to Numerical Simulation of Stochastic Differential Equations by Using R Software and its Finantial Application

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • Confidence interval estimation of option prices by using the[taliem.ir]

    Confidence interval estimation of option prices by using the predicted distribution of implied volatility

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • bannertaliem-taliem-ir

    استفاده از آنتروپی تعمیم یافته در برآورد نابرابری در توزیع درآمد خانوارهای شهری و تجزیه آن به استانهای کشور

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات
  • Evaluation of Two Popular Models of Volatility on Financial Time[taliem.ir]

    Evaluation of Two Popular Models of Volatility on Financial Time Series

    ۰ تومان
    افزودن به سبد خرید نمایش جزئیات

درباره فروشگاه

  • ایران
  • تعلیم مرکزی از دانش و علم و فناوریست ،جایی است که کلی مقاله و پروپزال رایگان در اختیار شما کاربران عزیز قرار می گیرد
  • info[at]taliem.ir

دوست عزیز شما می توانید فایل های رایگانی از جمله : نرم افزار ، کتاب ، جزوه ، مقاله و پروپوزال و غیره را از سایت تعلیم دانلود کنید و لازم به ذکر است که 80 در صد محصولات سایت تعلیم به صورت کاملا رایگان ارائه می شود.

در صورتی که فایل یا مقاله ای در سایت نشر داده شده است که دارای حق نشر می باشد خواهشمند است نویسنده یا ناشر با ایمیل زیر ما را در جریان قرار دهد تا از سایت حذف گردد

                taliemsite[@]gmail.com

شما را از پربازدید ترین مقالات مطلع می کنیم

دوست خوبم در صورت هر سوال یا مشکل از طریق تلفن یا پست الکترونیکی زیر می توانیم بهترین خدمات را به شما ارائه دهیم و مطمئن باشید تمام سعی خود را جهت ارائه بهترین خدمت به شما تقدیم خواهیم کرد.

تلفن:07734236086[دور کار-با ایمیل باشما هستیم]

پست الکترونیک : info[@]taliem.ir

اینستاگرام : taliemsit

تعلیم دانشگاهی برای تمام علوم
  • Facebook
  • Twitter
  • LinkedIn
  • Instagram
  • Pinterest
  • Reddit
The effects of air pollution on mortality in South KoreaThe effects of air pollution on mortality in South Korea[taliem.ir]Sampling and data collection procedures[taliem.ir]Sampling and data collection procedures
رفتن به بالا