A Case-based Data Warehousing Courseware[taliem.ir]

A Case-based Data Warehousing Courseware

ABSTRACT

Data warehousing is one of the important approaches for data integration and data preprocessing. The objective of this project is to develop a web-based interactive courseware to help beginner data warehouse designers to reinforce the key concepts of data warehousing using a case study approach. The case study is to build a data warehouse for a university student enrollment prediction data mining system. This data warehouse is able to generate summary reports as input data files for a data mining system to predict future student enrollment. The data sources include: (1) the enrollment data from California State University, Sacramento and (2) the related public data of California. The  ourseware is designed to build the data warehouse systematically using a set of 4 demonstrations covering the following data warehousing topics: fundamentals, design principle, building an enterprise data warehouse using incremental approach, and aggregation.

INTRODUCTION

Every corporation/institution, small or big, has the need to make use of the large scale chronological data available, and hopefully turn it into a prediction/analytic model that supports decision making process. The data warehouse has been playing a critical role in data preprocessing and integration. It allows quick retrieval of input data for data mining or data analysis tools. The outcome of data reporting, data analysis and data mining can then be used for supporting decisions making on budget analysis, resource allocation, forecasting and prediction. To illuminate data warehousing basic concepts, design principle, and performance enhancement techniques, we developed this courseware. This webbased tool assists beginner data warehouse designers to reinforce their understanding of the basic design concepts of data warehousing via a case study. In this case study, the data sources include the student enrollment data from the California State University at Sacramento and, enrollment-related social and economical data of California. The main objective of this data warehouse is to prepare input data for an existing data mining system for student enrollment prediction . Using the case study, we demonstrate the procedure to build a data warehouse and reveal some common incorrect practices which should be avoided in the design process. This project provides a self-paced learning tool not only to the students taking a course on data warehousing but also to the beginner data warehouse designers who have to build a data warehouse quickly from scratch. Figure  shows the courseware tool’s introduction page.

چکیده

انبارداری داده یکی از رویکردهای مهم برای ادغام داده ها و پیش پردازش داده ها است. هدف از این پروژه توسعه یک برنامه آموزشی تعاملی مبتنی بر وب برای کمک به طراحان انبار داده های مبتدی برای تقویت مفاهیم کلیدی انبارداری داده ها با استفاده از رویکرد مطالعه موردی است. مطالعه موردی ساخت یک انبار داده برای یک سیستم داده کاوی برای پیش بینی ثبت نام دانشجویان دانشگاه است. این انبار داده قادر است گزارش های خلاصه ای را به عنوان فایل های داده ورودی برای یک سیستم داده کاوی برای پیش بینی ثبت نام دانشجویان آینده ایجاد کند. منابع داده شامل: (1) اطلاعات ثبت نام از دانشگاه ایالتی کالیفرنیا، ساکرامنتو و (2) اطلاعات مربوط به عمومی مربوط به کالیفرنیا. oursware برای ساختن انبار داده ها به طور سیستماتیک با استفاده از مجموعه ای از 4 تظاهرات که موضوعات زیر را در بر می گیرد: مبانی، اصل طراحی، ساخت یک انبار داده های سازمانی با استفاده از رویکرد افزایشی و تجمیع، طراحی شده است.

مقدمه

هر شرکت / موسسه، کوچک یا بزرگ، نیاز به استفاده از داده های تاریخی گسترده ای در دسترس دارد و امیدواریم آن را به یک مدل پیش بینی / تحلیلی تبدیل کنیم که از پروسه تصمیم گیری پشتیبانی می کند. انبار داده نقش مهمی در پیش پردازش و ادغام داده ها دارد. این اجازه می دهد تا سریع بازیابی داده های ورودی برای ابزارهای داده کاوی یا تجزیه و تحلیل داده ها. نتیجه گزارش داده، تجزیه و تحلیل داده ها و داده کاوی می تواند برای حمایت از تصمیم گیری در مورد تجزیه و تحلیل بودجه، تخصیص منابع، پیش بینی و پیش بینی استفاده شود. برای روشن ساختن مفاهیم اساسی انبارداری داده، اصل طراحی و تکنیک های بهبود عملکرد، ما این برنامه آموزشی را توسعه دادیم. این ابزار مبتنی بر وب به طراحان انبار داده های مبتدی کمک می کند تا درک خود را از مفاهیم طراحی اولیه انبارداری داده ها از طریق مطالعه موردی تقویت کنند. در این مطالعه موردی، منابع داده شامل اطلاعات ثبت نام دانش آموزان از دانشگاه ایالتی کالیفرنیا در ساکرامنتو و اطلاعات مربوط به ثبت نام اجتماعی و اقتصادی کالیفرنیا است. هدف اصلی این انبار داده ها، آماده سازی داده های ورودی برای سیستم داده کاوی موجود برای پیش بینی ثبت نام دانش آموزان است. با استفاده از مطالعه موردی، روش ساخت یک انبار داده را نشان می دهیم و برخی از شیوه های نادرست معمولی را که باید در فرایند طراحی اجتناب شود، نشان می دهیم. این پروژه ابزار یادگیری خود را نه تنها برای دانشجویانی که دوره ی انبارداری داده ها را فراهم می کنند، بلکه همچنین به طراحان انبار داده ی مبتدی که از ابتدا باید یک انبار داده را ایجاد کنند، فراهم می کند. شکل نشان دهنده مقاله معرفی ابزار ابزار برنامه نویسی است.

Year: 2010

Publisher : IEEE

By : Manashree Kulkarni, Meiliu Lu, and Du Zhang

File Information: English Language/ 4 Page / size: 461 KB

Download

سال : 1389

ناشر : IEEE

کاری از : ماناشی کولارانی، مالی لو و دو ژانگ

اطلاعات فایل : زبان انگلیسی / 4 صفحه / حجم : KB 461

لینک دانلود

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگو شرکت کنید؟
نظری بدهید!

دیدگاهتان را بنویسید