مقدمه
از زمانی که علم آمار بوجود آمد دانشمندان نیاز به کشف خصوصیات داده ها را احساس کرده بودند. با استفاده از آمار و روشهای آن در آن زمان خصوصیات داده ها از قبیل پراکندگی و تمرکز آنها را بررسی می شد. با افزایش نیاز به استفاده از داده ها و درک ارزش اطلاعات ، داده ها به سرعت در حال جمع و ذخیره شدن می باشند که این سرعت همه روزه در حال زیاد شدن می باشد. به موازات سرعت زیاد ذخیره شدن داده ها ابزارهای محاسبه مکانیکی، الکتریکی و در نهایت کامپیوترها نیز بوجود آمده اند که نرخ افزایش سرعت محاسبه این ابزارها نیز نمایی می باشد. حجم زیاد داده های ذخیره شده که معمولا از منابع گوناگون تهیه شده بودند و بعضا دارای قالبهای متفاوتی نیز بودند سبب شد که در بسیاری موارد روشهای آماری به تنهایی قادر به کشف خصوصیات داده ها نباشند. دانشمندان برای رفع این مشکل تصمیم گرفتند که از سرعت بالای کامپیوترها استفاده نمایند. همین امر سبب شد که روشهای ابتکاری دیگری علاوه بر روشهای آماری مثل شبکه های عصبی، الگوریتم ژنتیک ایجاد شود.
سه موضوع انبارش و ذخیره شدن داده ها، افزایش سرعت کامپیوترها و پیدایش الگوریتمهای جدید کار با داده ها باعث ایجاد علمی با نام داده کاوی[1] شده است.
داده کاوی عبارت است از “استخراج اطلاعات و دانش و کشف الگوهای پنهان از یک پایگاه داده های بسیار بزرگ” ]3[ . که این الگوها و دانشها معمولا مستتر در داده می باشند. از داده کاوی می توان برای انجام کارهایی مثل دسته بندی[2]، پیش بینی[3]، تخمین[4] و خوشه بندی[5] داده ها استفاده نمود. برای انجام این کارها تکنیکهایی توسعه یافته اند که با توجه به پیشرفت کامپیوترها و این علم همه روزه برتعداد و کیفیت این تکنیکها افزوده می شود. تعدادی از معروفترین این تکنیکها عبارتند از: الگوریتمهای خوشه بندی[6]، شبکه های عصبی[7]، الگوریتم ژنتیک[8]، نزدیکترین همسایگی[9] و درخت تصمیم گیری[10].
ویژگیهای داده کاوی سبب شده که امروزه در تجارت و کسب و کار از آن بسیار استفاده شود. شرکتهای مخابراتی، بانکها، شرکتهای بازاریابی و تبلیغاتی و کلیه شرکتهایی که از بانکهای اطلاعاتی بزرگی برخوردار بوده و از اهمیت اطلاعات و آگاهی در بازار خبر دارند می توانند از داده کاوی بعنوان یک ابزار بسیار قوی برای رشد و پیشرفت در بازار استفاده کنند.
1-1) داده کاوی چیست؟
تعریفهای متفاوتی از داده کاوی وجود دارد ولی تعریفی که در اکثر مراجع به اشتراک ذکر شده عبارت است از “استخراج اطلاعات و دانش و کشف الگوهای پنهان از یک پایگاه دادههای بسیار بزرگ و پیچیده” ]1[ . داده کاوی یک متدولوژی بسیار قوی و با پتانسیل بالا می باشد که به سازمانها کمک می کند که بر روی مهمترین اطلاعات از مخزن داده های خود تمرکز نمایند ]5[.
داده کاوی کمک می کند تا سازمانها با کاوش بر روی داده های یک سیستم, الگوها, روندها و رفتارهای آینده را کشف و پیش بینی کرده و بهتر تصمیم بگیرند. داده کاوی با استفاده از تحلیل وقایع گذشته یک تحلیل اتوماتیک و پیش بینانه ارایه می نماید و به سوالاتی جواب می دهد که پاسخ آنها در گذشته ممکن نبوده و یا به زمان زیادی نیاز داشت.
ابزارهای داده کاوی الگوهای پنهانی را کشف و پیش بینی می کنند که متخصصان ممکن است به دلیل اینکه این اطلاعات و الگو ها خارج از انتظار آنها باشد, آنها را مدنظر قرار ندهند و به آنها دست نیابند ]5[.
[1] Data Mining [2] Classification [3] Prediction [4] Estimation [5] Clustering [6] Cluster Detection Algorithm [7] Neural Networks [8] Genetic Algorithm [9] Nearest Neighboring [10] Decision Tree
فرمت فایل: Word (قابل ویرایش)
تعداد صفحات: 99
حجم: 442 کیلوبایت