دانلود Data mining clustering in آنالیز خوشه‌ای


  آنالیز خوشه‌ای

مقدمه:

آنالیز خوشه‌ای یک فعالیت مهم‌ انسان است. خیلی زود بچه‌ها یاد می‌گیرند که گربه‌هاوسگها را از هم تشخیص دهند یا بین حیوانها وگیاهان تفاوت قائل شوند. این تشخیصها براساس شم و حس نیمه هوشیار خوشه بندی آنهاست که بطور پیوسته بهبود می‌یابد. آنالیز خوشه‌ای کاربرد گسترده‌ای داشته است که عبارتند از: شناسایی متن، آنالیز داده، پردازشهای تصویر و تحقیقات بازار.

به عنوان شاخه‌ای از آمار، آنالیز خوشه‌ای برای سالها بطور وسیعی مورد مطالعه قرار گرفته است و برروی فاصله متمرکز شده است. ابزارهای آنالیز خوشه ای که مبتنی بر K-means و K-medoids و چند روش دیگر هستند، در خیلی از بسته های نرم افزاری آمار مانند Sas , S-plus , Spss درست شده‌اند. دریادیگری ماشینی، خوشه بندی مثالی از یادگیری بدون نظارت می‌باشد. برخلاف کلاس بندی، خوشه بندی  ویا یادگیری بدون نظارت، روی کلاس‌های از قبل تعریف شده و یا ویژگی هدفی تکیه ندارند. به همین دلیل خوشه بندی شکلی از یادگیری بوسیله مشاهدات است تا یادگیری با مثالها.

در آنالیز خوشه‌ای مسائل زیر عنوان می‌شوند:

  • آنالیز خوشه‌ای چیست؟
  • یک دسته بندی از روشهای خوشه بندی اصلی
  • روشهای افزار بندی
  • روشهای سلسله مراتبی

حال به ترتیب یکی یکی وارد مباحث می‌شویم.

آنالیز خوشه‌ای چیست؟

ابتدا بررسی می‌کنیم خوشه بندی چیست. خوشه بندی، گروهبندی نمونه‌های مشابه با هم در یک نمونه داده‌ای می‌باشد و مسائل اساسی مربوط به آن عبارتند از:

  • توزیع داده‌های به K گروه مختلف که نقاط هر گروه با یکدیگر مشابهند.
  • تشابه بین نقاط از روی برخی فاصله‌های متر یک ( که باید انتخاب شوند) تعریف می‌شود.

 

فرمت فایل: Word (قابل ویرایش)
تعداد صفحات: 60
حجم: 696 کیلوبایت

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *