داده کاوی - ۲ - تعاریف

۲۴ فروردین ۱۳۹۹

داده کاوی که ترجمه‌ی عبارت «Data Mining» می‌باشد دارای تعاریف مختلفی است که به شرح تعدادی از تعاریف مستند با ذکر منابع آنها می‌پردازیم. ۱ـ داده کاوی زیر شاخه‌ا‌ی بین علوم کامپیوتر و آمار است که هدف کلی آن استخراج اطلاعات (با روش‌های هوشمند) از یک مجموعه داده می‌باشد که با تبدیل اطلاعات به یک ساختار قابل درک، آن‌ها را برای استفاده‌ی بهتر آماده می‌کند. منابع:
Data Mining Curriculum: A Proposal (Version 1.0; | ACM | 2006)
The Elements of Statistical Learning: Data Mining, Inference, and Prediction | 2009
Encyclopædia Britannica: Definition of Data Mining | 2010
Data Mining: Concepts and Techniques (3rd ed.) | 2011
۲ـ اصطلاح داده کاوی به معنای استخراج داده، نادرست است. زیرا هدف، استخراج الگو و دانش از مقادیر زیادی از داده‌هاست نه استخراج داده‌ها از خودش. منبع:
Data Mining: Concepts and Techniques (3rd ed.) | 2011
۳ـ داده کاوی فرایند کشف الگوها در مجموعه داده‌های بزرگ با استفاده از روش‌های موجود در فصل مشترک حوزه‌های یادگیری ماشین، آمار و سیستم‌های پایگاه داده‌است. منبع:
Data Mining Curriculum: A Proposal (Version 1.0) | ACM | 2006
۴ـ داده کاوی مرحله تجزیه و تحلیل فرآیند «کشف دانش در پایگاه‌های داده» یا knowledge discovery in databases یا همان KDD است. فرایند KDD شامل پنج مرحله زیر می‌باشد که داده کاوی در مرحله چهارم آن قرار می‌گیرد.
  1. گزینش یا انتخاب
  2. پیش پردازش یا pre-processing
  3. داده کاوی
  4. تفسیر / ارزیابی
منبع:
From Data Mining to Knowledge Discovery in Databases" | 2008
قسمت بعدی شرح معیار‌های فاصله و پیاده‌سازی آنها در پایتون

فهرست مطالب « داده کاوی در پایتون »

Berneti