پرش لینک ها

فرآیند داده کاوی چه مؤلفه هایی دارد؟

اجزا یا مؤلفه های داده کاوی فازی
مؤلفه ی اصلی فرآیند داده کاوی شامل این موارد است: داده ها و دانش ورودی – مدل – دانش خروجی. در ادامه، این مؤلفه ها را جداگانه بررسی می کنیم.
  • داده یا دانش ورودی

ورودی مرحله­ ی یادگیری ماشینی از داده­ ها و دانش زمینه ­ای تشکیل شده ­است. داده ­ها معمولاً به شکل یک مجموعه ­ی آموزشی تهیه می ­شوند که الگوریتم یادگیری از آنها روابط یا همبستگی ­ها را استخراج می کند و مدل استنباط می ­شود. دانش از اطلاعات (زمینه ­ای) تشکیل  می­شود که به الگوریتم یادگیری در رسیدگی به مجموع ه­های آموزشی یا سرعت بخشیدن به آن کمک می­ کند.

در داده­ کاوی فازی، فازی بودن می­ تواند در دو سطح ظاهر شود:

·       داده ­ها، فازی هستند. زمانیکه داده ها مجموعه ­های فازی هستند (یا مجموعه ­­های فازی نوع دوم، مجموعه­ های فازی شهودی، یا دیگر مجموعه­ های نامعین)، بایستی الگوریتم یادگیری به مجموعه ­های فازی رسیدگی کند. این یا به تعمیمی از پارامترهای رسمی الگوریتم در فراهم آوردن امکان رسیدگی به مجموعه ­های فازی منجر می­ شود (برای نمونه، [4])، یا خلق الگوریتم ­های جدیدی را در پی دارد که از نظریه­ ی مجموعه ­های فازی ساخته می ­شوند (برای نمونه، [5] یا [6]).

·       دانش، فازی است. برای مثال مجموعه ­های فازی را می­ توان به جای ساخته شدن از مقادیر عددی در مرحله­ ی پیش ­پردازش، جهت ارائه ­ی داده­ های عددی فراهم نمود (برای نمونه، [7] یا [8]). دانش می­ تواند نامعین یا توزیعی گُمانی جهت ارائه­ ی اطلاعات اضافی در رابطه با داده ­ها نیز باشد. در این مورد، هر داده را می ­توان با یک احتمال، یک گُمان، یا هر درجه­ ی عدم قطعیتی، وزن­دار کرد.

معمولاً کارهای داده­ کاوی فازی به داده ­های عددی اشاره دارد که مجموعه ­های فازی از آنها استنباط شده ­اند. این مجموعه­ های فازی می­ توانند به وسیله­ ی الگوریتم یادگیری [9] یا یک روند بهینه ­سازی با استفاده از تنظیم پارامترهای پارتیشن فازی، ایجاد شوند [10].

لازم به ذکر است بر خلاف داده­ کاوی کلاسیک، تا به حال در داده ­کاوی فازی هیچ محک عامه ­پسندی از مجموعه­ داده ­های فازی جهت مقایسه­ ی الگوریتم­ ها تشکیل نشده ­است. بنابراین آنها بطور معمول به وسیله­ ی محک ­های کلاسیک مقایسه می­ شوند که این گاهاً پس از فرآیند فازی­ سازی مصنوعی داده ­های عددی است. متأسفانه این نوع قیاس بطور خاص به جای مقایسه­ ی تفسیرپذیری مدل­ ها، جهت مقایسه ­ی دقت آنها مفید است. روش ­هایی را می­ توان به منظور تعادل دقت و تفسیرپذیری در مدلسازی فازی پیشنهاد نمود [11].

  • مدل

مدل یا الگوریتم یادگیری در انتهای مرحله ­ی آموزش تولید می ­شود. مدل از روابط اساسی موجود در مجموعه­ ی آموزشی ساخته شده و توسط الگوریتم یادگیری ماشینی برجسته می ­شود.

نمونه­ هایی از مدل ­ها در یادگیری ماشینی عبارتند از: درخت ­های تصمیم، قواعد پیوستگی، نمونه­ های اولیه­، ماشین­ های بردار پشتیبان، الگوریتم ­های خوشه ­بندی… .بسته به الگوریتم، مدل می­ تواند مجموعه ­ای از قواعد یا توابع ریاضی پیچید­ه ­تر باشد.

بسیاری از الگوریتم­ های کلاسیک یادگیری ماشینی جهت موارد فازی بسط داده شده ­اند (برای فهرستی غیر جامع از مراجع [12-16] را ببینید). بسط یک الگوریتم کلاسیک جهت ایجاد الگوریتم یادگیری فازی عملی جالب است. مقالات بسیاری در رابطه با درخت ­های تصمیم ­گیری فازی [17-20، 4،21]، و ساخت پایگاه قوانین فازی [5،22،23] انتشار یافته ­اند. چالش در چنین مواردی، ارائه­ ی الگوریتمی است که هم بتواند با ورودی­ های فازی کار کند و با این وجود ویژگی ­های اصلی الگوریتم کلاسیک را نیز اقناع نماید. 

الگوریتم­ های کلاسیک جهت رسیدگی به داده ­های پیچیده، برای نمونه گُمان ­ها [24] یا مجموعه ­های فازی شهودی [25] نیز بسط یافته ­اند.

  • دانش خروجی

ممکن است خروجی دو شکل داشته باشد. از یک سو، خود مدل بتواند خروجی فرآیند داده ­کاوی باشد، در این مورد، هدف، داشتن توصیفی از داد ه­ها به شکل خلاصه با استفاده از مدل است. برای نمونه، الگوریتم یادگیری می­ تواند مجموعه ­ای از قواعد، یا مجموعه­ ای از گروه ­ها، یا درخت ­های تصمیم ­گیری را تولید کند.

از سوی دیگر، خروجی، نتیج ه­ی استفاده از مدل با داده ­های دیگر باشد (داده ­های تست). نمونه ­هایی از نتایج می­ توانند یک کلاس (مدل جهت دسته­ بندی داده ­های تست استفاده می ­شود)، یک عضویت (مدل عضویتی برای یک خوشه یا یک دسته­ بندی ایجاد می­ کند)، یک گُمان باشد و یا شکل­ های پیچیده ­تری داشته باشد (برای نمونه، در استدلال مبتنی بر مورد).

در داده ­کاوی فازی، برای نمونه زمانیکه مدل یک پایگاه قوانین (فازی) است، می­ تواند به همان شکلی که هست اطلاعاتی را در رابطه با پیوندهای میان متغیرهای توصیف­ کننده ­ی داده ­ها فراهم نماید، یا می ­تواند برای استنباط یک تصمیم، درجه­ ی عضویت، یا یک گُمان برای داده ­های آتی (تست) استفاده شود.

سفــــارش ترجمـــه  مقاله کامل را اینجا ببینید  دانلود مقاله لاتین

می خوای از فایلای با ارزشی که داری درآمد داشته باشی؟ باهامون تماس بگیر