پرش لینک ها

تفسیرپذیری و داده کاوی

 داده­ کاوی فازی، تفسیرپذیری و اطلاعات قابل تفسیر

مزیت تفسیرپذیری به جای داده ­کاوی (کلاسیک) که ارزیابی پیچیده ­ای دارد، به وسیله­ ی الگوریتم داده­ کاوی فازی حاصل می ­شود. در واقع، ارزیابی سطح تفسیرپذیری به آن مرحله­ از فرآیند داده ­کاوی بستگی دارد که فازی سازی در آن روی می­ دهد. براساس تعریف داده­ کاوی فازی، تفسیرپذیری را می­ توان در چند مرحله از فرآیند مشاهده نمود:

تفسیرپذیری را می ­توان با در نظر گرفتن دو گونه از افراد (یا کاربران) بررسی کرد: اپراتور و کاربر نهایی. اپراتور با ایجاد فرآیند داده ­کاوی در ارتباط است و چندین پارامتر از این فرآیند را تنظیم می­ کند: انتخاب الگوریتم یادگیری ماشینی، آماده ­سازی داده ­ها، …. کاربر نهایی با مدل ایجادشده و کاربرد نهایی آن در حوزه­ ی کاربرد واقعی در ارتباط است.

این دو کاربر معمولاً می­ توانند انواع مختلفی از دانش ­ها و توانایی­ ها را داشته باشند (برای نمونه اپراتور معمولاً یک دانشمند کامپیوتر است و کاربر نهایی معمولاً یک پزشک یا متخصص حوزه ­ی کاربردی است). بنابراین، تفسیرپذیری بطور معمول از منظر کاربر نهایی مورد توجه قرار می ­گیرد. ما تفسیرپذیری مدل، تفسیرپذیری خروجی و تفسیرپذیری الگوریتم را بررسی می کنیم.

تفسیرپذیری مدل

این نوع اصلی تفسیرپذیری است که در بسیاری از کاربردهای داده ­کاوی به دنبال آن هستیم. همانگونه که در [10] آمده است، یک پاسخ فازی تنها براساس میزان دقتش قضاوت نمی­ شود، بلکه سادگی و خوانایی آن نیز مهم است. معیارهای بسیاری برای تفسیرپذیری وجود دارد. جهت ارزیابی تفسیرپذیری، [26] دو دسته معیار پیشنهاد می­ شود: تفسیر مبتنی بر پیچیدگی و تفسیرپذیری مبتنی بر معناشناسی.

تفسیرپذیری مدل با ساختار آن (برای نمونه، یک درخت تصمیم گیری، مجموعه­ ای از توابع ریاضی، ….)، خوانایی آن (برای مثال، پیچیدگی ابعاد آن) و انسجام بصری آن (برای نمونه اعتبار معناشناختی متغیرهای دخیل) در ارتباط است.

در واقع تفسیرپذیری یک مدل فازی بطور معمول به لطف کاربرد اصطلاحات زبان­شناختی جهت بیان مدل و روابطی که کشف می ­کند، انجام می­ گیرد. برای نمونه، برای به تصویر کشیدن این نکته یک قاعده­ (ی کلاسیک) را به این شکل در نظر بگیرید: در صورتیکه قیمت از 13.75 یورو بیشتر باشد، کتاب دارای جلد سخت خواهد بود. چنین قاعده ­ای را می­ توان از یک مجموعه­ ی آموزشی متشکل از کتاب ­های یک کتابفروشی با استفاده از الگوریتم یادگیری ماشینی که می ­تواند بطور خودکار مرزهای قیمت­ گذاری را استنباط کند، به دست آورد. به شیوه ­ای مشابه یک قاعده­ ی فازی معادل می ­تواند چنین باشد: اگر قیمت بالا باشد در اینصورت کتاب دارای جلد سخت است. در اینجا واژه ­ی بالا برچسبی است که با یک مجموعه ­ی فازی متناظر استنباط ­شده از مجموعه­ ی آموزشی در ارتباط است. تفسیرپذیری را در این مورد می ­توان نسبت به قواعد پیشین، بهتر در نظر گرفت: عبارتی که استفاده می ­شود به لحاظ معنایی برای هر شخص راحت است و هر کس می ­تواند آن را حتی در صورتیکه یورو واحد پول م لی­اش نباشد، بفهمد. البته ما در اینجا در رابطه با تفسیرپذیری براساس کاربر نهایی صحبت می ­کنیم. ما می ­ توانیم آن را براساس اپراتور نیز بیان نماییم، تفسیرپذیری با دانش نظریه­ ی مجموعه­ های فازی که او را قادر به درک مقادیر عددی اساسی یک عبارت فازی می­ کنند، در ارتباط است.

بطور معمول، ابزارهای کلاسیک در ارزیابی این تفسیرپذیری بر پیچیدگی آن مبتنی هستند: تعداد قواعد (فازی) که مدل از آنها تشکیل شده، تعداد متغیرها در هر قاعده، استفاده از مجموعه­ های فازی بامعنی [10،26]. با اینحال، تفسیرپذیری ساختار مدلی که بایستی توسط کاربر نهایی به وضوح درک شود، منجر به انتخاب یک الگوریتم خاص می ­شود. برای نمونه، درخت ­های تصمیم­ گیری یا قوانین در بسیاری از حوزه ­ها، دانش پایه هستند و در نتیجه برای هر گونه از کاربران نهایی، تفسیرپذیری بالایی دارند.

امروزه پژوهش­ های بسیاری بر افزایش تفسیرپذیری مدل­ های استنباط­ شده از داده­ کاوی فازی تمرکز دارند. بطور معمول، این با استفاده از قواعد فازی به عنوان بازنمودی از مدل، برای نمونه درخت­ های تصمیم ­گیری فازی [27] یا قواعد وابستگی [28]، در ارتباط است. برای مثال در حوزه­ ی پزشکی، ارائه­ ی یک بازنمود فازی برای متغیرهای عددی که بیمار از خود بروز می­ دهد، تا حد زیادی می­ تواند فهم پیوندهای میان شرح بیماران و رده­ های آنها را افزایش دهد [29،30].

 لازم به ذکر است تفسیرپذیری مدل به نحوی با شیوه ­ای که این مدل مورد استفاده قرار می­ گیرد (برای نمونه، فرآیند درونی جهت تولید یک خروجی با استفاده از مدل) در ارتباط است.

تفسیرپذیری خروجی

 با این وجود، زمانیکه مدل برای داده­ های تست مورد استفاده قرار می­ گیرد، بایستی تفسیرپذیری با خروجی مدل نیز در ارتباط باشد. باید نتایج تولید شده توسط مدل قابل فهم باشند، چرا که اینها اغلب به کاربر نهایی غیر متخصص در دانش کامپیوتر (برای مثال، در نظریه ­ی مجموعه­ های فازی، در یادگیری ماشینی، در آمار، …) ارائه می­ شود. در این مورد فراهم آوردن یک خروجی که بتوان به لحاظ معنایی بیان کرد، و به بیان کلاسیک از دانش دخیل در حوزه­ ی مورد نظر ارتباط داد، حائز اهمیت است. افزون براین، بایستی به دانش زبان­شناختی به عنوان عضوی از یک رده نیز ارتباط داشته باشد، تا به سادگی حتی توسط یک کاربر ناآگاه از مدلسازی فازی درک شود.

برای مثال، در تشخیص سرطان سینه، الگوهای میکروکلسیفیکاسیون تشخیص داده­ شده در ماموگرافی را می ­توان با استفاده از اصطلاحات زبانی رُند یا غیررُند در ارتباط با بازنمود فازی توصیف کرد [7]. خروجی می­ تواند تشخیص دسته­ بندی ­های فازی (برای مثال، احساسات)، یا وابستگی درجات اعتقادی به رده ­ها نیز باشد [24]. 

در این نوع از تفسیرپذیری، حتی الگوریتم ­های داده ­کاوی کلاسیک می ­تواند مورد توجه باشد، چراکه فراهم نمودن آنها با یک مرحله ­ی پیش ­پردازش که در آن خروجی مدل جهت ارائه ­ی برچسب ­های زبانی به کاربر، فازی شده ­است، به سادگی انجام می­ گیرد.  

تفسیرپذیری الگوریتم

آخرین سطحی که در آن  تفسیرپذیری می­ تواند مهم باشد، خود الگوریتم یادگیری است. ما در اینجا تفسیرپذیری را با توجه به کاربر نهایی در نظر می ­گیریم، چرا که اغلب برای اپراتور بیان نحوه­ ی ساخت مدل از مجموعه ­ی داده­ ها، امری مهم است.

در این موارد، بایستی بر قابل فهم بودن الگوریتم تمرکز شود. این نوع تفسیرپذیری تا حد زیادی داده­ کاوی کلاسیک به حساب می­ آید. برای نمونه، براساس کاربران نهایی، قابل فهم بودن الگوریتم یادگیری مبتنی بر درخت تصمیم را می ­توان بالاتر از یکی از الگوریتم­ های SVM در نظر گرفت. در واقع، این الگوریتم دوم نیازمند مفاهیم ریاضی ویژه ­ی بیشتری (ماتریس، بردار، ابر صفحه، بهینه­ سازی مدل و …) نسبت به آنهایی است که در مورد پیشین دخیلند.

در رابطه با این موضوع، در جامعه­ ی داده­ کاوی فازی پژوهش ­های اندکی ارائه شده ­است. تفسیرپذیری الگوریتم، قابل فهم بودن اعتبار آن و اثبات مناسب بودن مکانیزم­ های یادگیری را که بر آنها مبتنی است، درگیر می ­کند. در اینجا اعتبار به عنوان شیوه­ ای که الگوریتم با روند نظری ساخت مدلی که تصور می­ شود با آن­ تناسب می­ یابد، تعریف می­ شود.

برای مثال، در یادگیری ماشینی کلاسیک، اعتبار الگوریتم درخت تصمیم ­گیری بر استفاده از نظریه­ ی اطلاعات که بیانی دقیق و قوی از اقدامات آن فراهم می­ نماید، مبتنی است. به شیوه­ ای مشابه، فراهم نمودن درکی بهتر از الگوریتم ساخت درخت تصمیم­ گیری فازی، در [31،32] پژوهشی جهت مطرح نمودن توجیهی قوی از تعمیم الگوریتم کلاسیک ساخت درخت ­های تصمیم­ گیری تا تطبیق الگوریتم در ساخت درخت­ های تصمیم­ گیری فازی، انجام گرفته است.

در نتیجه، این نوع از تفسیرپذیری و اثبات ­های رسمی اعتبار الگوریتم فازی برای بیان بهتر نحوه­ ی عمل الگوریتم به کاربران نهایی، امری بسیار مهم است.

سفــــارش ترجمـــه دانلود مقاله لاتین  مقاله کامل را اینجا ببینید

می خوای از فایلای با ارزشی که داری درآمد داشته باشی؟ باهامون تماس بگیر