درخت­های تصمیم درهوش مصنوعی[۱۱۵] برای نمایش مفاهیم مختلفی نظیر ساختار جملات، معادلات، حالات بازی، و غیره استفاده می­شوند.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

آشنایی با درخت تصمیم

درخت تصمیم درختی است که نمونه­ها را به نحوی دسته­بندی می­ کند که از ریشه به سمت پائین رشد کرده و در نهایت به گره­های برگ می­رسد. هر گره داخلی یاغیر­برگ[۱۱۶] با یک ویژگی[۱۱۷] مشخص می­ شود. این ویژگی سوالی را در رابطه با مثال ورودی مطرح می­ کند. درهر گره داخلی به تعداد جواب­های ممکن به این سوال شاخه[۱۱۸] وجود دارد که هر یک با مقدار آن جواب مشخص می­شوند. برگ­های این درخت با یک کلاس و یا یک دسته از جواب­ها مشخص می­شوند.
درخت تصمیم پیش ­بینی خود را در قالب یک سری از قوانین توضیح می­دهد در حالیکه در شبکه عصبی تنها پیش ­بینی نهایی بیان می­ شود و چگونگی عملکرد آن در خود شبکه پنهان است. در این سیستم هم مانند شبکه ­های عصبی نیاز به داده ­های آموزشی[۱۱۹] است تا بتوان ساختاردرخت مورد نظر را تشکیل داد.
متغیرها در درخت تصمیم می­توانند به دو صورت عددی یا رده­ای باشند. در صورتی که داده ­ها از نوع عددی باشند، آنگاه برای طبقه ­بندی و ایجاد هر گره باید یک حد­آستانه[۱۲۰] برای ویژگی مورد نظر برای شکستن تصمیم به دو مسیر متفاوت استفاده نمود.
علت نامگذاری آن با درخت تصمیم این است که درخت­فرایند تصمیم ­گیری برای تعیین دسته یک مجموعه مثال از ورودی را نشان می­دهد. شکل ‏۶‑۱ یک درخت تصمیم نمونه که دارای دو کلاس بوده را نشان می­دهد که در آن دو پارامتر  و  به عنوان ویژگی غالب از بین ویژگی­های دیگر اتخاب شده است. پارامترهای  و  به عنوان مقادیر آستانه انتخاب شده ­اند. این درخت دارای ۳ برگ و ۲ گره داخلی بوده و اندازه آن برابر ۵ می­باشد.

شکل ‏۶‑۱: درخت تصمیم نمونه
. برخی اوقات بریدن بعضی شاخه­ های ضعیف­تر درخت، باعث بهبود قدرت پیش ­بینی آن ­شده که به این عملیات هرس[۱۲۱] می­گویند.
از مزایای درخت تصمیم می­توان به نکات زیر اشاره نمود:

    • بیان کردن پیش ­بینی­ها در قالب یکسری از قوانین
    • عدم نیاز به محاسبات خیلی پیچیده به منظور دسته­بندی
    • قابل استفاده برای همه متغیرها گسسته و پیوسته
    • مشخص کردن ویژگی­های غالب در دسته­بندی

الگوریتم­های متفاوتی برای ایجاد درخت وجود دارد که روش  رایج­ترین آن­ها می­باشد.

نحوه عملکرد درخت تصمیم

روش­های مختلفی برای انتخاب نقطه شکست وجود دارد که از آن جمله می­توان به شاخص جینی[۱۲۲] و آنتروپی[۱۲۳] نام برد که به ترتیب در معادلات (‏۶‑۱) و (‏۶‑۲) نشان داده شده است.

(‏۶‑۱)  
(‏۶‑۲)  

در روابط فوق،  میزان فراوانی نمونه خارجی در یک کلاس به کل جمعیت نمونه­ها و  تعداد کلاس­ها یا تعداد دسته­های مجموعه نمونه­ها می­باشد.
در روش  از یک مقدار آماری به نام بهره اطلاعات[۱۲۴] استفاده می شود و با بهره گرفتن از این شاخص مشخص خواهد شد که یک ویژگی تا چه مقدار قادر است مثال­های آموزشی را بر حسب دسته­بندی آنها، جدا کند. در حقیقت با این شاخص تمام ویژگی­های نمونه­های آزمایش را به همراه مقدار آنتروپی هر کلاس بررسی می­ کند. از میان ویژگی­های مختلف، آن ویژگی که مقدار آنتروپی حداقل را دارد را به عنوان ویژگی غالب بر می­گزینند و گره مربوط به آن ویژگی را ایجاد می­ کنند. آنتروپی مقدار خلوص یا ناخالصی، همگنی یا ناهمگنی یک مجموعه دلخواه را بیان می­ کند.

(‏۶‑۳)  
(‏۶‑۴)  
(‏۶‑۵)  
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...