بهره گیری از توابع برازش نوین در برنامه نویسی ژنتیک

عنوان فارسی مقاله:بهره گیری از توابع برازش نوین در برنامه نویسی ژنتیک در دسته بندی نامتعادل اطلاعات سرطان پستان

چکیده

سرطان پستان از امراض همه گیر بوده و تشخیص به موقع این بیماری برای پیشگیری لازم است. اطلاعات سرطان پستان به صورت غیر متعادل می‌باشند به طوری که تعداد زیاد سرطانهای خوش خیم و بدخیم گزارش شده است. از مدل‌های یادگیری ماشینی برای دسته بندی سرطان‌های خوش خیم و بدخیم استفاده می‌شود. دقت این مدل‌ها بالا است. یکی از سنجه‌های مناسب جهت سنجش یافته‌های مدل یادگیری ماشینی در اطلاعات سرطان، دقت است. جهت حل مسئله از برنامه نویسی ژنتیک بهره می‌بریم و دو تابع ارائه می‌کنیم. تابع اول، تابع نمره f2 است که بر دسته اقلیت تمرکز دارد و شامل داده‌های بهتری می‌باشد. نمونه دوم، نمره فاصله بوده و بر آموزش هر دو دسته با افزایش وزن تاکید دارد. قالب برنامه ریزی ژنتیک پیاده سازی شده در تابع DGP نام دارد و قالب پیاده شده با نمره ۲ F2GP نام دارد. بیشترین دقت ۹۹٫۳۶ درصد،۹۹٫۵۱ درصد و ۱۰۰ درصد در برنامه‌های ۴۰-۶۰، ۳۰-۷۰ و برنامه ارزیابی ۱۰ بخشی حاصل شد. DGP، بیشترین دقت ۹۹٫۶۳ درصد،۹۸٫۵ و ۱۰۰% مشاهده شد. مدل ارائه شده نرخ فراخوانی صد درصد نشان داد. بهره گیری از تابع نوین در دسته بندی اطلاعات نامتعادل باعث بهتر شدن کارکرد طبقه بند می‌شود.

ادامه مطلب

راهنمای خرید:

لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.

Title: Unbalanced Breast Cancer Data Classification Using Novel Fitness Functions in Genetic Programming

Abstract

Breast Cancer is a common disease and to prevent it, the disease must be identified at earlier stages. Available breast cancer datasets are unbalanced in nature, i.e. there are more instances of benign (non-cancerous) cases then malignant (cancerous) ones. Therefore, it is a challenging task for most machine learning (ML) models to classify between benign and malignant cases properly, even though they have high accuracy. Accuracy is not a good metric to assess the results of ML models on breast cancer dataset because of biased results. To address this issue, we use Genetic Programming (GP) and propose two fitness functions. First one is F2 score which focuses on learning more about the minority class, which contains more relevant information, the second one is a novel fitness function known as Distance score (D score) which learns about both the classes by giving them equal importance and being unbiased. The GP framework in which we implemented D score is named as D-score GP (DGP) and the framework implemented with F2 score is named as F2GP. The proposed F2GP achieved a maximum accuracy of 99.63%, 99.51% and 100% for 60-40, 70-30 partition schemes and 10 fold cross validation scheme respectively and DGP achieves a maximum accuracy of 99.63%, 98.5% and 100% in 60-40, 70-30 partition schemes and 10 fold cross validation scheme respectively. The proposed models also achieves a recall of 100% for all the test cases. This shows that using a new fitness function for unbalanced data classification improves the performance of a classifier.

بهره گیری از توابع برازش نوین در برنامه نویسی ژنتیک

عنوان فارسی مقاله:بهره گیری از توابع برازش نوین در برنامه نویسی ژنتیک در دسته بندی نامتعادل اطلاعات سرطان پستان

چکیده

Title: Unbalanced Breast Cancer Data Classification Using Novel Fitness Functions in Genetic Programming

7 نوشته

4329 محصول

8202 کاربر

0 دیدگاه

تماس با ما:

نمادها

عنوان فارسی مقاله:بهره گیری از توابع برازش نوین در برنامه نویسی ژنتیک در دسته بندی نامتعادل اطلاعات سرطان پستان

چکیده

Title: Unbalanced Breast Cancer Data Classification Using Novel Fitness Functions in Genetic Programming

7 نوشته

4329 محصول

8202 کاربر

0 دیدگاه

تماس با ما:

نمادها

اشتراک گذاری در شبکه های اجتماعی