خوشه بندی و کلاسترینگ دقیق با استفاده از تنظیم داده های پرت-پراکندگی

نوع فایل : word

تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش : 58

تعداد کلمات : 11000

مجله : IEEE TRANSACTIONS ON SIGNAL PROCESSING

انتشار : 2012

ترجمه متون داخل جداول : ترجمه شده است

درج جداول در فایل ترجمه : درج شده است

منابع داخل متن : به صورت فارسی درج شده است

کیفیت ترجمه : طلایی

:

تاریخ انتشار
27 مارس 2020
دسته بندی
تعداد بازدیدها
959 بازدید
22,000 تومان

عنوان فارسی مقاله:خوشه بندی و کلاسترینگ دقیق با استفاده از تنظیم داده های پرت-پراکندگی

 چکیده

علیرغم محبوبیت الگوریتم های خوشه بندی معمولی مانند K-میانگین و خوشه بندی احتمالی ، نتایج خوشه بندی آنها نسبت به حضور محیط در داده حساس است.  حتی  برخی داده های پرت، توانایی این الگوریتم ها را به منظور شناسایی ساختار های پنهان معنی دار  به خطر انداخته و موجب می شود تا برایند غیر قابل اطمینان باشد.. این مقاله الگوریتم های خوشه بندی قوی را توسعه می دهد که نه تنها هدف جمع آوری داده ها ، بلکه همچنین برای شناسایی فاصله های دور است. رویکردهای جدید به حضور کمیاب موارد دوردست در داده ها وابسته است ، که در یک دامنه منتخب و منطقی به کمبودی ترجمه می شود. با استفاده از پراکندگی کمترین دامنه در دامنه دور ، به معنای K قدرتمند آگاهانه و رویکردهای خوشهای احتمالی پیشنهاد شده است. تازگی آنها در شناسایی نقاط دوردست در حالی که کمبودی در حوزه دورافتاده از طریق تنظیم دقیق انتخاب شده دارد ، نهفته است. یک رویکرد نزول مختصات بلوک برای به دست آوردن الگوریتم های تکراری با ضمانت های همگرایی و پیچیدگی بیش از حد محاسباتی بیش از حد با توجه به همتایان غیر قوی خود توسعه یافته است. نسخه های هسته ای از الگوریتم های خوشه بندی قوی همچنین برای رسیدگی به کارآمد با داده های با ابعاد بالا ، شناسایی خوشه های غیرقابل تقسیم و یا حتی اشیاء خوشه ای که توسط بردارها ارائه نمی شوند ، تهیه شده اند. تست های عددی در هر دو مجموعه داده مصنوعی و واقعی ، اعتبار و عملکرد الگوریتم های رمان را تأیید می کند(استفاده از تنظیم داده های پرت-پراکندگی).

 

ادامه مطلب

راهنمای خرید:
  • لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.

 Title: Robust Clustering Using Outlier-Sparsity Regularization

Abstract

Notwithstanding the popularity of conventional clustering algorithms such as K-means and probabilistic clustering, their clustering results are sensitive to the presence of outliers in the data. Even a few outliers can compromise the ability of these algorithms to identify meaningful hidden structures rendering their outcome unreliable. This paper develops robust clustering algorithms that not only aim to cluster the data, but also to identify the outliers. The novel approaches rely on the infrequent presence of outliers in the data, which translates to sparsity in a judiciously chosen domain. Leveraging sparsity in the outlier domain, outlier-aware robust K-means and probabilistic clustering approaches are proposed. Their novelty lies on identifying outliers while effecting sparsity in the outlier domain through carefully chosen regularization. A block coordinate descent approach is developed to obtain iterative algorithms with convergence guarantees and small excess computational complexity with respect to their non-robust counterparts. Kernelized versions of the robust clustering algorithms are also developed to efficiently handle high-dimensional data, identify nonlinearly separable clusters, or even cluster objects that are not represented by vectors. Numerical tests on both synthetic and real datasets validate the performance and applicability of the novel algorithms.

دیدگاهتان را بنویسید