تجزیه و تحلیل کارایی MapReduce در خوشه بندی اسناد با استفاده از الگوریتم کامینز موازی

نوع فایل : word

تعداد صفحات : 15

تعداد کلمات : 6800

مجله : Future Computing and Informatics Journal

انتشار : 2018

ترجمه متون داخل جداول : ترجمه شده است

درج جداول در فایل ترجمه : درج شده است

منابع داخل متن : به صورت فارسی درج شده است

کیفیت ترجمه : طلایی

:

تاریخ انتشار
27 می 2021
دسته بندی
تعداد بازدیدها
1626 بازدید
28,000 تومان

عنوان فارسی مقاله:تجزیه و تحلیل کارایی MapReduce در خوشه بندی اسناد با استفاده از الگوریتم  کامینز موازی

 چکیده  

 یکی از تکنیک‌های مهم داده کاوی خوشه بندی است. با توجه به گسترش و دیجیتالی شدن هر زمینه، مجموعه‌های داده بزرگی به سرعت در حال تولید هستند. چنین خوشه بندی مجموعه داده‌های بزرگ به دلیل زمان پردازش زیاد برای الگوریتم‌های خوشه بندی پی در پی سنتی یک چالش است. بنابراین معماری‌ها و الگوریتم‌های موازی توزیع شده برای دستیابی به عملکرد و مقیاس پذیری خوشه بندی مجموعه‌های داده بزرگ مفید هستند. در این مطالعه، ما با استفاده از مدل برنامه نویسی MapReduce یک الگوریتم موازی معنی-معنی را طراحی و آزمایش می‌کنیم و نتیجه را با خوشه‌های مختلف متوالی برای خوشه بندی اندازه‌های مختلف مجموعه داده سند مقایسه می‌کنیم. نتیجه نشان می‌دهد که کامینز پیشنهادی هنگام خوشه بندی اسناد، عملکرد بالاتری بدست می‌آورد و از کامینز پی در پی عملکرد بهتری دارد(تجزیه و تحلیل کارایی MapReduce).

ادامه مطلب

راهنمای خرید:
  • لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.

Title: An analysis of MapReduce efficiency in document clustering using parallel K-means algorithm

Abstract

 One of the significant data mining techniques is clustering. Due to expansion and digitalization of each field, large datasets are being generated rapidly. Such large dataset clustering is a challenge for traditional sequential clustering algorithms due to huge processing time. Distributed parallel architectures and algorithms are thus helpful to achieve performance and scalability requirement of clustering large datasets. In this study, we design and experiment a parallel k-means algorithm using MapReduce programming model and compared the result with sequential k-means for clustering varying size of document dataset. The result demonstrates that proposed k-means obtains higher performance and outperformed sequential k-means while clustering documents.

 
دیدگاهتان را بنویسید