light box
امتیاز 2.93 تجزیه و تحلیل کارایی MapReduce در خوشه بندی اسناد با استفاده از الگوریتم کامینز موازی">

نوع فایل : word
تعداد صفحات : 15
تعداد کلمات : 6800
مجله : Future Computing and Informatics Journal
انتشار : 2018
ترجمه متون داخل جداول : ترجمه شده است
درج جداول در فایل ترجمه : درج شده است
منابع داخل متن : به صورت فارسی درج شده است
کیفیت ترجمه : طلایی
دسته بندی :
برچسب ها : ، ، ، ، ، ، ، ، ، ، ،

عنوان فارسی مقاله:تجزیه و تحلیل کارایی MapReduce در خوشه بندی اسناد با استفاده از الگوریتم  کامینز موازی

 چکیده  

 یکی از تکنیک‌های مهم داده کاوی خوشه بندی است. با توجه به گسترش و دیجیتالی شدن هر زمینه، مجموعه‌های داده بزرگی به سرعت در حال تولید هستند. چنین خوشه بندی مجموعه داده‌های بزرگ به دلیل زمان پردازش زیاد برای الگوریتم‌های خوشه بندی پی در پی سنتی یک چالش است. بنابراین معماری‌ها و الگوریتم‌های موازی توزیع شده برای دستیابی به عملکرد و مقیاس پذیری خوشه بندی مجموعه‌های داده بزرگ مفید هستند. در این مطالعه، ما با استفاده از مدل برنامه نویسی MapReduce یک الگوریتم موازی معنی-معنی را طراحی و آزمایش می‌کنیم و نتیجه را با خوشه‌های مختلف متوالی برای خوشه بندی اندازه‌های مختلف مجموعه داده سند مقایسه می‌کنیم. نتیجه نشان می‌دهد که کامینز پیشنهادی هنگام خوشه بندی اسناد، عملکرد بالاتری بدست می‌آورد و از کامینز پی در پی عملکرد بهتری دارد(تجزیه و تحلیل کارایی MapReduce).

Title: An analysis of MapReduce efficiency in document clustering using parallel K-means algorithm

Abstract

 One of the significant data mining techniques is clustering. Due to expansion and digitalization of each field, large datasets are being generated rapidly. Such large dataset clustering is a challenge for traditional sequential clustering algorithms due to huge processing time. Distributed parallel architectures and algorithms are thus helpful to achieve performance and scalability requirement of clustering large datasets. In this study, we design and experiment a parallel k-means algorithm using MapReduce programming model and compared the result with sequential k-means for clustering varying size of document dataset. The result demonstrates that proposed k-means obtains higher performance and outperformed sequential k-means while clustering documents.

 

ثبت دیدگاه

    • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
    • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
    • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.

برای ارسال دیدگاه شما باید وارد سایت شوید.

محصولات مشابه
المپیای اواسط قرن بیستم: گزارشی در زمینه تاریخ محلی و معماری مدرن، ۱۹۴۵-۱۹۷۵
خـریـد محـصـول
مقاله مربوط به یاتاقان
خـریـد محـصـول
مروری بر کمپرسورها
خـریـد محـصـول
اثر میانجی استرس شغلی بر تأثیر فشار زمان ، تضاد خانواده- کار
خـریـد محـصـول
مزایای عاطفه مثبت:آیا خوشبختی و خوشحالی منجر به موفقیت می شود؟
خـریـد محـصـول
بی عدالتی استعماری: آیا حقوق بین الملل مقصر است و جبران کننده؟
خـریـد محـصـول
“اقدامات حفاظتی به منظور تصرف” در دادگاه کیفری بین المللی
خـریـد محـصـول
تأثیر تفسیر آنلاین در حقوق کیفری بین المللی: پیگیری بیهوده ایده آل سقراطی؟
خـریـد محـصـول
توسعه حقوق بین الملل برای تنظیم و کنترل بهتر اثرات متنوع قرارداد های آتش بس
خـریـد محـصـول
نان رفولمان: (اصل عدم اخراج پناهندگان) و صلاحیت برون سرزمینی: حاکمیت دولت
خـریـد محـصـول
ثبت اختراع یا انتشار مقاله

در اولین مرحله از شروع یک تحقیق جدید نیاز است منابع مختلفی جستجو شود تا جدید بودن ایده مورد بررسی قرار گیرد. یکی از بهترین منابع جهت جستجو، لیست اختراع های ثبت شده است. پایگاه های جستجوی پتنت به محقق کمک میکند پیشینه تحقیق خود را مورد بررسی قرار دهد تا مطمئن شود کار تکراری انجام نمیدهد. لیست اختراعات ثبت شده در اداره ثبت اختراعات ایران دارای طبقه بندی های متفاوتی است. در طبقه بندی بین المللی B که شامل اختراعات حوزه نیاز ها بشری شامل عملیات اجرایی، حمل و نقل شامل: کشتیرانی، ترابری و دیگر موارد را میتوانید در پایگاه جستجوی دارایی های فکری دارکوب مشاهده کنید.

ثبت اختراع یا انتشار مقاله کدام اول باید انجام شود؟ پژوهشگران منابع مالی و غیر مالی بسیاری را صرف انجام تحقیقات و پژوهش ها میکنند و امکان دارد تعدادی از آنها تبدیل به دستاوردها و فناوری های نو گردد. محققان این نتایج را به سرعت در مقالات علمی ملی و بین المللی منتشر و به آن افتخار میکنند. اما باید مد نظر داشت، چنانچه دستاورد پژوهشی امکان تبدیل شدن به یک محصول یا فرآیند قابل استفاده و تولید در صنعت را داشته باشد، هر گونه انتشار عمومی از جمله مقاله باعث از دست رفتن شرط جدید بودن و در نتیجه عدم امکان ثبت فناوری به عنوان اختراع خواهد شد.

در نتیجه محققان و پژوهشگران باید پیش از هرگونه افشاء عمومی آن دسته از نتایج تحقیقاتی که شرایط ثبت اختراع را دارا می باشد به صورت اظهارنامه اختراع در اداره مربوطه ثبت و سپس نسبت به انتشار آنها اقدام کنند. امکان دارد مراحل ثبت اختراع چندین ماه به طول بیانجامد که انتشار مقاله (و مانند آن) پس از تاریخ ثبت اظهارنامه اختراع مشکلی را در فرآیند ثبت اختراع بوجود نمی آورد.

از آنجا که برخی دستاورد ها مانند روشهای تشخیص بیماری و نوآوری های مدیریتی قابلیت ثبت اختراع بین المللی و ملی را ندارند، محققان بدون نگرانی میتوانند انتشار در مقالات داخلی و خارجی را به عنوان اولین گزینه جهت کسب افتخار دست یابی به این قبیل پژوهشها انتخاب کنند.

 
برو بالا