نظر کاوی در زبان فارسی با استفاده از الگوریتم‌های نظارت شده

نوع فایل : word

تعداد صفحات : 31

تعداد کلمات : 5090

مجله : Information Sciences

انتشار : 2015

ترجمه ی متون جدول : ترجمه شده است

درج جداول در فایل ترجمه : درج شده است

منابع داخل متن : به صورت فارسی درج شده است

کیفیت ترجمه : طلایی

فونت ترجمه : ب نازنین 12

تاریخ انتشار
18 جولای 2020
دسته بندی
تعداد بازدیدها
1559 بازدید
26,500 تومان

عنوان فارسی مقاله:نظر کاوی در زبان فارسی با استفاده از الگوریتم‌های نظارت شده

  چکیده

 رشد سریع اینترنت منجر به تولید حجم زیادی از محتوی تولید شده توسط کاربرد در رسانه‌های اجتماعی، انجمن‌ها، وبلاگ‌ها و غیره شده است. تحلیل خودکار این محتوی برای استخراج اطلاعات ارزشمند از این محتوی‌ها لازم است. نظر کاوی یک فرایند تحلیل نظرات، احساسات و عواطف برای تشخیص سلایق افراد در مورد موضوعات مختلف است. یکی از وظایف نظر کاوی، طبقه بندی یک سند متنی به کلاس‌های مثبت و منفی است. بیشتر تحقیقات در این زمینه از نظر کاوی برای زبان انگلیسی استفاده کرده‌اند. اگرچه زبان فارسی در کشورهای مختلف صحبت می‌شود با این حال هنوز مطالعات بسیار کمی در خصوص نظر کاوی به زبان فارسی وجود دارد. در این مقاله، یک مطالعه جامع بر روی نظر کاوی به زبان فارسی برای بررسی عملکرد نظر کاوی در کشورهای مختلف ارائه شده است. ما در ابتدا یک SentiWordNet فارسی را با استفاده از ورد نت فارسی ایجاد می‌کنیم. سپس این واژه نامه برای وزن دهی به ویژکی ها استفاده می‌شود. نتایج استفاده از سه ماشین بردار پشتیبانی، بیز ساده و رگرسیون لجستیک قبل و بعد از وزن دهی توسط واژه نامه استفاده می‌شوند. آزمایشات نشان می‌دهد که ماشین بردار پشتیبان و رگرسیون لجستیک به نتایج بهتری در بیشتر موارد دست پیدا می‌کنند و استفاده از الگوریتم SO (گرایش معنایی) موجب بهبود صحت رگرسیون لچستیک می‌شود. افزایش تعداد نمونه‌ها و استفاده از مجموعه داده‌های نامتعادل اثر مثبتی بر روی عملکرد نظر کاوی دارد. به طور کلی این تحقیق، نتایج بهتری را در مقایسه با سایر نحقیقات در زمینه نظر کاوی زبان فارسی ارائه می‌کند(زبان فارسی با استفاده از الگوریتم).

ادامه مطلب

راهنمای خرید:
  • لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.

Title: Opinion Mining in Persian Language Using Supervised Algorithms

 

Abstract

Rapid growth of Internet results in large amount of user-generated contents in social media, forums, blogs, and etc. Automatic analysis of this content is needed to extract valuable information from these contents. Opinion mining is a process of analyzing opinions, sentiments and emotions to recognize people’s preferences about different subjects. One of the main tasks of opinion mining is classifying a text document into positive or negative classes. Most of the researches in this field applied opinion mining for English language. Although Persian language is spoken in different countries, but there are few studies for opinion mining in Persian language. In this article, a comprehensive study of opinion mining for Persian language is conducted to examine performance of opinion mining in different conditions. First we create a Persian SentiWordNet using Persian WordNet. Then this lexicon is used to weight features. Results of applying three machine learning algorithms Support vector machine (SVM), naive Bayes (NB) and logistic regression are compared before and after weighting by lexicon. Experiments show support vector machine and logistic regression achieve better results in most cases and applying SO (semantic orientation) improves the accuracy of logistic regression. Increasing number of instances and using unbalanced dataset has a positive effect on the performance of opinion mining. Generally this research provides better results comparing to other researches in opinion mining of Persian language.

دیدگاهتان را بنویسید