light box
امتیاز 2.65 نظر کاوی در زبان فارسی با استفاده از الگوریتم‌های نظارت شده">

نوع فایل : word
تعداد صفحات : 31
تعداد کلمات : 5090
مجله : Information Sciences
انتشار : 2015
ترجمه ی متون جدول : ترجمه شده است
درج جداول در فایل ترجمه : درج شده است
منابع داخل متن : به صورت فارسی درج شده است
کیفیت ترجمه : طلایی
فونت ترجمه : ب نازنین 12
دسته بندی :
برچسب ها : ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ، ،

عنوان فارسی مقاله:نظر کاوی در زبان فارسی با استفاده از الگوریتم‌های نظارت شده

  چکیده

 رشد سریع اینترنت منجر به تولید حجم زیادی از محتوی تولید شده توسط کاربرد در رسانه‌های اجتماعی، انجمن‌ها، وبلاگ‌ها و غیره شده است. تحلیل خودکار این محتوی برای استخراج اطلاعات ارزشمند از این محتوی‌ها لازم است. نظر کاوی یک فرایند تحلیل نظرات، احساسات و عواطف برای تشخیص سلایق افراد در مورد موضوعات مختلف است. یکی از وظایف نظر کاوی، طبقه بندی یک سند متنی به کلاس‌های مثبت و منفی است. بیشتر تحقیقات در این زمینه از نظر کاوی برای زبان انگلیسی استفاده کرده‌اند. اگرچه زبان فارسی در کشورهای مختلف صحبت می‌شود با این حال هنوز مطالعات بسیار کمی در خصوص نظر کاوی به زبان فارسی وجود دارد. در این مقاله، یک مطالعه جامع بر روی نظر کاوی به زبان فارسی برای بررسی عملکرد نظر کاوی در کشورهای مختلف ارائه شده است. ما در ابتدا یک SentiWordNet فارسی را با استفاده از ورد نت فارسی ایجاد می‌کنیم. سپس این واژه نامه برای وزن دهی به ویژکی ها استفاده می‌شود. نتایج استفاده از سه ماشین بردار پشتیبانی، بیز ساده و رگرسیون لجستیک قبل و بعد از وزن دهی توسط واژه نامه استفاده می‌شوند. آزمایشات نشان می‌دهد که ماشین بردار پشتیبان و رگرسیون لجستیک به نتایج بهتری در بیشتر موارد دست پیدا می‌کنند و استفاده از الگوریتم SO (گرایش معنایی) موجب بهبود صحت رگرسیون لچستیک می‌شود. افزایش تعداد نمونه‌ها و استفاده از مجموعه داده‌های نامتعادل اثر مثبتی بر روی عملکرد نظر کاوی دارد. به طور کلی این تحقیق، نتایج بهتری را در مقایسه با سایر نحقیقات در زمینه نظر کاوی زبان فارسی ارائه می‌کند(زبان فارسی با استفاده از الگوریتم).

Title: Opinion Mining in Persian Language Using Supervised Algorithms

 

Abstract

Rapid growth of Internet results in large amount of user-generated contents in social media, forums, blogs, and etc. Automatic analysis of this content is needed to extract valuable information from these contents. Opinion mining is a process of analyzing opinions, sentiments and emotions to recognize people’s preferences about different subjects. One of the main tasks of opinion mining is classifying a text document into positive or negative classes. Most of the researches in this field applied opinion mining for English language. Although Persian language is spoken in different countries, but there are few studies for opinion mining in Persian language. In this article, a comprehensive study of opinion mining for Persian language is conducted to examine performance of opinion mining in different conditions. First we create a Persian SentiWordNet using Persian WordNet. Then this lexicon is used to weight features. Results of applying three machine learning algorithms Support vector machine (SVM), naive Bayes (NB) and logistic regression are compared before and after weighting by lexicon. Experiments show support vector machine and logistic regression achieve better results in most cases and applying SO (semantic orientation) improves the accuracy of logistic regression. Increasing number of instances and using unbalanced dataset has a positive effect on the performance of opinion mining. Generally this research provides better results comparing to other researches in opinion mining of Persian language.

ثبت دیدگاه

    • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
    • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
    • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.

برای ارسال دیدگاه شما باید وارد سایت شوید.

محصولات مشابه
ارزیابی کارآمد مشاهده پذیر های کوانتوم با استفاده از اندازه گیری های در هم تنیده
خـریـد محـصـول
روش شبه طیفی فضای هیلبرت با هسته‌ی بازآفرین برای بررسی عددی مدل تشکیل مویرگ
خـریـد محـصـول
شناسایی و ارزیابی مهارکننده‌های قوی کرونا ویروس سندرم تنفسی خاورمیانه
خـریـد محـصـول
اولین انتقال شناخته شده فرد به فرد سندرم حاد تنفسی حاد کرونا ویروس ۲ (SARS-CoV-2)
خـریـد محـصـول
ملاحظاتی در خصوص تهیه داده‌های پرونده سلامت الکترونیک برای تحقیقات بالینی
خـریـد محـصـول
توسعه رجیستری تحقیقات بیماری‌های التهابی روده برگرفته از داده‌های مشاهداتی
خـریـد محـصـول
یک چارچوب مستقل برای جست و جوی EHR توزیعی کنترل شده (از نظر واژگان)
خـریـد محـصـول
پرونده سلامت الکترونیک خود را به بهشت نبرید، آن را به علم اهدا کنید
خـریـد محـصـول
انجام تحقیق با استفاده از پرونده سلامت الکترونیک در سیستم‌های چند بیمارستانی
خـریـد محـصـول
پرونده‌های الکترونیکی سلامت شخصی: از تحقیقات زیست پزشکی تا سلامت مردم
خـریـد محـصـول
ثبت اختراع یا انتشار مقاله

ثبت اختراع یا انتشار مقاله کدام اول باید انجام شود؟ پژوهشگران منابع مالی و غیر مالی بسیاری را صرف انجام تحقیقات و پژوهش ها میکنند و امکان دارد تعدادی از آنها تبدیل به دستاوردها و فناوری های نو گردد. محققان این نتایج را به سرعت در مقالات علمی ملی و بین المللی منتشر و به آن افتخار میکنند. اما باید مد نظر داشت، چنانچه دستاورد پژوهشی امکان تبدیل شدن به یک محصول یا فرآیند قابل استفاده و تولید در صنعت را داشته باشد، هر گونه انتشار عمومی از جمله مقاله باعث از دست رفتن شرط جدید بودن و در نتیجه عدم امکان ثبت فناوری به عنوان اختراع خواهد شد.

در نتیجه محققان و پژوهشگران باید پیش از هرگونه افشاء عمومی آن دسته از نتایج تحقیقاتی که شرایط ثبت اختراع را دارا می باشد به صورت اظهارنامه اختراع در اداره مربوطه ثبت و سپس نسبت به انتشار آنها اقدام کنند. امکان دارد مراحل ثبت اختراع چندین ماه به طول بیانجامد که انتشار مقاله (و مانند آن) پس از تاریخ ثبت اظهارنامه اختراع مشکلی را در فرآیند ثبت اختراع بوجود نمی آورد.

از آنجا که برخی دستاورد ها مانند روشهای تشخیص بیماری و نوآوری های مدیریتی قابلیت ثبت اختراع بین المللی و ملی را ندارند، محققان بدون نگرانی میتوانند انتشار در مقالات داخلی و خارجی را به عنوان اولین گزینه جهت کسب افتخار دست یابی به این قبیل پژوهشها انتخاب کنند.

برو بالا