وقتی برای یک محصول هزاران نظر توسط استفاده کننده‌ها قرار داده می‌شود، با چالش تحلیل این نظرات مواجهیم و اینکه بلاخره مخاطب چقدر از محصول ما راضی است. این مشکل وقتی شدیدتر می‌شود که مخاطب بی‌حوصله، نظرش را در چندین حرف توییت می‌کند و حالا ما باید بفهمیم که منظور مخاطب از این واژه‌های اختصاری و شکلک‌های خندان یا عصبانی چیست. بگذریم از مواقعی که برای خود انسان هم فهمیدن لحن نظر، چندان آسان نیست، مثل این یکی:

کتاب خوبی بود، ولی فصل آخرش رو یه‌کم سخته که تنهایی بخونی!

۱. 1.مقدمه


۱.۱. 1.1 آنالیز احساسی چیست ؟



آنالیز احساسی1 به معنای یافتن و استخراج اطلاعاتی است که در بطن یک متن وجود دارد . به طور کلی این تکنیک قصد دارد تا با به کارگیری پردازش زبان طبیعی2 ، پردازش متن 3و زبان شناسی محاسباتی4 لحن ، گرایش و حالت یک گوینده یا نویسنده را تشخیص دهد که اصطلاحاً به آن طبقه بندی قطبی 5گفته می شود . هنگامی که جملاتی کلی و بدون کلمات تعیین کننده (مانند "چه کسی می توانست تا انتهای فیلم بنشیند !") جهت طبقه بندی و امتیاز دهی داریم ، آنالیز احساسی متبلور می شود .

۱.۲. 1.2 چرا آنالیز احساسی ؟



انسان ها همواره سعی بر طبقه بندی اطلاعات در دسترس خود را داشته اند . امروزه نیز در دنیای کامپیوتر و مخصوصاً در فضای اینترنت با حجم عظیمی از اطلاعات مواجه هستیم . کاربران و محققان تلاش های بسیاری جهت طبقه بندی این اسناد کرده اند . پیشگامان علم هوش مصنوعی تلاش کرده اند تا با به کارگیری از این علم طبقه بندی اسناد را به ماشین ها واگذار کنند . آنالیز احساسی به عنوان یکی از متد های طبقه بندی در اوایل قرن 21 پا به عرصه گداشت .

۱.۳. 1.3 کاربرد های آنالیز احساسی



برخی کاربردهای این آنالیز عبارت است از :

  • نقد ، بررسی و امتیاز دهی در سایتها و شبکه های اجتماعی مختلف

  • نرم افزارهای هوش تجاری 6

  • سیستم های پیشنهاد دهنده 7

  • طبقه بندی منابع چند رسانه ای

  • نرم افزارهای فیلتر کننده ی پیغام


۲. 2.کارهای مرتبط


تمامی روش های مطرح شده از آنالیز احساسی استفاده می کنند بر خلاف روش های سنتی تر که از سیستم های طبقه بندی بر اساس تیتر8 بهره می بردند . به علت حجم زیاد مطالب روش های پیشین به اختصار معرفی شده است .

۲.۱. 2.1 کارهای پیشین


۲.۱.۱. 2.1.1 طبقه بندی بر اساس سبک منبع 9


این تقسیم بندی به طور خلاصه بر مبنای تغییرات در متغیر هایی که در سبک یک متن موثرند عمل میکند . به طور مثال سبک نویسنده ای خاص یا ناشری به خصوص یا زبان محلی متن و یا سطح مطالب (عادی یا فلسفی یا روشنفکری و ...) .

۲.۱.۲. 2.1.2 طبقه بندی بر اساس ژانر



یافتن ژانر مطالبی که به طور برونگرا و واضح حرفی از ژانر خلصی مطرح نکرده اند . مانند یافتن ژانر یک مطلب در یک مجله با در اختیار داشتن سر مقاله !

۲.۱.۳. 2.1.3 تعیین استفاده یا عدم استفاده ی متنی از زبان تلویحی



یافتن ای مطلب که آیا در یک متن ، نظرات به صورت صریح10 بیان شده است یا به صورت تلویحی11 !


۲.۲. 2.2 کارهای اخیر


بیشتر فعالیت های گذشته در این زمینه یا قسمتی از آنها و یا همه ی آن بر اساس سیستم های دانش محور 12بوده اند . برخی آنها با بهره گیری از تکنیک های زبانی و ریشه های از پیش تعیین شده ی کلمات13 روی فضای داده ی محدود به یک سری کلمات و جملات خاص کار میکنند . برخی از سیستم های جدید تر با به کارگیری از روش زبان شناسی شناختی14 یا با کمک گیری از ساختار واژه نامه های تفکیک شده بر اساس لغت15 (به صورت دستی یا نیمه اتوماتیک) توانستند بر روی هر فضای داده ای به فعالیت بپردازند . اما یک نکته در آنها مشترک بوده و آن این است که هیچ یک از این سیستم ها به طور کلی از اینکه دقیقاً محتوای یک مطلب چیست حرفی نمی زدند . 2 مقاله در سال 2002 به چاپ رسید که ادعا داشت انسانها لزوماً هوش و بصیرت برتری جهت انتخاب لغات حساس16 در متن را نسبت به ماشین ها ندارند .

۲.۲.۱. 2.2.1 آنالیز احساسی بر اساس ماشین خودآموز17(Turney's)


این سیستم مبتنی بر پیاده سازی یک تکنیک بدون سرپرست خودآموز بوده است . سیستم بر اساس یافتن اطلاعات مشترک و شباهت میان عبارات اسناد موجود و کلمات "عالی" و "ضعیف" عمل می کرده و این کار را به کمک جمع آوری آمار به وسیله ی یک موتور جستجو انجام میداده است .

۲.۲.۲. 2.2.2 آنالیز احساسی بر اساس ماشین خودآموز (Thumbs up)


این سیستم شباهت زیادی به سیستم قبلی دارد با این تفاوت که بدون دانش قبلی بوده و همراه با سرپرست است . عملاً در سیستم قبلی این خود ماشین بوده که با فراگیری تفاوت بین "عالی" و "ضعیف" را متوجه می شده اما در این سیستم نیاز به یک سوپروایزر دارد تا در ابتدای امر تمییز بین "عالی" و "ضعیف" را به ماشین بیاموزد .

۳. آزمایش‌ها

۴. کارهای آینده

۵. مراجع

  • Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up? Sentiment Classification using Machine Learning Techniques."

  • Liu, Bing, and Lei Zhang. "A survey of opinion mining and sentiment analysis." Mining Text Data. Springer US, 2012. 415-463.

  • Erik Cambria , Björn Schuller , Yunqing Xia , Catherine Havasi . "New Avenues in Opinion Mining and Sentiment Analysis" Published by the IEEE Computer Society 2013

۶. پیوندهای مفید




  1. Sentiment Analysis

  2. Natural Language Processing

  3. Text Analysis

  4. Computational Linguistics

  5. Polarity Classification

  6. Bussiness Intelligence application

  7. Recommender System

  8. Topic-based Classification

  9. Source Style

  10. Objective

  11. Subjective

  12. knowledge-based

  13. pre-selected set of seed words

  14. Cognitive Linguistics

  15. Construction of Discriminant-word Lexicons

  16. Discriminating Words

  17. Learning Machine

محسن رحیمی

نوشته‌ شما از بسیاری از ابعاد دارای مشکل است.
۱- نوشته‌ی شما اصلا با قالب یک پژوهش‌نامه مطابقت نداشته و بسیاری از موارد در آن رعایت نشده (عدم ارجاع در متن، عدم رعایت نکات نگارشی، عدم رعایت ساختار و فصل بندی نامناسب و ...)
۲- از راهنمای مرتب‌نویسی استفاده کنید نوشته‌ی شما بسیار نامرتب است.
۳- استفاده از شماره برای مجزا کردن سرفصل‌ها و عناوین خوب است ولی اینقدر فاصله بین عناوین خوب نیست و همچنین شماره‌گذاری به صورت برعکس و انگلیسی ظاهر نوشته‌ی شما رو بسیار نامناسب جلوه می‌دهد. (اعداد فارسی رو با استفاده از صفحه‌کلید استاندارد فارسی می‌توانید وارد کنید)
۴- "یافتن ای مطلب که آیا در یک متن ، نظرات به صورت صریح بیان شده است یا به صورت تلویحی !" الان این یک متن علمی است!!! توضیح یک عنوان در همین حد.
۵- مراجع شما بسیار کم است. همچنین باید مراجع خود را در متن استفاده کنید و مراجع نیز شماره‌دار باشند. الان چیزی که شما نوشته‌اید هیچ مرجعی ندارد در واقع سرقت علمی انجام داده‌اید!!!!
موارد دیگری هم به چشم می‌آید که اگر خودتان یک بار دیگر پژوهش‌نامه‌ی خود را بخوانید متوجه می‌شوید. حتماْ این موارد را در فاز بعدی اصلاح کنید. استفاده از منابع به‌روز و معتبر کیفیت کار شما را زیاد خواهد کرد.
امیدوارم در فاز بعدی شاهد یک پژوهش‌نامه‌ی خوب و علمی از شما باشیم
خسته نباشید