وقتی برای یک محصول هزاران نظر توسط استفاده کنندهها قرار داده میشود، با چالش تحلیل این نظرات مواجهیم و اینکه بلاخره مخاطب چقدر از محصول ما راضی است. این مشکل وقتی شدیدتر میشود که مخاطب بیحوصله، نظرش را در چندین حرف توییت میکند و حالا ما باید بفهمیم که منظور مخاطب از این واژههای اختصاری و شکلکهای خندان یا عصبانی چیست. بگذریم از مواقعی که برای خود انسان هم فهمیدن لحن نظر، چندان آسان نیست، مثل این یکی:
کتاب خوبی بود، ولی فصل آخرش رو یهکم سخته که تنهایی بخونی!
۱. 1.مقدمه
۱.۱. 1.1 آنالیز احساسی چیست ؟
آنالیز احساسی1 به معنای یافتن و استخراج اطلاعاتی است که در بطن یک متن وجود دارد . به طور کلی این تکنیک قصد دارد تا با به کارگیری پردازش زبان طبیعی2 ، پردازش متن 3و زبان شناسی محاسباتی4 لحن ، گرایش و حالت یک گوینده یا نویسنده را تشخیص دهد که اصطلاحاً به آن طبقه بندی قطبی 5گفته می شود . هنگامی که جملاتی کلی و بدون کلمات تعیین کننده (مانند "چه کسی می توانست تا انتهای فیلم بنشیند !") جهت طبقه بندی و امتیاز دهی داریم ، آنالیز احساسی متبلور می شود .
۱.۲. 1.2 چرا آنالیز احساسی ؟
انسان ها همواره سعی بر طبقه بندی اطلاعات در دسترس خود را داشته اند . امروزه نیز در دنیای کامپیوتر و مخصوصاً در فضای اینترنت با حجم عظیمی از اطلاعات مواجه هستیم . کاربران و محققان تلاش های بسیاری جهت طبقه بندی این اسناد کرده اند . پیشگامان علم هوش مصنوعی تلاش کرده اند تا با به کارگیری از این علم طبقه بندی اسناد را به ماشین ها واگذار کنند . آنالیز احساسی به عنوان یکی از متد های طبقه بندی در اوایل قرن 21 پا به عرصه گذاشت .
۱.۳. 1.3 کاربرد های آنالیز احساسی
برخی کاربردهای این آنالیز عبارت است از :
نقد ، بررسی و امتیاز دهی در سایتها و شبکه های اجتماعی مختلف
نرم افزارهای هوش تجاری 6
سیستم های پیشنهاد دهنده 7
طبقه بندی منابع چند رسانه ای
نرم افزارهای فیلتر کننده ی پیغام
۲. 2.کارهای مرتبط
تمامی روش های مطرح شده از آنالیز احساسی استفاده می کنند بر خلاف روش های سنتی تر که از سیستم های طبقه بندی بر اساس تیتر8 بهره می بردند . به علت حجم زیاد مطالب روش های پیشین به اختصار معرفی شده است .
۲.۱. 2.1 کارهای پیشین
۲.۱.۱. 2.1.1 طبقه بندی بر اساس سبک منبع 9
این تقسیم بندی به طور خلاصه بر مبنای تغییرات در متغیر هایی که در سبک یک متن موثرند عمل میکند . به طور مثال سبک نویسنده ای خاص یا ناشری به خصوص یا زبان محلی متن و یا سطح مطالب (عادی یا فلسفی یا روشنفکری و ...) .
۲.۱.۲. 2.1.2 طبقه بندی بر اساس ژانر
یافتن ژانر مطالبی که به طور برونگرا و واضح حرفی از ژانر خاصی مطرح نکرده اند . مانند یافتن ژانر یک مطلب در یک مجله با در اختیار داشتن سر مقاله !
۲.۱.۳. 2.1.3 تعیین استفاده یا عدم استفاده ی متنی از زبان تلویحی
یافتن ای مطلب که آیا در یک متن ، نظرات به صورت صریح10 بیان شده است یا به صورت تلویحی11 !
۲.۲. 2.2 کارهای اخیر
بیشتر فعالیت های گذشته در این زمینه یا قسمتی از آنها و یا همه ی آن بر اساس سیستم های دانش محور 12بوده اند . برخی آنها با بهره گیری از تکنیک های زبانی و ریشه های از پیش تعیین شده ی کلمات13 روی فضای داده ی محدود به یک سری کلمات و جملات خاص کار میکنند . برخی از سیستم های جدید تر با به کارگیری از روش زبان شناسی شناختی14 یا با کمک گیری از ساختار واژه نامه های تفکیک شده بر اساس لغت15 (به صورت دستی یا نیمه اتوماتیک) توانستند بر روی هر فضای داده ای به فعالیت بپردازند . اما یک نکته در آنها مشترک بوده و آن این است که هیچ یک از این سیستم ها به طور کلی از اینکه دقیقاً محتوای یک مطلب چیست حرفی نمی زدند . 2 مقاله در سال 2002 به چاپ رسید که ادعا داشت انسانها لزوماً هوش و بصیرت برتری جهت انتخاب لغات حساس16 در متن را نسبت به ماشین ها ندارند .
۲.۲.۱. 2.2.1 آنالیز احساسی بر اساس ماشین خودآموز17(Turney's)
این سیستم مبتنی بر پیاده سازی یک تکنیک بدون سرپرست خودآموز بوده است . سیستم بر اساس یافتن اطلاعات مشترک و شباهت میان عبارات اسناد موجود و کلمات "عالی" و "ضعیف" عمل می کرده و این کار را به کمک جمع آوری آمار به وسیله ی یک موتور جستجو انجام میداده است .
۲.۲.۲. 2.2.2 آنالیز احساسی بر اساس ماشین خودآموز (Thumbs up)
این سیستم شباهت زیادی به سیستم قبلی دارد با این تفاوت که بدون دانش قبلی بوده و همراه با سرپرست است . عملاً در سیستم قبلی این خود ماشین بوده که با فراگیری تفاوت بین "عالی" و "ضعیف" را متوجه می شده اما در این سیستم نیاز به یک سوپروایزر دارد تا در ابتدای امر تمییز بین "عالی" و "ضعیف" را به ماشین بیاموزد .
۳. آزمایشها
۴. کارهای آینده
۵. مراجع
Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up? Sentiment Classification using Machine Learning Techniques."
Liu, Bing, and Lei Zhang. "A survey of opinion mining and sentiment analysis." Mining Text Data. Springer US, 2012. 415-463.
Erik Cambria , Björn Schuller , Yunqing Xia , Catherine Havasi . "New Avenues in Opinion Mining and Sentiment Analysis" Published by the IEEE Computer Society 2013
۶. پیوندهای مفید
Sentiment Analysis
Natural Language Processing
Text Analysis
Computational Linguistics
Polarity Classification
Bussiness Intelligence application
Recommender System
Topic-based Classification
Source Style
Objective
Subjective
knowledge-based
pre-selected set of seed words
Cognitive Linguistics
Construction of Discriminant-word Lexicons
Discriminating Words
Learning Machine