تغییرات تشخیص لحن نظرات

وقتی برای یک محصول هزاران نظر توسط استفاده کننده‌ها قرار داده می‌شود، با چالش تحلیل این نظرات مواجهیم و اینکه بلاخره مخاطب چقدر از محصول ما راضی است. این مشکل وقتی شدیدتر می‌شود که مخاطب بی‌حوصله، نظرش را در چندین حرف _توییت_ می‌کند و حالا ما باید بفهمیم که منظور مخاطب از این واژه‌های اختصاری و شکلک‌های خندان یا عصبانی چیست. بگذریم از مواقعی که برای خود انسان هم فهمیدن لحن نظر، چندان آسان نیست، مثل این یکی: > کتاب خوبی بود، ولی فصل آخرش رو یه‌کم سخته که تنهایی بخونی! # 1.مقدمه ## 1.1 آنالیز احساسی چیست ؟ آنالیز احساسی<a href="#fn-1" rel="footnote">1</a> به معنای یافتن و استخراج اطلاعاتی است که در بطن یک متن وجود دارد . به طور کلی این تکنیک قصد دارد تا با به کارگیری پردازش زبان طبیعی<a href="#fn-2" rel="footnote">2</a> ، پردازش متن <a href="#fn-3" rel="footnote">3</a>و زبان شناسی محاسباتی<a href="#fn-4" rel="footnote">4</a> لحن ، گرایش و حالت یک گوینده یا نویسنده را تشخیص دهد که اصطلاحاً به آن طبقه بندی قطبی <a href="#fn-5" rel="footnote">5</a>گفته می شود . هنگامی که جملاتی کلی و بدون کلمات تعیین کننده (مانند "چه کسی می توانست تا انتهای فیلم بنشیند !") جهت طبقه بندی و امتیاز دهی داریم ، آنالیز احساسی متبلور می شود . ## 1.2 چرا آنالیز احساسی ؟ انسان ها همواره سعی بر طبقه بندی اطلاعات در دسترس خود را داشته اند . امروزه نیز در دنیای کامپیوتر و مخصوصاً در فضای اینترنت با حجم عظیمی از اطلاعات مواجه هستیم . کاربران و محققان تلاش های بسیاری جهت طبقه بندی این اسناد کرده اند . پیشگامان علم هوش مصنوعی تلاش کرده اند تا با به کارگیری از این علم طبقه بندی اسناد را به ماشین ها واگذار کنند . آنالیز احساسی به عنوان یکی از متد های طبقه بندی در اوایل قرن 21 پا به عرصه گدذاشت . ## 1.3 کاربرد های آنالیز احساسی برخی کاربردهای این آنالیز عبارت است از : + نقد ، بررسی و امتیاز دهی در سایتها و شبکه های اجتماعی مختلف + نرم افزارهای هوش تجاری <a href="#fn-6" rel="footnote">6</a> + سیستم های پیشنهاد دهنده <a href="#fn-7" rel="footnote">7</a> + طبقه بندی منابع چند رسانه ای + نرم افزارهای فیلتر کننده ی پیغام # 2.کارهای مرتبط تمامی روش های مطرح شده از آنالیز احساسی استفاده می کنند بر خلاف روش های سنتی تر که از سیستم های طبقه بندی بر اساس تیتر<a href="#fn-8" rel="footnote">8</a> بهره می بردند . به علت حجم زیاد مطالب روش های پیشین به اختصار معرفی شده است . ## 2.1 کارهای پیشین ### 2.1.1 طبقه بندی بر اساس سبک منبع <a href="#fn-9" rel="footnote">9</a> این تقسیم بندی به طور خلاصه بر مبنای تغییرات در متغیر هایی که در سبک یک متن موثرند عمل میکند . به طور مثال سبک نویسنده ای خاص یا ناشری به خصوص یا زبان محلی متن و یا سطح مطالب (عادی یا فلسفی یا روشنفکری و ...) . ### 2.1.2 طبقه بندی بر اساس ژانر یافتن ژانر مطالبی که به طور برونگرا و واضح حرفی از ژانر خلاصی مطرح نکرده اند . مانند یافتن ژانر یک مطلب در یک مجله با در اختیار داشتن سر مقاله ! ### 2.1.3 تعیین استفاده یا عدم استفاده ی متنی از زبان تلویحی یافتن ای مطلب که آیا در یک متن ، نظرات به صورت صریح<a href="#fn-10" rel="footnote">10</a> بیان شده است یا به صورت تلویحی<a href="#fn-11" rel="footnote">11</a> ! ## 2.2 کارهای اخیر بیشتر فعالیت های گذشته در این زمینه یا قسمتی از آنها و یا همه ی آن بر اساس سیستم های دانش محور <a href="#fn-12" rel="footnote">12</a>بوده اند . برخی آنها با بهره گیری از تکنیک های زبانی و ریشه های از پیش تعیین شده ی کلمات<a href=\"#fn-13" rel="footnote">13</a> روی فضای داده ی محدود به یک سری کلمات و جملات خاص کار میکنند . برخی از سیستم های جدید تر با به کارگیری از روش زبان شناسی شناختی<a href="#fn-14" rel="footnote">14</a> یا با کمک گیری از ساختار واژه نامه های تفکیک شده بر اساس لغت<a href="#fn-15" rel="footnote">15</a> (به صورت دستی یا نیمه اتوماتیک) توانستند بر روی هر فضای داده ای به فعالیت بپردازند . اما یک نکته در آنها مشترک بوده و آن این است که هیچ یک از این سیستم ها به طور کلی از اینکه دقیقاً محتوای یک مطلب چیست حرفی نمی زدند . 2 مقاله در سال 2002 به چاپ رسید که ادعا داشت انسانها لزوماً هوش و بصیرت برتری جهت انتخاب لغات حساس<a href="#fn-16" rel="footnote">16</a> در متن را نسبت به ماشین ها ندارند . ### 2.2.1 آنالیز احساسی بر اساس ماشین خودآموز<a href="#fn-17" rel="footnote">17</a>(Turney's) این سیستم مبتنی بر پیاده سازی یک تکنیک بدون سرپرست خودآموز بوده است . سیستم بر اساس یافتن اطلاعات مشترک و شباهت میان عبارات اسناد موجود و کلمات "عالی" و "ضعیف" عمل می کرده و این کار را به کمک جمع آوری آمار به وسیله ی یک موتور جستجو انجام میداده است . ### 2.2.2 آنالیز احساسی بر اساس ماشین خودآموز (Thumbs up) این سیستم شباهت زیادی به سیستم قبلی دارد با این تفاوت که بدون دانش قبلی بوده و همراه با سرپرست است . عملاً در سیستم قبلی این خود ماشین بوده که با فراگیری تفاوت بین "عالی" و "ضعیف" را متوجه می شده اما در این سیستم نیاز به یک سوپروایزر دارد تا در ابتدای امر تمییز بین "عالی" و "ضعیف" را به ماشین بیاموزد . # آزمایش‌ها # کارهای آینده # مراجع > + Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up? Sentiment Classification using Machine Learning Techniques." > > + Liu, Bing, and Lei Zhang. "A survey of opinion mining and sentiment analysis." Mining Text Data. Springer US, 2012. 415-463. > > + Erik Cambria , Björn Schuller , Yunqing Xia , Catherine Havasi . "New Avenues in Opinion Mining and Sentiment Analysis" Published by the IEEE Computer Society 2013 > # پیوندهای مفید + [استفاده از یادگیری عمیق برای تشخیص لحن نظرات](http://nlp.stanford.edu/sentiment) + [Natual Language Processing Course - Sentiment Analysis](https://class.coursera.org/nlp/lecture/preview) + [مجموعه داده آموزشی و آزمایش](http://www.kaggle.com/c/sentiment-analysis-on-movie-reviews/data) + [صفحه مربوط به مسابقه تشخیص لحن نظرات](http://www.kaggle.com/c/sentiment-analysis-on-movie-reviews) <ol> <li dir="ltr" id="fn-1">Sentiment Analysis</li> <li dir="ltr" id="fn-2">Natural Language Processing</li> <li dir="ltr" id="fn-3">Text Analysis</li> <li dir="ltr" id="fn-4">Computational Linguistics</li> <li dir="ltr" id="fn-5">Polarity Classification</li> <li dir="ltr" id="fn-6">Bussiness Intelligence application</li> <li dir="ltr" id="fn-7">Recommender System</li> <li dir="ltr" id="fn-8">Topic-based Classification</li> <li dir="ltr" id="fn-9">Source Style</li> <li dir="ltr" id="fn-10">Objective</li> <li dir="ltr" id="fn-11">Subjective</li> <li dir="ltr" id="fn-12">knowledge-based</li> <li dir="ltr" id="fn-13">pre-selected set of seed words</li> <li dir="ltr" id="fn-14">Cognitive Linguistics</li> <li dir="ltr" id="fn-15">Construction of Discriminant-word Lexicons</li> <li dir="ltr" id="fn-16">Discriminating Words</li> <li dir="ltr" id="fn-17">Learning Machine</li> </ol>