Deep Learning for Answer Sentence Selection

تغییرات پروژه از ابتدا تا تاریخ 1396/09/06
انتخاب جملات پاسخ با استفاده از یادگیری عمیق
هدف از این پژوهش تشخیص جملاتی است که برای جواب سوال مورد نیاز است و استخراج و شناسایی این جملات با استفاده از یادگیری عمیق انجام میگیرد.

# مقدمه
سیستم های پرسش و پاسخ یکی از مهمترین سیستمهای پردازش زبان طبیعی به شمار میآید. در این مساله قرار است جملات پاسخ با استفاده از اطلاعات سوال به دست آید. انتخاب جملات یکی از مهمترین قسمتهای سیستم پرسش و پاسخ است و باید با استفاده از داده های یادگیری ابزاری را توسعه داد تا بتواند پاسخ مناسب را بیابد.حل  بسیاری از مسائل پردازش زبان طبیعی مانند تحلیل احساسات[1]، تشخیص عبارت[2] و طبقه بندی اسناد[3] با استفاده از شبکه های عصبی عمیق انجام شده است و در این مقاله نیز از این روش برای یافتن پاسخ سوالات استفاده میکنیم. روشهای یافتن پاسخ مناسب برای سوالات به طور کلی به دو قسمت تقسیم میشوند : یک رویکرد بر مبنای تجزیه معنایی است که در این روش معمولا سوالات با توجه به معنای آن به پرس و جوهایی(به طور نمونه یک رابطه سه تایی که معمولا نوع رابطه مشخص نیست و پاسخ سوال نیز همان رابطه است) تبدیل میشود و سپس با استفاده از منابعی مانند پایگاه دانش پاسخ سوال بازیابی میشود. 
روش دیگر که بیشتر به زمینه بازیابی اطلاعات مرتبط است استفاده از دامنه باز است که در ادامه توضیحات مربوط به آن ارائه میگردد. در این روش نیاز به تعدادی مرحله میانی داریم. به عنوان نمونه برای پاسخ به سوال "چه کسی کتاب هری پاتر را نوشت؟" ابتدا سیستم باید نوع سوال را شناسایی کند(مثلا انتخاب شخص) و سپس اسناد مرتبط با سوال را بازیابی کند. سپس با توجه به سوال جمله ای را که حاوی پاسخ است استخراج کرده و پاسخ نهایی در جمله استخراج شده به کاربر نمایش داده میشود. در این مقاله تمرکز اصلی بر انتخاب جملات پاسخ است که در آن از بین جملات پاسخ نامزد یکی به عنوان با ارزش ترین آنها برگردانده میشود. اگر چه که ممکن است جمله پاسخ علاوه بر اینکه حاوی پاسخ نهایی است اطلاعات دیگری را نیز در خود داشته باشد به عنوان نمونه میتوان به پرسش و پاسخ زیر اشاره کرد: 
سوال : از چه زمانی علی کار میکند؟
پاسخ: از زمانی که شرکت آلفا را در سال 1937 تاسیس کرد سود چندانی نبرد
هماهنگونه که در مثال بالا مشاهده میکنید پاسخ سوال به صورت دقیق بیان نشده است بلکه به صورت ضمنی در جمله پاسخ به آن اشاره شده است. در این مقاله، ما نشان می دهیم که مدل مبتنی بر شبکه عصبی را می توان برای تشخیص جملات پاسخ به کار برد.در این مقاله دو مدل ساخته شده است که اولی با استفاده از سبد کلمات است ودومی  یک مدل bigram بر اساس یک شبکه عصبی کانولوشن است. در این مدل شباهت معنایی بین بین جفتهای سوال و پاسخ محاسبه میشود. مدلها با استفاده از مجموعه ایجاد شده در TREC QA به دست آمده اند.


# کارهای مرتبط

کارهای زیادی در زمینه شناسایی پاسخ سوالات انجام شده است اما تنها چند پژوهش مربوط به استفاده از شبکه عصبی عمیق در سیستمهای پرسش  و پاسخ است.  یحی و همکاران[4]با استفاده از یک پایگاه دانش سه تایی سیستم پرسش  و پاسخ تک رابطه ای را ایجاد کرده اند.  Bordes و همکاران. [5,6] نیز از یک نوع شبکه  برای یادگیری پرسش و پاسخ  استفاده کرده اند.  

# معرفی دادگان
مجموعه دادگان پرسش  و پاسخ مجموعه ای است از پاسخهای مرتبط به هر سوال. وانگ و همکاران [20] این مجموعه داده را از 
اطلاعات مربوط به کنفرانس (TREC) استخراج کرده اند که پاسخهای کاندید به صورت خودکار از هر بخش از اسناد انتخاب شده است. شکل زیر اطلاعات آماری مجموعه دادگان را بیان میکند: 

![اطلاعات آماری مجموعه دادگان پرسش و پاسخ](https://boute.s3.amazonaws.com/303-Untitled.jpg)
# معماری مورد استفاده



# نحوه آموزش شبکه


# پیاده سازی 


# ابزار مورد استفاده

# نتایج

# مراجع
 [1]Karl Moritz Hermann and Phil Blunsom. The role of syntax in vector space models of compo-sitional semantics. In Proceedings of ACL, 2013 
 [2] Nal Kalchbrenner, Edward Grefenstette, and Phil Blunsom. A convolutional neural network
for modelling sentences. In Proceedings of ACL, 2014.
[3]Richard Socher, Brody Huval, Christopher D. Manning, and Andrew Y. Ng. Semantic compo-sitionality through recursive matrix-vector spaces. In Proceedings of EMNLP-CoNLL, 2012.
[4]Wen-tau Yih, Xiaodong He, and Christopher Meek. Semantic parsing for single-relation ques-tion answering. In Proceedings of ACL, 2014.
[5] Antoine Bordes, Sumit Chopra, and Jason Weston. Question answering with subgraph embed-dings. In Proceedings of EMNLP, 2014.
[6]Antoine Bordes, Jason Weston, and Nicolas Usunier. Open question answering with weakly
supervised embedding models. In Proceedings of ECML, 2014.