خلاصه سازی خودکار چند سندی، روشی برای ارائه فشرده مطالبی است که در ارتباط با یک موضوع بوده ولی جهت دید آنها متفاوت از یکدیگر می باشند. خلاصه خوب، باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاههای مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد.
در این پروژه شما باید سامانهای را توسعه دهید که با دریافت چند سند در مورد یک موضوع، بتواند خلاصهای یکپارچه و فاقد مفاهیم تکراری را به عنوان خروجی ارائه دهد.
مجموعه دادههایی برای آموزش و ارزیابی در زبان انگلیسی و فارسی وجود دارد که سامانهی توسعه داده شده را باید روی این مجموعه دادهها ارزیابی کرده و نتایج را گزارش کنید.
۱. مقدمه
۲. کارهای مرتبط
۳. آزمایشها
۴. کارهای آینده
۵. مراجع
پایان نامه کارشناسی ارشد، خلاصه سازی خودکار چندی سندی مبتنی بر استخراج مفاهیم، آصف پورمعصومی 1390.
Christensen, Janara, et al. "Towards Coherent Multi-Document Summarization." HLT-NAACL. 2013.
پیوندهای مفید