کوئرا یک سایت پرسش و پاسخ است که تفاوتهایی با سایتهای معمول پرسش و پاسخ دارد. این سایت محلی است برای به اشتراک گذاشتن دانش افراد خبره تقریبا در مورد هر چیزی! در واقع این سایت یک پلتفرم برای پرسیدن سوال و گرفتن پاسخ از کسانی است که در زمینه سوال خبره هستند و جوابهای با کیفیتی میدهند.
در حال حاضر ماهانه حدود صد میلیون نفر از این سایت استفاده میکنند. پس پرسیدن سوالهای تکراری امر غیرعادی نخواهد بود. سوالهای تکراری در مورد یک مسئله کار کسانی که به دنبال سوال و جواب خاصی هستند را سخت میکند و همچنین پاسخدهنده را هم مجبور میکند که یک جواب را چند بار تکرار کند. همین مشکلات باعث شده که سوالات تکراری برای Quora تبدیل به یک چالش شود.
در این پروژه قصد داریم مدلی را مبتنی بر یادگیری ماشین برای تشخیص این که آیا یک جفت سوال دریافت شده تکراری هستند یا خیر آموزش داده شود. دادههای مربوط به پرسشهای کوئرا را میتوانید از صفحه مربوط به این مسابقه دریافت نمایید.
۱. مقدمه
۲. کارهای مرتبط
۳. آزمایشها
۴. مراجع
Berry, Michael W., ed. Survey of Text Mining I: Clustering, Classification, and Retrieval. Vol. 1. Springer, 2004.