احادیث شیعه، یک منبع متنی عظیم و غنی از علوم و معارف اسلامی میباشد که در سالهای اخیر تلاشهای فراوانی در جهت دیجیتالسازی این منبع بزرگ متنی صورت گرفته است.
اما هر جا که منبع بزرگی از متن خام داشته باشیم، میتوان به مسائل و کاربردهای هوش مصنوعی و به ویژه شاخه پردازش زبان طبیعی در این منبع متنی، از قبیل خوشهبندی، ردهبندی و نمایهزنی خودکار، استخراج برچسب، استخراج کلمات کلیدی، پیدا کردن خودکار روایات مشابه و ... اندیشید.
یکی از بزرگترین و اصلیترین منابع روایی شیعه کتاب «وسائل الشیعه» میباشد.
در این پروژه مجموعهای از متن روایات کتاب وسائل الشیعه که به صورت دستی نمایه و برچسب زده شدهاند را به عنوان مجموعهی آموزشی در اختیار داشته و با استفاده از این مجموعه و به کارگیری تکنیکهای یادگیری ماشین در پردازش زبان طبیعی به تحلیل خودکار محتوای روایات خواهیم پرداخت.
مثال:
متن روایت | ترجمه روایت | نمایه | برچسبها |
---|---|---|---|
قَالَ رَسُولُ اللَّهِ السَّلَامُ تَطَوُّعٌ وَ الرَّدُّ فَرِیضَةٌ | رسول الله ص فرمودند: سلام کردن مستحب و پاسخش واجب است | وجوب پاسخ دادن سلام | وجوب+سلام |