در مدلسازی موضوعی، فرض میکنیم که مجموعه متون ورودی از روی چند موضوع نامعلوم ساخته شدهاند و باید این موضوعات را پیدا کنیم. هر موضوع یک توزیع احتمال نامعلوم روی واژهها است و هر متن توزیع احتمالی روی موضوعها.
در این پروژه شما باید روشهای مدلسازی موضوعی را بررسی کنید و یکی از آنها را روی متن زبان فارسی پیادهسازی نموده، سعی کنید نتایج آن را بهبود دهید.
۱. مقدمه
۲. کارهای مرتبط
۳. آزمایشها
۴. کارهای آینده
۵. مراجع
Blei, David M. "Probabilistic topic models." Communications of the ACM 55.4 (2012): 77-84.