یکی از بزرگترین اهداف شاخه پردازش زبان طبیعی در هوش مصنوعی، تبدیل متن غیر ساختیافته زبان طبیعی با دانش ساختیافته و ماشین فهم میباشد. این هدف زیل مسائل مختلفی در یادگیری ماشین و پردازش زبان طبیعی از قبیل استخراج اطلاعات، مطالعه ماشینی و ... بیان شده است.
یکی از اشکال مرسوم دانش قابل فهم پردازش توسط ماشین هستان شناسی میباشد. هستانشناسی مدلی انتزاعی از جهان واقع است که مفاهیم و روابط بین آنها را در حوزه موضوعی مورد بحث نمایش میدهد.
روشهای انسانی و یا با ناظر ایجاد یک هستانشناسی، بسیار پر زحمت و پر هزینه میباشد و با توجه به محدودیتهای این روشها، ایجاد یک هستانشناسی عام که وابسته به حوزه موضوعی خاصی نباشد با استفاده از روشهایی که مستلزم نظارت انسانی میباشد بسیار دشوار است.
به همین جهت و با توجه به حجم عظیم منابع متنی غیر ساختیافته تولید شده در سالهای اخیر در قالب وب. دانشمندان حوزه یادگیری ماشین و پردازش زبان طبیعی علاقمند به روشهایی شدهاند که هستانشناسی را با بهرهگیری از این منابع عظیم متنی بدون نیاز به نظارت انسانی ایجاد مینماید. تولید هستانشناسی به صورت بیناظر این امکان را ایجاد میکند که بتوان هستانشناسیهای بسیار عظیم و با حوزه موضوعی عام به سرعت و با هزینه بسیار کمتری ایجاد نمود، همچنین روشهای بیناظر ایجاد هستانشناسی امکان گسترش همیشگی هستانشناسی را با کاوش در سندهای متنی روز افزون وبی را در اختیار قرار خواهد داد.
در این پروژه هدف بررسی روشهای تشخیص آماری الگو و یادگیری ماشین در ایجاد بیناظر هستانشناسی و پیادهسازی یکی از آنها میباشد.
این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار میگیرد.
مقدمه
کارهای مرتبط
آزمایشها
کارهای آینده
مراجع
[1] Wong, Wilson, Wei Liu, and Mohammed Bennamoun. "Ontology learning from text: A look back and into the future." ACM Computing Surveys (CSUR) 44.4 (2012): 20.
[2] Poon, Hoifung, and Pedro Domingos. "Unsupervised ontology induction from text." Proceedings of the 48th annual meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2010.
[3] Mousavi, Hamid, et al. Ontoharvester: An unsupervised ontology generator from free text. CSD Technical Report# 130003), UCLA, 2013.
[4] Nakashole, Ndapandula T. "Automatic extraction of facts, relations, and entities for web-scale knowledge base population." (2013).