انسان با خواندن یک متن و مشاهده اسم‌ها، مفاهیم را به یاد می‌آورد. یعنی مثلا عبارت استادیوم آزادی با مکانی در دنیای واقع متناظر است که با این واژه‌ها توصیف شده و می‌توانست با واژه‌های دیگری یا حتی زبانی دیگر توصیف شود. منظور از شناسایی موجودیت‌ها همین اتصال عبارات به مفاهیم است.

شناختن موجودیت‌ها باید از روی شواهدی انجام شود. مثلا اینکه موجودیت‌ها با هم در چه روابطی ظاهر شده‌اند. شبکه معنایی زیر از روی چنین نشانه‌هایی ساخته شده است:

شبکه معنایی تشکیل‌شده از موجودیت‌ها و روابط میان آنها

راه دیگری که برای انجام این کار می‌توان پیشنهاد داد، اتصال عبارات به یک دانشنامه مثل ویکی‌پدیا است. مثلا وقتی بتوانیم نام یک انسان را به مدخل متناظر آن در دانشنامه متصل کنیم، تقریبا همه چیز را در مورد او می‌دانیم.

این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار می‌گیرد.

مقدمه

کارهای مرتبط

آزمایش‌ها

کارهای آینده

مراجع

[1] Kok, Stanley, and Pedro Domingos. "Extracting semantic networks from text via relational clustering." Machine Learning and Knowledge Discovery in Databases. Springer Berlin Heidelberg, 2008. 624-639.
[2] Yates, Alexander, and Oren Etzioni. "Unsupervised methods for determining object and relation synonyms on the web." Journal of Artificial Intelligence Research 34.1 (2009): 255.
[3] Lin, Thomas, and Oren Etzioni. "Entity linking at web scale." Proceedings of the Joint Workshop on Automatic Knowledge Base Construction and Web-scale Knowledge Extraction. Association for Computational Linguistics, 2012.
[4] Lin, Thomas, and Oren Etzioni. "No noun phrase left behind: detecting and typing unlinkable entities." Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Association for Computational Linguistics, 2012.

شناسایی موجودیت‌ها

مقدمه

کارهای مرتبط

آزمایش‌ها

کارهای آینده

مراجع

پیوندهای مفید