انسان با خواندن یک متن و مشاهده اسمها، مفاهیم را به یاد میآورد. یعنی مثلا عبارت استادیوم آزادی با مکانی در دنیای واقع متناظر است که با این واژهها توصیف شده و میتوانست با واژههای دیگری یا حتی زبانی دیگر توصیف شود. منظور از شناسایی موجودیتها همین اتصال عبارات به مفاهیم است.
شناختن موجودیتها باید از روی شواهدی انجام شود. مثلا اینکه موجودیتها با هم در چه روابطی ظاهر شدهاند. شبکه معنایی زیر از روی چنین نشانههایی ساخته شده است:
راه دیگری که برای انجام این کار میتوان پیشنهاد داد، اتصال عبارات به یک دانشنامه مثل ویکیپدیا است. مثلا وقتی بتوانیم نام یک انسان را به مدخل متناظر آن در دانشنامه متصل کنیم، تقریبا همه چیز را در مورد او میدانیم.
این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار میگیرد.
مقدمه
کارهای مرتبط
آزمایشها
کارهای آینده
مراجع
[1] Kok, Stanley, and Pedro Domingos. "Extracting semantic networks from text via relational clustering." Machine Learning and Knowledge Discovery in Databases. Springer Berlin Heidelberg, 2008. 624-639.
[2] Yates, Alexander, and Oren Etzioni. "Unsupervised methods for determining object and relation synonyms on the web." Journal of Artificial Intelligence Research 34.1 (2009): 255.
[3] Lin, Thomas, and Oren Etzioni. "Entity linking at web scale." Proceedings of the Joint Workshop on Automatic Knowledge Base Construction and Web-scale Knowledge Extraction. Association for Computational Linguistics, 2012.
[4] Lin, Thomas, and Oren Etzioni. "No noun phrase left behind: detecting and typing unlinkable entities." Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Association for Computational Linguistics, 2012.