تجزیه کمعمق به فرآیند شناسایی و ردهبندی بخشهای سطحی (غیر درختی) و بدون همپوشانی از یک جمله گفته میشود. این بخشها به صورت عبارتهای اسمی، عبارتهای فعلی، عبارتهای وصفی (صفت) و عبارتهای حرف اضافهای میتوانند باشند. در واقع در تجزیهی کمعمق ما به دنبال پیدا کردن بخشهای اصلی نحوی در جمله هستیم، اما نمیخواهیم ساختار داخلی هر کدام از این بخشها را نیز کشف کنیم. به این عملیات اصطلاحا Chunking یا Shallow Parsing گفته میشود.
در این پژوهش روشهای مختلف تجزیهی کمعمق را بررسی نموده و یک نمونه عملیاتی برای آن پیادهسازی میشود. مثال:
[NP Jack and Jill] [VP went] [ADVP up] [NP the hill] [VP to fetch] [NP a pail] [PP of] [NP water] .
این پروژه توسط یک بنگاه تجاری تعریف شده است و اگر به خوبی انجام شود، مورد حمایت قرار میگیرد.
مقدمه
کارهای مرتبط
آزمایشها
کارهای آینده
مراجع
[1] Jurafsky, Dan, et al. Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Vol. 2. Upper Saddle River: Prentice Hall, 2000. Chapter 13
[2] Zhang, Tong, Fred Damerau, and David Johnson. "Text chunking based on a generalization of winnow." The Journal of Machine Learning Research 2 (2002): 615-637.
[3] Bird, Steven, Ewan Klein, and Edward Loper. Natural language processing with Python. O'reilly, 2009. Chapter 7