ترجمه فارسی توضیحات (ترجمه ماشینی)
مقدمه ای بر حاشیه نویسی زبانی و تجزیه و تحلیل متن
حاشیه نویسی زبانی و تجزیه و تحلیل متن، با کنفرانس های دانشگاهی و رویدادهای صنعتی مانند کارگاه های حاشیه نویسی زبانی و نشست های سالانه تحلیل متن، حوزه های فعال تحقیق و توسعه هستند. این کتاب مقدمه ای اساسی برای هر دو زمینه ارائه می دهد و هدف آن نشان دادن این است که حاشیه نویسی های زبانی خوب پایه اساسی برای تجزیه و تحلیل متن خوب است. پس از بررسی مختصر مبانی XML، با تمرینهای عملی که حاشیهنویسیهای درون خطی و ایستاده را نشان میدهند، فصلی به توضیح سطوح مختلف حاشیهنویسیهای زبانی اختصاص داده شده است. خواننده تشویق می شود تا با استفاده از ابزار حاشیه نویسی زبانی WordFreak، یادداشت های نمونه ایجاد کند. فصل بعدی نشان میدهد که چگونه میتوان با استفاده از ابزارهای آماری NLP، حاشیهنویسیها را بهطور خودکار ایجاد کرد و دو مجموعه از ابزارها، ابزارهای OpenNLP و Stanford NLP را با هم مقایسه میکند. نیمه دوم کتاب فرمت های مختلف حاشیه نویسی را توصیف می کند و مثال های عملی از نحوه مبادله حاشیه نویسی بین فرمت های مختلف با استفاده از تبدیل های XSLT ارائه می دهد. سپس دو معماری اصلی تجزیه و تحلیل متن، GATE و UIMA، با تمرینهای عملی که نحوه پیکربندی و سفارشیسازی آنها را نشان میدهد، توصیف و مقایسه میشوند. فصل آخر مقدمهای بر تجزیه و تحلیل متن است که کاربردها و عملکردهای اصلی از جمله شناسایی موجودیت نامگذاری شده، وضوح مرجع و استخراج اطلاعات را با مثالهای عملی با استفاده از ابزارهای منبع باز و تجاری توصیف میکند. کپیهایی از فایلهای نمونه، اسکریپتها و شیوه نامههای استفاده شده در کتاب از وبسایت همراه، واقع در http://sites.morganclaypool.com/wilcock در دسترس هستند. فهرست مطالب: کار با XML / حاشیه نویسی زبانی / استفاده از ابزارهای آماری NLP / تبادل حاشیه نویسی / معماری حاشیه نویسی / تجزیه و تحلیل متن
Introduction to Linguistic Annotation and Text Analytics
Linguistic annotation and text analytics are active areas of research and development, with academic conferences and industry events such as the Linguistic Annotation Workshops and the annual Text Analytics Summits. This book provides a basic introduction to both fields, and aims to show that good linguistic annotations are the essential foundation for good text analytics. After briefly reviewing the basics of XML, with practical exercises illustrating in-line and stand-off annotations, a chapter is devoted to explaining the different levels of linguistic annotations. The reader is encouraged to create example annotations using the WordFreak linguistic annotation tool. The next chapter shows how annotations can be created automatically using statistical NLP tools, and compares two sets of tools, the OpenNLP and Stanford NLP tools. The second half of the book describes different annotation formats and gives practical examples of how to interchange annotations between different formats using XSLT transformations. The two main text analytics architectures, GATE and UIMA, are then described and compared, with practical exercises showing how to configure and customize them. The final chapter is an introduction to text analytics, describing the main applications and functions including named entity recognition, coreference resolution and information extraction, with practical examples using both open source and commercial tools. Copies of the example files, scripts, and stylesheets used in the book are available from the companion website, located at http://sites.morganclaypool.com/wilcock. Table of Contents: Working with XML / Linguistic Annotation / Using Statistical NLP Tools / Annotation Interchange / Annotation Architectures / Text Analytics
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.