دانلود کتاب C4.5: programs for machine learning

36,000 تومان

C4.5: برنامه هایی برای یادگیری ماشین


موضوع اصلی تحصیلات
نوع کالا کتاب الکترونیکی
ناشر Morgan Kaufmann Publishers
تعداد صفحه 312
حجم فایل 10 مگابایت
کد کتاب 1558602380,9781558602380
نوبت چاپ 1
نویسنده

زبان

انگلیسی

فرمت

PDF

سال انتشار

1993

مطلب پیشنهادی: با پول کتاب در ایران چی میشه خرید؟
در صورت نیاز به تبدیل فایل به فرمت‌های PDF، EPUB، AZW3، MOBI و یا DJVU می‌توانید به پشتیبان اطلاع دهید تا در صورت امکان، فایل مورد نظر را تبدیل نمایند. سایت بَلیان دارای تخفیف پلکانی است، یعنی با افزودن کتاب بیشتر به سبدخرید، قیمت آن برای شما کاهش می‌یابد. جهت مشاهده درصد تخفیف‌ها بر روی «جدول تخفیف پلکانی» در پایین کلیک نمایید. جهت یافتن سایر کتاب‌های مشابه، از منو جستجو در بالای سایت استفاده نمایید.
شما می‌توانید با هر 1000 تومان خرید، ۱ شانس شرکت در قرعه‌کشی کتابخانه دیجیتال بلیان دریافت کنید و شانس خود را برای برنده شدن جوایز هیجان انگیز امتحان کنید. «شرایط شرکت در قرعه‌کشی»

جدول کد تخفیف

با افزودن چه تعداد کتاب به سبد‌خرید، چند‌ درصد تخفیف شامل آن خواهد شد؟ در این جدول پاسخ این سوال را خواهید یافت. برای مثال: اگر بین ۳ الی ۵ کتاب را در سبد خرید خود قرار دهید، ۲۵ درصد تخفیف شامل سبد‌خرید شما خواهد شد.
تعداد کتاب درصد تخفیف قیمت کتاب
1 بدون تخفیف 25,000 تومان
2 20 درصد 20,000 تومان
3 الی 5 25 درصد 18,750 تومان
6 الی 10 30 درصد 17,500 تومان
11 الی 20 35 درصد 16,250 تومان
21 الی 30 40 درصد 15,000 تومان
31 الی 40 45 درصد 13,750 تومان
41 الی 50 50 درصد 12,500 تومان
51 الی 70 55 درصد 11,250 تومان
71 الی 100 60 درصد 10,000 تومان
101 الی 150 65 درصد 8,750 تومان
151 الی 200 70 درصد 7,500 تومان
201 الی 300 75 درصد 6,250 تومان
301 الی 500 80 درصد 5,000 تومان
501 الی 1000 85 درصد 3,750 تومان
1001 الی 10000 90 درصد 2,500 تومان
توضیحات

ترجمه فارسی توضیحات (ترجمه ماشینی)

C4.5: برنامه هایی برای یادگیری ماشین

با وجود قدمت، این کلاسیک برای هر کاربر جدی See5 (ویندوز) یا C5.0 (یونیکس) ارزشمند است. C4.5 (See5/C5) یک سیستم طبقه بندی خطی است که اغلب برای یادگیری ماشینی یا به عنوان ابزار داده کاوی برای کشف الگوها در پایگاه داده استفاده می شود. طبقه بندی کننده ها می توانند به شکل درخت تصمیم یا مجموعه قوانین باشند. درست مانند ID3، از استراتژی «تفرقه کن و حکومت کن» استفاده می‌کند و از آنتروپی (محتوای اطلاعات) برای محاسبه نسبت سود خود (معیارهای تقسیم) استفاده می‌کند.

C5.0 و See5 بر روی C4.5 ساخته شده اند که منبع باز و رایگان است. با این حال، از آنجایی که C5.0 و See5 محصولات تجاری هستند، کد و موارد داخلی الگوریتم‌های See5/C5 عمومی نیستند. به همین دلیل است که این کتاب هنوز بسیار ارزشمند است. نیمه اول کتاب نحوه عملکرد C4.5 را توضیح می‌دهد و ویژگی‌های آن، به عنوان مثال، پارتیشن‌بندی، هرس و پنجره‌سازی را به تفصیل شرح می‌دهد. این کتاب همچنین در مورد چگونگی استفاده از C4.5 و مشکلات احتمالی با داده های بیش از حد مناسب و غیرنماینده بحث می کند. نیمه دوم کتاب فهرست کاملی از کد منبع را ارائه می دهد. 8800 خط C-code.

C5.0 سریع‌تر و دقیق‌تر از C4.5 است و دارای ویژگی‌هایی مانند اعتبارسنجی متقاطع، هزینه‌های متغیر طبقه‌بندی اشتباه و تقویت است که ویژگی‌هایی هستند که C4.5 ندارد. با این حال، از آنجایی که سوء استفاده جزئی از See5 می‌توانست ده‌ها میلیون دلار برای شرکت ما هزینه داشته باشد، مهم است که ما تا حد امکان درباره کاری که انجام می‌دهیم بدانیم، به همین دلیل این کتاب بسیار ارزشمند بود.

دلایلی که ما برای مثال از شبکه های عصبی استفاده نکردیم عبارت بودند از:
(1) ما داده های اسمی زیادی داشتیم (علاوه بر داده های عددی)
(2) ما صفات ناشناخته داشتیم
(3) مجموعه داده‌های ما معمولاً خیلی بزرگ نبودند و همچنان ویژگی‌های زیادی داشتیم
(4) برخلاف شبکه‌های عصبی، درخت‌های تصمیم و مجموعه قوانین قابل خواندن برای انسان هستند، قابل درک هستند و در صورت لزوم می‌توانند به صورت دستی اصلاح شوند. از آنجایی که ما با داده‌های غیرنماینده مشکل داشتیم، اما این مشکلات و همچنین سیستم خود را به خوبی درک می‌کردیم، گاهی اوقات اصلاح درخت‌های تصمیم برای ما سودمند بود.

اگر در موقعیت مشابهی هستید، See5/C5 و همچنین این کتاب را توصیه می کنم.

C4.5: programs for machine learning

Despite its age this classic is invaluable to any serious user of See5 (Windows) or C5.0 (UNIX). C4.5 (See5/C5) is a linear classifier system that is often used for machine learning, or as a data mining tool for discovering patterns in databases. The classifiers can be in the form of either decision trees or rule sets. Just like ID3 it employs a “divide and conquer” strategy and uses entropy (information content) to compute its gain ratio (the split criteria).

C5.0 and See5 are built on C4.5, which is open source and free. However, since C5.0 and See5 are commercial products the code and the internals of the See5/C5 algorithms are not public. This is why this book is still so valuable. The first half of the book explains how C4.5 works, and describes its features, for example, partitioning, pruning, and windowing in detail. The book also discusses how C4.5 should be used, and potential problems with over-fit and non-representative data. The second half of the book gives a complete listing of the source code; 8,800 lines of C-code.

C5.0 is faster and more accurate than C4.5 and has features like cross validation, variable misclassification costs, and boost, which are features that C4.5 does not have. However, since minor misuse of See5 could have cost our company tens of millions of dollars it was important that we knew as much as possible about what we were doing, which is why this book was so valuable.

The reasons we did not use, for example, neural networks were:
(1) We had a lot of nominal data (in addition to numeric data)
(2) We had unknown attributes
(3) Our data sets were typically not very large and still we had a lot of attributes
(4) Unlike neural networks, decision trees and rule sets are human readable, possible to comprehend, and can be modified manually if necessary. Since we had problems with non-representative data but understood these problems as well as our system quite well, it was sometimes advantageous for us to modify the decision trees.

If you are in a similar situation I recommend See5/C5 as well as this book.

نظرات (0)

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “دانلود کتاب C4.5: programs for machine learning”