دانلود کتاب C4.5: programs for machine learning
36,000 تومان
C4.5: برنامه هایی برای یادگیری ماشین
موضوع اصلی | تحصیلات |
---|---|
نوع کالا | کتاب الکترونیکی |
ناشر | Morgan Kaufmann Publishers |
تعداد صفحه | 312 |
حجم فایل | 10 مگابایت |
کد کتاب | 1558602380,9781558602380 |
نوبت چاپ | 1 |
نویسنده | |
---|---|
زبان |
انگلیسی |
فرمت |
|
سال انتشار |
1993 |
جدول کد تخفیف
تعداد کتاب | درصد تخفیف | قیمت کتاب |
1 | بدون تخفیف | 25,000 تومان |
2 | 20 درصد | 20,000 تومان |
3 الی 5 | 25 درصد | 18,750 تومان |
6 الی 10 | 30 درصد | 17,500 تومان |
11 الی 20 | 35 درصد | 16,250 تومان |
21 الی 30 | 40 درصد | 15,000 تومان |
31 الی 40 | 45 درصد | 13,750 تومان |
41 الی 50 | 50 درصد | 12,500 تومان |
51 الی 70 | 55 درصد | 11,250 تومان |
71 الی 100 | 60 درصد | 10,000 تومان |
101 الی 150 | 65 درصد | 8,750 تومان |
151 الی 200 | 70 درصد | 7,500 تومان |
201 الی 300 | 75 درصد | 6,250 تومان |
301 الی 500 | 80 درصد | 5,000 تومان |
501 الی 1000 | 85 درصد | 3,750 تومان |
1001 الی 10000 | 90 درصد | 2,500 تومان |
ترجمه فارسی توضیحات (ترجمه ماشینی)
C4.5: برنامه هایی برای یادگیری ماشین
با وجود قدمت، این کلاسیک برای هر کاربر جدی See5 (ویندوز) یا C5.0 (یونیکس) ارزشمند است. C4.5 (See5/C5) یک سیستم طبقه بندی خطی است که اغلب برای یادگیری ماشینی یا به عنوان ابزار داده کاوی برای کشف الگوها در پایگاه داده استفاده می شود. طبقه بندی کننده ها می توانند به شکل درخت تصمیم یا مجموعه قوانین باشند. درست مانند ID3، از استراتژی «تفرقه کن و حکومت کن» استفاده میکند و از آنتروپی (محتوای اطلاعات) برای محاسبه نسبت سود خود (معیارهای تقسیم) استفاده میکند.
C5.0 و See5 بر روی C4.5 ساخته شده اند که منبع باز و رایگان است. با این حال، از آنجایی که C5.0 و See5 محصولات تجاری هستند، کد و موارد داخلی الگوریتمهای See5/C5 عمومی نیستند. به همین دلیل است که این کتاب هنوز بسیار ارزشمند است. نیمه اول کتاب نحوه عملکرد C4.5 را توضیح میدهد و ویژگیهای آن، به عنوان مثال، پارتیشنبندی، هرس و پنجرهسازی را به تفصیل شرح میدهد. این کتاب همچنین در مورد چگونگی استفاده از C4.5 و مشکلات احتمالی با داده های بیش از حد مناسب و غیرنماینده بحث می کند. نیمه دوم کتاب فهرست کاملی از کد منبع را ارائه می دهد. 8800 خط C-code.
C5.0 سریعتر و دقیقتر از C4.5 است و دارای ویژگیهایی مانند اعتبارسنجی متقاطع، هزینههای متغیر طبقهبندی اشتباه و تقویت است که ویژگیهایی هستند که C4.5 ندارد. با این حال، از آنجایی که سوء استفاده جزئی از See5 میتوانست دهها میلیون دلار برای شرکت ما هزینه داشته باشد، مهم است که ما تا حد امکان درباره کاری که انجام میدهیم بدانیم، به همین دلیل این کتاب بسیار ارزشمند بود.
دلایلی که ما برای مثال از شبکه های عصبی استفاده نکردیم عبارت بودند از:
(1) ما داده های اسمی زیادی داشتیم (علاوه بر داده های عددی)
(2) ما صفات ناشناخته داشتیم
(3) مجموعه دادههای ما معمولاً خیلی بزرگ نبودند و همچنان ویژگیهای زیادی داشتیم
(4) برخلاف شبکههای عصبی، درختهای تصمیم و مجموعه قوانین قابل خواندن برای انسان هستند، قابل درک هستند و در صورت لزوم میتوانند به صورت دستی اصلاح شوند. از آنجایی که ما با دادههای غیرنماینده مشکل داشتیم، اما این مشکلات و همچنین سیستم خود را به خوبی درک میکردیم، گاهی اوقات اصلاح درختهای تصمیم برای ما سودمند بود.
اگر در موقعیت مشابهی هستید، See5/C5 و همچنین این کتاب را توصیه می کنم.
Despite its age this classic is invaluable to any serious user of See5 (Windows) or C5.0 (UNIX). C4.5 (See5/C5) is a linear classifier system that is often used for machine learning, or as a data mining tool for discovering patterns in databases. The classifiers can be in the form of either decision trees or rule sets. Just like ID3 it employs a “divide and conquer” strategy and uses entropy (information content) to compute its gain ratio (the split criteria).
C5.0 and See5 are built on C4.5, which is open source and free. However, since C5.0 and See5 are commercial products the code and the internals of the See5/C5 algorithms are not public. This is why this book is still so valuable. The first half of the book explains how C4.5 works, and describes its features, for example, partitioning, pruning, and windowing in detail. The book also discusses how C4.5 should be used, and potential problems with over-fit and non-representative data. The second half of the book gives a complete listing of the source code; 8,800 lines of C-code.
C5.0 is faster and more accurate than C4.5 and has features like cross validation, variable misclassification costs, and boost, which are features that C4.5 does not have. However, since minor misuse of See5 could have cost our company tens of millions of dollars it was important that we knew as much as possible about what we were doing, which is why this book was so valuable.
The reasons we did not use, for example, neural networks were:
(1) We had a lot of nominal data (in addition to numeric data)
(2) We had unknown attributes
(3) Our data sets were typically not very large and still we had a lot of attributes
(4) Unlike neural networks, decision trees and rule sets are human readable, possible to comprehend, and can be modified manually if necessary. Since we had problems with non-representative data but understood these problems as well as our system quite well, it was sometimes advantageous for us to modify the decision trees.
If you are in a similar situation I recommend See5/C5 as well as this book.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.