Many data science resources incorporate statistical methods but lack a deeper statistical perspective. If you’re familiar with the R or Python programming languages and have some exposure to statistics, this quick reference bridges the gap in an accessible, readable format.
With this book, you’ll learn:
• Why exploratory data analysis is a key preliminary step in data science
• How random sampling can reduce bias and yield a higher-quality dataset, even with big data
• How the principles of experimental design yield definitive answers to questions
• How to use regression to estimate outcomes and detect anomalies
• Key classification techniques for predicting which categories a record belongs to
• Statistical machine learning methods that “learn” from data
• Unsupervised learning methods for extracting meaning from unlabeled data
ترجمه فارسی (ترجمه ماشینی)
روش های آماری بخش کلیدی علم داده هستند، با این حال تعداد کمی از دانشمندان داده آموزش آماری رسمی دارند. دوره ها و کتاب های آمار پایه به ندرت موضوع را از منظر علم داده پوشش می دهند. ویرایش دوم این راهنمای محبوب مثالهای جامعی را در پایتون اضافه میکند، راهنماییهای عملی در مورد استفاده از روشهای آماری در علم داده ارائه میدهد، به شما میگوید چگونه از سوء استفاده از آنها جلوگیری کنید، و به شما توصیه میکند که چه چیزی مهم است و چه چیزی نیست.
بسیاری از منابع علم داده از روش های آماری استفاده می کنند، اما فاقد دیدگاه آماری عمیق تر هستند. اگر با زبان های برنامه نویسی R یا Python آشنایی دارید و در معرض آمار و ارقام هستید، این مرجع سریع شکاف را در قالبی قابل دسترس و خوانا پر می کند.
با این کتاب، یاد خواهید گرفت:
• چرا تجزیه و تحلیل داده های اکتشافی یک مرحله مقدماتی کلیدی در علم داده است
• چگونه نمونهگیری تصادفی میتواند سوگیری را کاهش دهد و مجموعه داده با کیفیت بالاتری را حتی با دادههای بزرگ به دست آورد
• چگونه اصول طراحی آزمایشی پاسخ قطعی به سؤالات می دهد
• نحوه استفاده از رگرسیون برای برآورد نتایج و تشخیص ناهنجاری ها
• تکنیک های طبقه بندی کلیدی برای پیش بینی اینکه یک رکورد به کدام دسته تعلق دارد
• روش های آماری یادگیری ماشینی که از داده ها “یاد می گیرند”
• روش های یادگیری بدون نظارت برای استخراج معنا از داده های بدون برچسب
نقد و بررسیها
هنوز بررسیای ثبت نشده است.