دانلود کتاب Learning Spark: Lightning-Fast Data Analytics
49,000 تومان
Learning Spark: Lightning-Fast Data Analytics
| موضوع اصلی | کامپیوتر – برنامه نویسی |
|---|---|
| نوع کالا | کتاب الکترونیکی |
| ناشر | O’Reilly Media |
| تعداد صفحه | 300 / 399 |
| حجم فایل | 15.31 مگابایت |
| کد کتاب | 1492050040 , 9781492050049 |
| نوبت چاپ | 2 |
| نویسنده | Brooke Wenig, Denny Lee, Jules S. Damji, Tathagata Das |
|---|---|
| زبان | انگلیسی |
| فرمت | |
| سال انتشار | 2020 |
جدول کد تخفیف
| تعداد کتاب | درصد تخفیف | قیمت کتاب |
| 1 | بدون تخفیف | 25,000 تومان |
| 2 | 20 درصد | 20,000 تومان |
| 3 الی 5 | 25 درصد | 18,750 تومان |
| 6 الی 10 | 30 درصد | 17,500 تومان |
| 11 الی 20 | 35 درصد | 16,250 تومان |
| 21 الی 30 | 40 درصد | 15,000 تومان |
| 31 الی 40 | 45 درصد | 13,750 تومان |
| 41 الی 50 | 50 درصد | 12,500 تومان |
| 51 الی 70 | 55 درصد | 11,250 تومان |
| 71 الی 100 | 60 درصد | 10,000 تومان |
| 101 الی 150 | 65 درصد | 8,750 تومان |
| 151 الی 200 | 70 درصد | 7,500 تومان |
| 201 الی 300 | 75 درصد | 6,250 تومان |
| 301 الی 500 | 80 درصد | 5,000 تومان |
| 501 الی 1000 | 85 درصد | 3,750 تومان |
| 1001 الی 10000 | 90 درصد | 2,500 تومان |
Updated to emphasize new features in Spark 2.x., this second edition shows data engineers and scientists why structure and unification in Spark matters. Specifically, this book explains how to perform simple and complex data analytics and employ machine-learning algorithms. Through discourse, code snippets, and notebooks, you’ll be able to:
• Learn Python, SQL, Scala, or Java high-level APIs: DataFrames and Datasets
• Peek under the hood of the Spark SQL engine to understand Spark transformations and performance
• Inspect, tune, and debug your Spark operations with Spark configurations and Spark UI
• Connect to data sources: JSON, Parquet, CSV, Avro, ORC, Hive, S3, or Kafka
• Perform analytics on batch and streaming data using Structured Streaming
• Build reliable data pipelines with open source Delta Lake and Spark
• Develop machine learning pipelines with MLlib and productionize models using MLflow
• Use open source Pandas framework Koalas and Spark for data transformation and feature engineering
ترجمه فارسی (ترجمه ماشینی)
دادهها بزرگتر میشوند، سریعتر میرسند و در قالبهای متنوعی میآیند – و همه باید در مقیاس برای تجزیه و تحلیل یا یادگیری ماشین پردازش شوند. چگونه می توانید چنین حجم کاری داده های متنوعی را به طور موثر پردازش کنید؟ Apache Spark را وارد کنید.
این ویرایش دوم که برای تأکید بر ویژگیهای جدید در Spark 2.x بهروزرسانی شده است، به مهندسان داده و دانشمندان نشان میدهد که چرا ساختار و یکپارچگی در Spark مهم است. به طور خاص، این کتاب نحوه انجام تجزیه و تحلیل داده های ساده و پیچیده و به کارگیری الگوریتم های یادگیری ماشینی را توضیح می دهد. از طریق گفتمان، قطعه کد و دفترچه یادداشت، شما قادر خواهید بود:
• Python، SQL، Scala، یا APIهای سطح بالای جاوا را بیاموزید: DataFrames و Datasets
• زیر کاپوت موتور Spark SQL نگاه کنید تا تغییرات و عملکرد Spark را درک کنید
• عملیات Spark خود را با تنظیمات Spark و Spark UI بررسی، تنظیم و اشکال زدایی کنید
• اتصال به منابع داده: JSON، Parquet، CSV، Avro، ORC، Hive، S3 یا Kafka
• تجزیه و تحلیل را روی داده های دسته ای و جریانی با استفاده از جریان ساختاری
انجام دهید
• خطوط لوله داده قابل اعتماد را با منبع باز دلتا لیک و اسپارک بسازید
• خطوط لوله یادگیری ماشین را با MLlib توسعه دهید و مدل هایی را با استفاده از MLflow تولید کنید
• از چارچوب پانداهای منبع باز کوالا و اسپارک برای تبدیل داده ها و مهندسی ویژگی ها استفاده کنید

نقد و بررسیها
هنوز بررسیای ثبت نشده است.