The book is intended for data engineers and scientists working on massive datasets and big data technologies in the cloud. In addition to industry professionals, it is helpful for aspiring data processing professionals and students working in big data processing and cloud computing environments.
ترجمه فارسی (ترجمه ماشینی)
این کتاب ظهور فناوریهای کلان داده و نقش Spark در کل پشته کلان داده را توصیف میکند. Spark و Hadoop را با هم مقایسه می کند و کاستی های Hadoop را که توسط Spark برطرف شده است شناسایی می کند. این کتاب عمدتاً بر روی معماری عمیق Spark و درک ما از Spark RDD ها و اینکه چگونه RDD ماهیت تغییرناپذیر داده های بزرگ را تکمیل می کند، تمرکز دارد و آن را با ارزیابی تنبل، قابل ذخیره سازی و استنتاج نوع حل می کند. همچنین به موضوعات پیشرفته در Spark می پردازد که با اصول اولیه Scala و چارچوب اصلی Spark شروع می شود و فریم های داده Spark، یادگیری ماشین با استفاده از Mllib، تجزیه و تحلیل گراف با استفاده از Graph X و پردازش بلادرنگ با Apache Kafka، AWS Kenisis و Azure را بررسی می کند. مرکز رویداد. سپس به بررسی Spark با استفاده از PySpark و R ادامه میدهد. این کتاب با تمرکز بر پشته دادههای بزرگ فعلی، تعامل با ابزارهای کلان داده فعلی را بررسی میکند، که Spark لایه پردازشی اصلی برای همه انواع داده است.
این کتاب برای مهندسان داده و دانشمندانی است که روی مجموعه داده های عظیم و فناوری های کلان داده در فضای ابری کار می کنند. علاوه بر متخصصان صنعت، برای متخصصان مشتاق پردازش داده و دانش آموزانی که در محیط های پردازش داده های بزرگ و محاسبات ابری کار می کنند مفید است.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.