With its flexible capabilities and open-source platform, R has become a major tool for analyzing detailed, high-quality baseball data. Analyzing Baseball Data with R provides an introduction to R for sabermetricians, baseball enthusiasts, and students interested in exploring the rich sources of baseball data. It equips readers with the necessary skills and software tools to perform all of the analysis steps, from gathering the datasets and entering them in a convenient format to visualizing the data via graphs to performing a statistical analysis.
The authors first present an overview of publicly available baseball datasets and a gentle introduction to the type of data structures and exploratory and data management capabilities of R. They also cover the traditional graphics functions in the base package and introduce more sophisticated graphical displays available through the lattice and ggplot2 packages. Much of the book illustrates the use of R through popular sabermetrics topics, including the Pythagorean formula, runs expectancy, career trajectories, simulation of games and seasons, patterns of streaky behavior of players, and fielding measures. Each chapter contains exercises that encourage readers to perform their own analyses using R. All of the datasets and R code used in the text are available online.
This book helps readers answer questions about baseball teams, players, and strategy using large, publically available datasets. It offers detailed instructions on downloading the datasets and putting them into formats that simplify data exploration and analysis. Through the book’s various examples, readers will learn about modern sabermetrics and be able to conduct their own baseball analyses.
ترجمه فارسی (ترجمه ماشینی)
با قابلیتهای انعطافپذیر و پلتفرم منبع باز، R به ابزاری اصلی برای تجزیه و تحلیل دادههای بیسبال با جزئیات و با کیفیت بالا تبدیل شده است. تجزیه و تحلیل داده های بیسبال با R مقدمه ای برای R برای سابرمتری ها، علاقه مندان به بیسبال و دانش آموزانی که علاقه مند به کاوش در منابع غنی داده های بیسبال هستند فراهم می کند. خوانندگان را با مهارتها و ابزارهای نرمافزاری لازم برای انجام تمام مراحل تجزیه و تحلیل، از جمعآوری مجموعههای داده و وارد کردن آنها در قالب مناسب گرفته تا تجسم دادهها از طریق نمودارها تا انجام تجزیه و تحلیل آماری، مجهز میکند.
نویسندگان ابتدا مروری بر مجموعههای داده بیسبال در دسترس عموم و معرفی ملایمی از نوع ساختارهای داده و قابلیتهای اکتشافی و مدیریت داده R ارائه میکنند. آنها همچنین عملکردهای گرافیکی سنتی را در بسته پایه پوشش میدهند و پیچیدهتر را معرفی میکنند. نمایشگرهای گرافیکی از طریق بسته های lattice و ggplot2 در دسترس هستند. بسیاری از کتاب استفاده از R را از طریق موضوعات سابرمتری رایج، از جمله فرمول فیثاغورث، انتظارات، مسیرهای شغلی، شبیهسازی بازیها و فصلها، الگوهای رفتار خطی بازیکنان، و اقدامات میدانی نشان میدهد. هر فصل شامل تمرین هایی است که خوانندگان را تشویق می کند تا تجزیه و تحلیل های خود را با استفاده از R انجام دهند. همه مجموعه داده ها و کد R مورد استفاده در متن به صورت آنلاین در دسترس هستند.
این کتاب به خوانندگان کمک می کند تا به سوالات پاسخ دهند. درباره تیم های بیسبال، بازیکنان و استراتژی با استفاده از مجموعه داده های بزرگ و در دسترس عموم. دستورالعمل های دقیقی را در مورد دانلود مجموعه داده ها و قرار دادن آنها در قالب هایی ارائه می دهد که کاوش و تجزیه و تحلیل داده ها را ساده می کند. از طریق مثالهای مختلف کتاب، خوانندگان با سابرمتری مدرن آشنا میشوند و میتوانند تحلیلهای بیسبال خود را انجام دهند.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.