Dataset shift is a common problem in predictive modeling that occurs when the joint distribution of inputs and outputs differs between training and test stages. Covariate shift, a particular case of dataset shift, occurs when only the input distribution changes. Dataset shift is present in most practical applications, for reasons ranging from the bias introduced by experimental design to the irreproducibility of the testing conditions at training time. (An example is -email spam filtering, which may fail to recognize spam that differs in form from the spam the automatic filter has been built on.) Despite this, and despite the attention given to the apparently similar problems of semi-supervised learning and active learning, dataset shift has received relatively little attention in the machine learning community until recently. This volume offers an overview of current efforts to deal with dataset and covariate shift. The chapters offer a mathematical and philosophical introduction to the problem, place dataset shift in relationship to transfer learning, transduction, local learning, active learning, and semi-supervised learning, provide theoretical views of dataset and covariate shift (including decision theoretic and Bayesian perspectives), and present algorithms for covariate shift. Contributors : Shai Ben-David, Steffen Bickel, Karsten Borgwardt, Michael Brückner, David Corfield, Amir Globerson, Arthur Gretton, Lars Kai Hansen, Matthias Hein, Jiayuan Huang, Takafumi Kanamori, Klaus-Robert Müller, Sam Roweis, Neil Rubens, Tobias Scheffer, Marcel Schmittfull, Bernhard Schölkopf, Hidetoshi Shimodaira, Alex Smola, Amos Storkey, Masashi Sugiyama, Choon Hui Teo Neural Information Processing series
ترجمه فارسی (ترجمه ماشینی)
تغییر مجموعه داده یک مشکل رایج در مدلسازی پیشبینیکننده است که زمانی رخ میدهد که توزیع مشترک ورودیها و خروجیها بین مراحل آموزشی و آزمایشی متفاوت باشد. تغییر متغیر کمکی، یک مورد خاص از جابجایی مجموعه داده ها، زمانی رخ می دهد که فقط توزیع ورودی تغییر کند. تغییر مجموعه داده در اکثر کاربردهای عملی وجود دارد، به دلایلی از تعصب ارائه شده توسط طراحی تجربی تا تکرارناپذیری شرایط آزمایش در زمان آموزش. (مثال فیلتر هرزنامه ایمیل – است که ممکن است هرزنامه هایی را که از نظر شکل متفاوت از هرزنامه هایی که فیلتر خودکار روی آن ساخته شده است، تشخیص ندهد.) با وجود این، و با وجود توجه به مشکلات ظاهرا مشابه یادگیری نیمه نظارتی یادگیری فعال، تغییر مجموعه داده تا همین اواخر در جامعه یادگیری ماشینی توجه نسبتا کمی را به خود جلب کرده است. این جلد مروری بر تلاشهای فعلی برای مقابله با دادهها و تغییر متغیرهای کمکی ارائه میدهد. فصلها مقدمهای ریاضی و فلسفی برای مسئله ارائه میکنند، تغییر دادهها را در رابطه با انتقال یادگیری، انتقال، یادگیری محلی، یادگیری فعال، و یادگیری نیمه نظارت شده قرار میدهند، دیدگاههای نظری از مجموعه دادهها و تغییر متغیرهای کمکی (شامل نظریه تصمیمگیری و دیدگاههای بیزی) ارائه میکنند. ، و الگوریتم هایی را برای تغییر متغیر ارائه دهید. شرکت کنندگان: شای بن دیوید، استفن بیکل، کارستن بورگوارد، مایکل بروکنر، دیوید کورفیلد، امیر گلوبرسون، آرتور گرتون، لارس کای هانسن، ماتیاس هاین، جیایوان هوانگ، تاکافومی کاناموری، کلاوس-رابرت مولر، نیل، ساموی روبنس، توبیاس شفر، مارسل اشمیتفول، برنهارد شلکوپف، هیدتوشی شیمودیرا، الکس اسمولا، آموس استورکی، ماساشی سوگیاما، سری پردازش اطلاعات عصبی چون هوی تئو
نقد و بررسیها
هنوز بررسیای ثبت نشده است.