Data compression is mandatory to manage massive datasets, indexing is fundamental to query them. However, their goals appear as counterposed: the former aims at minimizing data redundancies, whereas the latter augments the dataset with auxiliary information to speed up the query resolution. In this monograph we introduce solutions that overcome this dichotomy. We start by presenting the use of optimization techniques to improve the compression of classical data compression algorithms, then we move to the design of compressed data structures providing fast random access or efficient pattern matching queries on the compressed dataset. These theoretical studies are supported by experimental evidences of their impact in practical scenarios.
ترجمه فارسی (ترجمه ماشینی)
فشردهسازی دادهها برای مدیریت مجموعههای داده عظیم اجباری است، نمایهسازی برای پرس و جوی آنها ضروری است. با این حال، اهداف آنها به صورت متضاد به نظر می رسد: هدف اولی به حداقل رساندن افزونگی داده ها است، در حالی که دومی مجموعه داده را با اطلاعات کمکی برای سرعت بخشیدن به حل پرس و جو تقویت می کند. در این تک نگاری راه حل هایی را معرفی می کنیم که بر این دوگانگی غلبه می کنند. ما با ارائه استفاده از تکنیکهای بهینهسازی برای بهبود فشردهسازی الگوریتمهای فشردهسازی دادههای کلاسیک شروع میکنیم، سپس به طراحی ساختارهای داده فشرده میرویم که دسترسی تصادفی سریع یا جستارهای تطبیق الگوی کارآمد را در مجموعه داده فشرده ارائه میدهند. این مطالعات نظری با شواهد تجربی تأثیر آنها در سناریوهای عملی پشتیبانی می شود.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.