مقاله بلینک و انجام آن: جستارهای فعل و انفعالی در داده های بسیار بزرگBlink and It’s Done: Interactive Queries on Very Large Data

در انبار موجود نمی باشد

مقاله بلینک و انجام آن: جستارهای فعل و انفعالی در داده های بسیار بزرگBlink and It’s Done: Interactive Queries on Very Large Data

25,000 تومان

ژورنال

International Conference on Very Large Data Bases

سال انتشار

2012

صفحات فارسی

20 تا 30

صفحات انگلیسی

5 تا 10

نقد و بررسی

مقاله بلینک و انجام آن: جستارهای فعل و انفعالی در داده های بسیار بزرگ

چکیده فارسی :

ملاحظه اصلی در BlinkDB در این مورد است که شخص توسط آن می تواند در شرایطی که پاسخ های کاملی وجود ندارد، تصمیمات معقول و منطقی بگیرد. BlinkDB  پشته(stack) Hive/HDFS را توسعه می دهد و در نتیجه پشتیبانی این سیستم ها می تواند به مجموعه ای یکسان از جستارهای SPJA (انتخاب، طرح ریزی، ملحق کردن و بهم پیوستن) رسیدگی نماید. BlinkDB در کنار تضمین خطای آماری پاسخ های زمان واقعی ارائه می نماید و می تواند به شیوه تحمل خطا، پتابایت داده و هزاران دستگاه را مقیاس نماید. آزمایش های ما با استفاده از معیار TPC-H و با توزیع محتوای ویدئو حجم کار دنیای واقعی ناشناخته توسط شرکت Conviva  نشان دادکه BlinkDB می تواند طیف گسترده ای از جستارها را به میزان 150× سریعتر از Hive در MapReduce  و 10 تا – 150 × سریعتر ازShark  (Hive در Spark) و بیش ده ها ترابایت از داده ذخیره شده در 100 دستگاه را با یک خطای 2 – 10 درصدی اجرا نماید.

چکیده انگلیسی :

In this demonstration, we present BlinkDB, a massively parallel, sampling-based approximate query processing framework for running interactive queries on large volumes of data. The key observation in BlinkDB is that one can make reasonable decisions in the absence of perfect answers. BlinkDB extends the Hive/HDFS stack and can handle the same set of SPJA (selection, projection, join and aggregate) queries as supported by these systems. BlinkDB provides real-time answers along with statistical error guarantees, and can scale to petabytes of data and thousands of machines in a fault-tolerant manner. Our experiments using the TPC-H benchmark and on an anonymized real-world video content distribution workload from Conviva Inc. show that BlinkDB can execute a wide range of queries up to 150× faster than Hive on MapReduce and 10−150× faster than Shark (Hive on Spark) over tens of terabytes of data stored across 100 machines, all with an error of 2 − 10%.

ژورنال

International Conference on Very Large Data Bases

سال انتشار

2012

صفحات فارسی

20 تا 30

صفحات انگلیسی

5 تا 10

دیدگاه خود را در باره این کالا بیان کنید افزودن دیدگاه

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

    هیچ پرسش و پاسخی ثبت نشده است.

پرسش خود را درباره این کالا بیان کنید

ثبت پرسش
انصراف ثبت پرسش

محصولات مرتبط