مقاله یک مشخصه آماری تفاضلی مجاورت پیکسل جدید برای تشخیص چهره و عابرپیادهA novel pixel neighborhood differential statistic feature for pedestrian and face detection

در انبار موجود نمی باشد

مقاله یک مشخصه آماری تفاضلی مجاورت پیکسل جدید برای تشخیص چهره و عابرپیادهA novel pixel neighborhood differential statistic feature for pedestrian and face detection

30,000 تومان

ژورنال

ELSEVIER

سال انتشار

2017

صفحات انگلیسی

10 تا 20

صفحات فارسی

20 تا 30

نقد و بررسی

مقاله یک مشخصه آماری تفاضلی مجاورت پیکسل جدید برای تشخیص چهره و عابرپیاده

چکیده فارسی :

به سبب کاربرد موفقیت آمیز الگوی باینری محلی (LBP)، در این مقاله، ما مشخصه آماری تفاضلی مجاورت پیکسل جدیدی برای تشخیص چهره و عابر پیاده بر مبنای چند نقشه کانال، را ارائه می دهیم. محاسبه الگوی باینری محلی، از دو مرحله تشکیل می شود، مشخصه تفاضلی پیکسلی (PDF) و کدگذاری علامت مشخصه تفاضلی پیکسلی. مشخصه تفاضلی پیکسلی، اطلاعات افتراقی از ناحیه محلی ایجاد می کند که می تواند عملکرد آشکارساز عابرپیاده را بهبود بخشد، اما مرحله رمزگذاری، عملکرد را به علت خطای کوانتزه تنزل می دهد. اگرچه مشخصه تفاضلی پیکسلی، از نقشه های کانال اصلی، تمییز بیشتری ایجاد می کند، اما نسبت به نقشه های مشخصه اصلی، بعد بسیار بالاتری دارد و در نتیجه به هزینه محاسبه بالایی نیاز دارد. برای بررسی این مسئله، الگوی تفاضلی مجاورت پیکسل، می توانند با هر دو روش یادگیری نظارتی و غیرنظارتی، آموخته شود، که امکان کشف الگوهای تفاضلی پیکسلی دارای تمییز در ناحیه محلی و دستیابی به نتایج پیشرفته تر را فراهم می آورد. به طور خاص، روش ما، در ابتدا، نقشه های کانال تصویر را به نقشه های سلول با ادغام حداکثر، جمع می کند. آنگاه، مشخصه تفاضلی مجاورت پیکسل مبتنی بر نقشه های هر سلول کانال، محاسبه می شوند که در کدگذاری اطلاعات دارای تمییز در هر منطقه محلی مشارکت دارد و از بهبود عملکرد، سود می برد. علاوه بر این، ما سعی در یادگیری الگوهای آماری تفاضلی دارای تمییز با استفاده از تحلیل دارای تمییز خطی (LDA) و تحلیل مولفه اصلی (PCA) برای بهبود بیشتر عملکرد، داریم. دو مجموعه از آزمایشات، به ترتیب برای تشخیص عابرپیاده و تشخیص چهره، اجرا شده اند. مجموعه داده های INRIA، Caltech،  و ETH برای تشخیص عابرپیاده، و مجموعه داده های FDDB و AFW برای تشخیص چهره از چندنما، مورد استفاده قرار می گیرند. نتایج آزمایشی، نشان می دهند که روش ما در مقایسه با حالت های پیشرفته، که در 20 فریم بر ثانیه، برای تصاویر 480×640، اجرا می شود، عملکرد بهتری دارد.

چکیده انگلیسی:

Motivated by the successful application of Local Binary Pattern (LBP), in this paper we propose a novel pixel neighborhood differential statistic feature for pedestrian and face detection based on the multiple channel maps. The calculation of LBP comprises of two steps, Pixel Differential Feature (PDF) calculation and PDF sign encoding. The PDF distills discriminative information of local region that can improve the performance of the pedestrian detector, but the encoding step degrades the performance due to the quantization error. Although PDF is more discriminative than original channel maps, it has a much higher dimension than the original feature maps, and consequently requiring large computation cost. To address this issue, the pixel neighborhood differential pattern is learned with both supervised and unsupervised learning methods, which allow discovering discriminative pixel differential patterns in local area and achieving state-of-the-art results. Specifically, our method firstly aggregates the image channel maps into cell maps with max pooling. Then, pixel neighborhood differential feature based on each channel cell maps are calculated which contributes to encoding discriminative information in each local area and benefits the performance improvements. In addition, we attempt to learn discriminative differential statistic patterns by using linear discriminative analysis (LDA) and principle component analysis (PCA) for further performance improvement. Two sets of experiments are conducted on pedestrian detection and face detection respectively. The INRIA, Caltech, and ETH datasets are used for pedestrian detection, and the FDDB and AFW datasets for multi-view face detection. The experimental results show that our method achieves superior performance in comparison with the state-of-the-arts while running at 20 fps for 480×640 images.

ژورنال

ELSEVIER

سال انتشار

2017

صفحات انگلیسی

10 تا 20

صفحات فارسی

20 تا 30

دیدگاه خود را در باره این کالا بیان کنید افزودن دیدگاه

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

    هیچ پرسش و پاسخی ثبت نشده است.

پرسش خود را درباره این کالا بیان کنید

ثبت پرسش
انصراف ثبت پرسش

محصولات مرتبط