مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وبA hadoop based platform fornatural language processing of web pages and documents

0 (0)

0دیدگاه کاربران

دسته: مقاله ترجمه شده Distributed System, دانلود رایگان مقاله ISI رشته کامپیوتر و IT, مقاله ترجمه شده Computer IT, مقاله ترجمه شده Internet, مقاله ترجمه شده اینترنت, مقاله ترجمه شده سیستم توزیع شده, مقاله ترجمه شده کامپیوتر IT, مقاله ترجمه شده وب

برچسب: اسناد وب, پردازش زبان, پلتفرم, مقاله Distributed System, مقاله Internet, هادوپ

در انبار موجود نمی باشد

مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وبA hadoop based platform fornatural language processing of web pages and documents

Name: مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وب - بیت کامپیوتر
Price: 250000 IRR
Availability: InStock

0 (0)

0دیدگاه کاربران

برچسب: اسناد وب, پردازش زبان, پلتفرم, مقاله Distributed System, مقاله Internet, هادوپ

ژورنال	ELSEVIER
سال انتشار	2015
صفحات انگلیسی	5 تا 10
صفحات فارسی	10 تا 20

دانلود رایگان اصل مقاله

نقد و بررسی

مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وب

چکیده فارسی :

فراگیری سریع و گشترده اطلاعات از طریق وب، انتشار و مقدار ساختار غیرطبیعی یک منبع متنی را افزایش داده است. علاقه زیادی در دهه گذشته برای کشف، دسترسی، و به اشتراک گذاری مانند توقف منبع دانش کشف شد. به همین دلیل، منبع بسیار بزرگ پردازش در یک چارچوب زمانی قابل قبول یک چالش بزرگ و نیاز دوره ای برای بسیاری از زمینه های تحقیقاتی و تجاری است. سیستم های توزیع شده، خوشه های کامپیوتری و الگوهای محاسباتی موازی، در سالهای اخیر به سرعت استفاده شده اند، آنجایی که آنها پیشرفتهای قابل توجهی را برای عملکرد محاسباتی در زمینه های گسترده اطلاعاتی، همانند داده کاوی بزرگ و تحلیل معرفی کردند. پردازش زبان طبیعی و به ویژه وظایف متن یک نماد و استخراج ویژگی های کلیدی، یک ناحیه کاربردی با نیازهای محاسباتی بالا هستند، بنابراین، این وظایف به صورت قابل توجهی می توانند مزیت معماری های موازی را انجام دهند. این مقاله یک چارچوب توزیع شده را برای مرور اسناد وب و اجرای وظایف پردازش زبان طبیعی در یک حالت موازی بیان می کند. این سیستم براساس اکوسیستم هادوپ آپاچی است و الگوی برنامه نویسی موازی آن، map reduce نامیده می شود. به خصوص، ما اقتباسی از MAP REDUCE کاربرد GATE و چارچوب (یک ابزار منبع باز گسترده برای مهندسی متن و NLP) اجرا کردیم. اعتبار نیز با استفاده از راه حلی برای استخراج کلمات کلیدی و عبارات کلیدی اسناد وب در خوشه بندی هادوپ چند گره ای پیشنهاد می شود. ارزیابی عملکرد، به صورت مقیاس پذیری در مقابل یک مجموعه واقعی از صفحات وب و اسناد انجام شده است.

چکیده انگلیسی:

The rapid and extensive pervasion of information through the web has enhanced the diffusion of a huge amount of unstructured natural language textual resources. A great interest has arisen in the last decade for discovering, accessing and sharing such a vast source of knowledge. For this reason, processing very large data volumes in a reasonable time frame is becoming a major challenge and a crucial requirement for many commercial and research fields. Distributed systems, computer clusters and parallel computing paradigms have been increasingly applied in the recent years, since they introduced significant improvements for computing performance in data-intensive contexts, such as Big Data mining and analysis. Natural Language Processing, and particularly the tasks of text annotation and key feature extraction, is an application area with high computational requirements; therefore, these tasks can significantly benefit of parallel architectures. This paper presents a distributed framework for crawling web documents and running Natural Language Processing tasks in a parallel fashion. The system is based on the Apache Hadoop ecosystem and its parallel programming paradigm, called MapReduce. In the specific, we implemented a MapReduce adaptation of a GATE application and framework (a widely used open source tool for text engineering and NLP). A validation is also offered in using the solution for extracting keywords and keyphrase from web documents in a multi-node Hadoop cluster. Evaluation of performance scalability has been conducted against a real corpus of web pages and documents.

محصولات مرتبط

ناموجود

مقاله حملات منع سرویس توزیع شده در شبکه‌سازی نرم‌افزار محور همراه با رایانش ابر

25,000 تومان

ناموجود

مقاله یكپارچه سازی داده ها مبتنی بر آنتولوژی در Epnet : تولید و توزیع مواد غذایی در طول امپراطوری روم

30,000 تومان

ناموجود

مقاله کلینیک مراقبت های سلامت ابری: مشاوره سلامت به روش الکترونیک برای مناطق دوردست در یک کشور در حال توسعه

30,000 تومان

ناموجود

مقاله کاهش ابعاد غیرمتمرکز برای اطلاعات کششی تانسور توزیع شده در شبکه های حسگر

45,000 تومان

ناموجود

مقاله استنتاج مدل‌های رفتاری نرم‌افزار در MapReduce

30,000 تومان

ناموجود

مقاله اینترنت اشیا در محیط ابری : سرویس ها و چالش ها

30,000 تومان

ناموجود

مقاله ظهور داده بزرگ در محاسبات ابری: نقد و بررسی و مسائل مربوط به پژوهش باز

28,000 تومان

ناموجود

مقاله بررسی پیشرفته ی چالش های امنیتی رایانش ابری روش ها و راه حل ها

24,000 تومان

ناموجود

مقاله موضوعاتی در تطبیق محاسبات خوشه بندی شبکه و ابری برای کاربردهای HPC

24,000 تومان

ناموجود

مقاله مهاجرت‌دادن وظایف درجهت مصرف انرژی و کارآیی در سیستم‌عامل‌های توزیع شده چند هسته ای

22,000 تومان

محصولات مرتبط

درباره بیت کامپیوتر

بیت کامپیوتر یک وب سایت تخصصی در رشته کامپیوتر و IT است. بیت کامپیوتر از سال 1395 شروع به فعالیت کرد و در رشته کامپیوتر و IT از جمله ترجمه و شبیه سازی مقاله های ISI، برنامه نویسی و آموزش های مرتبط با این رشته فعالیت می کند. ما در بیت کامپیوتر همیشه تلاش خواهیم کرد که جدیدترین و بهترین مطالب را در رشته کامپیوتر و IT برای شما عزیزان قرار دهیم. از اینکه ما انتخاب شما هستیم بسیار سپاسگذاریم…

مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وبA hadoop based platform fornatural language processing of web pages and documents

مقاله یک هادوپ مبتنی بر پلتفرم برای پردازش زبان طبیعی صفحات و اسناد وب

چکیده فارسی :

چکیده انگلیسی:

دیدگاهها

محصولات مرتبط

مقاله حملات منع سرویس توزیع شده در شبکه‌سازی نرم‌افزار محور همراه با رایانش ابر

مقاله یكپارچه سازی داده ها مبتنی بر آنتولوژی در Epnet : تولید و توزیع مواد غذایی در طول امپراطوری روم

مقاله کلینیک مراقبت های سلامت ابری: مشاوره سلامت به روش الکترونیک برای مناطق دوردست در یک کشور در حال توسعه

مقاله کاهش ابعاد غیرمتمرکز برای اطلاعات کششی تانسور توزیع شده در شبکه های حسگر

مقاله استنتاج مدل‌های رفتاری نرم‌افزار در MapReduce

مقاله اینترنت اشیا در محیط ابری : سرویس ها و چالش ها

مقاله ظهور داده بزرگ در محاسبات ابری: نقد و بررسی و مسائل مربوط به پژوهش باز

مقاله بررسی پیشرفته ی چالش های امنیتی رایانش ابری روش ها و راه حل ها

مقاله موضوعاتی در تطبیق محاسبات خوشه بندی شبکه و ابری برای کاربردهای HPC

مقاله مهاجرت‌دادن وظایف درجهت مصرف انرژی و کارآیی در سیستم‌عامل‌های توزیع شده­ چند هسته ای

محصولات مرتبط

مقاله حملات منع سرویس توزیع شده در شبکه‌سازی نرم‌افزار محور همراه با رایانش ابر

مقاله یكپارچه سازی داده ها مبتنی بر آنتولوژی در Epnet : تولید و توزیع مواد غذایی در طول امپراطوری روم

مقاله کلینیک مراقبت های سلامت ابری: مشاوره سلامت به روش الکترونیک برای مناطق دوردست در یک کشور در حال توسعه

مقاله کاهش ابعاد غیرمتمرکز برای اطلاعات کششی تانسور توزیع شده در شبکه های حسگر

مقاله استنتاج مدل‌های رفتاری نرم‌افزار در MapReduce

مقاله اینترنت اشیا در محیط ابری : سرویس ها و چالش ها

مقاله ظهور داده بزرگ در محاسبات ابری: نقد و بررسی و مسائل مربوط به پژوهش باز

مقاله بررسی پیشرفته ی چالش های امنیتی رایانش ابری روش ها و راه حل ها

مقاله موضوعاتی در تطبیق محاسبات خوشه بندی شبکه و ابری برای کاربردهای HPC

مقاله مهاجرت‌دادن وظایف درجهت مصرف انرژی و کارآیی در سیستم‌عامل‌های توزیع شده­ چند هسته ای

درباره بیت کامپیوتر

مقاله مهاجرت‌دادن وظایف درجهت مصرف انرژی و کارآیی در سیستم‌عامل‌های توزیع شده چند هسته ای

مقاله مهاجرت‌دادن وظایف درجهت مصرف انرژی و کارآیی در سیستم‌عامل‌های توزیع شده چند هسته ای