مقاله KID استفاده از الگوریتم سریع و کارآمد برای استخراج متن به منظور ایجاد اتوماتیک پایگاه داده حاوی اطلاعات جنبشی سینتیک آنزیم هاKID an algorithm for fast and efficient text mining used to automatically generate a database containing kinetic information of enzymes

در انبار موجود نمی باشد

مقاله KID استفاده از الگوریتم سریع و کارآمد برای استخراج متن به منظور ایجاد اتوماتیک پایگاه داده حاوی اطلاعات جنبشی سینتیک آنزیم هاKID an algorithm for fast and efficient text mining used to automatically generate a database containing kinetic information of enzymes

20,000 تومان

ژورنال

Biomedcentral

سال انتشار

2010

صفحات فارسی

20 تا 30

صفحات انگلیسی

5 تا 10

نقد و بررسی

مقاله KID استفاده از الگوریتم سریع و کارآمد برای استخراج متن به منظور ایجاد اتوماتیک پایگاه داده حاوی اطلاعات جنبشی سینتیک آنزیم ها

چکیده فارسی‌:

پیش زمینه: مقدار اطلاعات بیولوژیکی در دسترس به سرعت رو به افزایش بوده و تمرکز تحقیقات بیولوژیکی از بخش های مجزا به سمت شبکه ها و حتی پروژه های بزرگتر کشانده شده که هدف آن ها تجزیه و تحلیل، مدلسازی و شبیه سازی شبکه های بیولوژیکی و همچنین مقایسه در سطح بالای ویژگی های سلولی می باشد. بنابراین ضروری است تا اطلاعات بیولوژیکی به آسانی در دسترس باشد. به هر حال، بیشتر اطلاعات در تحقیقات انجام شده به صورت غیرساختاری بوده و به این خاطر روش هایی برای استخراج نظامند اطلاعات، مستقیما از تحقیقات اولیه می بایست توسعه یابد.

شرح مطلب: در اینجا ما الگوریتم تحلیل متن را برای استخراج اطلاعات سینتیک همانند K M , K i , k cat و غیره و همچنین اطلاعات مربوطه همانند نام آنزیم ها، تعداد EC، لیگاندها، ارگانیسم ها، مناطق، PH و دما نشان می دهیم. با استفاده از این قوانین و رویکرد بر پایه واژه نامه، این امکان وجود دارد تا به اندازه 514394 پارامتر سینتیک را از 13 دسته ( K M , K i , k cat , k cat /K M , V max , IC 50 , S 0.5 , K d , K a , t 1/2 , pI, n H , specific activity, V max /K M ) از حدود 17 میلیون چکیده مطالب PubMed استخراج کرده و آن ها را با اطلاعات چکیده مطالب دیگر ترکیب کنیم. بازبینی کتب راهنمای حدود 1000 نتایج انتخاب شده تصادفی موارد فراخوانی شده بین 51% و 84% و محدوده دقیق 55% تا 96% را نشان داده که بستگی به فهرست های جستجو شده دارد. نتایج در پایگاه داده ذخیره شده و توسط KID” یا پایگاه داده سینتیکاز طریق اینترنت در دسترس می باشد.

نتیجه گیری: الگوریتم نشان داده شده اطلاعات مهمی را ارائه می دهد و کمکی به شتاب بخشیدن تحقیقات و تجزیه و تحلیل مورد نیاز برای روش های بیولوژی سیستم های امروزی می کند. پایگاه های داده حاصل شده از تجزیه و تحلیل چکیده مقاله های PubMed می تواند کمک ارزشمندی در حوزه جنبش های بیولوژیکی و شیمیایی باشد. این فرایند کاملا بر مبنای تحلیل متن و همچنین تکمیل پایگاه داده ایجاد شده باشد. این پایگاه داده از سایت http://kid.tu-bs.de در دسترس می باشد. کد مبدا الگوریتم تحت مجوز GNU، یعنی مجوز دولتی ایجاد شده و بنا به درخواست محققان در دسترس قرار می گیرد.

چکیده انگلیسی:

Background: The amount of available biological information is rapidly increasing and the focus of biological research has moved from single components to networks and even larger projects aiming at the analysis, modelling and simulation of biological networks as well as large scale comparison of cellular properties. It is therefore essential that biological knowledge is easily accessible. However, most information is contained in the written literature in an unstructured way, so that methods for the systematic extraction of knowledge directly from the primary literature have to be deployed.
Description: Here we present a text mining algorithm for the extraction of kinetic information such as K M , K i , k cat etc. as well as associated information such as enzyme names, EC numbers, ligands, organisms, localisations, pH and temperatures. Using this rule- and dictionary-based approach, it was possible to extract 514,394 kinetic parameters of 13 categories (K M , K i , k cat , k cat /K M , V max , IC 50 , S 0.5 , K d , K a , t 1/2 , pI, n H , specific activity, V max /K M ) from about 17 million PubMed abstracts and combine them with other data in the abstract. A manual verification of approx. 1,000 randomly chosen results yielded a recall between 51% and 84% and a precision ranging from 55% to 96%, depending of the category searched. The results were stored in a database and are available as “KID the KInetic Database” via the internet.
Conclusions: The presented algorithm delivers a considerable amount of information and therefore may aid to accelerate the research and the automated analysis required for today’s systems biology approaches. The database obtained by analysing PubMed abstracts may be a valuable help in the field of chemical and biological kinetics. It is completely based upon text mining and therefore complements manually curated databases. The database is available at http://kid.tu-bs.de. The source code of the algorithm is provided under the GNU General Public Licence and available on request from the author.

ژورنال

Biomedcentral

سال انتشار

2010

صفحات فارسی

20 تا 30

صفحات انگلیسی

5 تا 10

دیدگاه خود را در باره این کالا بیان کنید افزودن دیدگاه

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

    هیچ پرسش و پاسخی ثبت نشده است.

پرسش خود را درباره این کالا بیان کنید

ثبت پرسش
انصراف ثبت پرسش

محصولات مرتبط