توضیحات
ABSTRACT
Growing concerns about increasing rates of antibiotic resistance call for expanded and comprehensive global monitoring. Advancing methods for monitoring of environmental media (e.g., wastewater, agricultural waste, food, and water) is especially needed for identifying potential resources of novel antibiotic resistance genes (ARGs), hot spots for gene exchange, and as pathways for the spread of ARGs and human exposure. Next-generation sequencing now enables direct access and profiling of the total metagenomic DNA pool, where ARGs are typically identified or predicted based on the “best hits” of sequence searches against existing databases. Unfortunately, this approach produces a high rate of false negatives. To address such limitations, we propose here a deep learning approach, taking into account a dissimilarity matrix created using all known categories of ARGs. Two deep learning models, DeepARG-SS and DeepARGLS, were constructed for short read sequences and full gene length sequences, respectively.Results: Evaluation of the deep learning models over 30 antibiotic resistance categories demonstrates that the DeepARGmodels can predict ARGs with both high precision (> 0.97) and recall (> 0.90). The models displayed an advantage overthe typical best hit approach, yielding consistently lower false negative rates and thus higher overall recall (> 0.9). As more data become available for under-represented ARG categories, the DeepARG models’ performance can be expected to befurther enhanced due to the nature of the underlying neural networks. Our newly developed ARG database, DeepARG-DB, encompasses ARGs predicted with a high degree of confidence and extensive manual inspection, greatly expanding current ARG repositories. Conclusions: The deep learning models developed here offer more accurate antimicrobial resistance annotation relative to current bioinformatics practice. DeepARG does not require strict cutoffs, which enables identification of a much broader diversity of ARGs. The DeepARG models and database are available as a command line version and as a Web service .at http://bench.cs.vt.edu/deeparg
چکیده
افزایش نگرانی در مورد افزایش نرخ مقاومت آنتی بیوتیک برای نظارت گسترده و جامع جهانی. روشهای پیشرفته برای نظارت بر رسانه های محیطی (به عنوان مثال، فاضلاب، زباله های کشاورزی، غذا و آب) به ویژه برای شناسایی منابع بالقوه ژن های مقاومت جدید آنتی بیوتیک (ARGs)، نقاط داغ برای تبادل ژن و همچنین راه های گسترش ARG ها مورد نیاز است. و قرار گرفتن در معرض انسانی توالی نسل بعدی در حال حاضر دسترسی مستقیم و پروفایل کل کل DNA متان ژنوم را فراهم می کند، جایی که ARG ها به طور معمول بر اساس “بهترین بازدید” جستجوهای دنباله ای علیه پایگاه های موجود، شناسایی و پیش بینی می شوند. متاسفانه این رویکرد، میزان منفی نادرستی را تولید می کند. برای رفع این محدودیت ها، ما در اینجا یک رویکرد یادگیری عمیق پیشنهاد می کنیم، با توجه به یک ماتریس متمایز ایجاد شده با استفاده از تمام دسته های شناخته شده ARG. دو مدل عمیق یادگیری، DeepARG-SS و DeepARGLS، به ترتیب برای دنباله های خوانده شده کوتاه و توالی های ژن کامل ژن ایجاد شده است. نتایج: ارزیابی مدل های یادگیری عمیق از بیش از 30 دسته مقاومت آنتی بیوتیک نشان می دهد که مدل های DeepARG می توانند ARG ها را با دقت بالا > 0.97) و یادآوری (> 0.90). این مدل ها مزیتی بیش از بهترین شیوه ضربه را به نمایش گذاشتند و امتیاز منفی کاذب را به طور مرتب پایین تر و به این ترتیب فراخوان کلی تر (> 0.9) را نشان دادند. از آنجایی که داده های بیشتر برای مقادیر ARG زیر در دسترس قرار می گیرند، انتظار می رود که عملکرد مدل های DeepARG با توجه به ماهیت شبکه های عصبی تحت تأثیر قرار گیرد. پایگاه داده جدید ARG ما، DeepARG-DB، ARG ها را با اعتماد به نفس بالا و بازبینی دستی گسترده پیش بینی می کند، که به طور گسترده ای مخازن ARG را گسترش می دهد. نتيجه گيري: مدل هاي آموزشي عميق كه در اينجا ارائه شده است، حاكي از ضمانت ضمانت مقاومت ضد ميكروبي نسبت به عملكرد فعلي بيوانفورماتيك هستند. DeepARG نیازی به قطع قطع نمی کند، که شناسایی تنوع وسیع تر ARG را امکان پذیر می سازد. مدل های DeepARG و پایگاه داده به عنوان یک نسخه خط فرمان و به عنوان یک سرویس وب در دسترس هستند http://bench.cs.vt.edu/deeparg.
Year: ۲۰۱۸
Publisher : ELSEVIER
By : Gustavo Arango-Argoty, Emily Garner, Amy Pruden, Lenwood S. Heath, Peter Vikesland and Liqing Zhang
File Information: English Language/ 15 Page / size: 2.98 MB
سال : ۱۳۹۶
ناشر : ELSEVIER
کاری از : گوستاو آرنگو آرگوتی، امیلی گارنر، امی پرودن، لنوود سات هیت، پیتر ویکسلند و لیکینگ ژانگ
اطلاعات فایل : زبان انگلیسی / 15 صفحه / حجم : MB 2.98
نقد و بررسیها
هنوز بررسیای ثبت نشده است.