Биоинформатики СПбГУ разработали собиратель для расшифровки геномов коронавирусов

Новенькая разработка Центра алгоритмической биотехнологии СПбГУ, получившая заглавие coronaSPAdes, дозволяет собирать геномы РНК (Рибонуклеиновая кислота — одна из трёх основных макромолекул (две другие — ДНК и белки), которые содержатся в клетках всех живых организмов)-вирусов, и сначала коронавирусов. По подготовительным данным, с ее помощью уже удалось вернуть последовательности геномов ранее неведомых коронавирусов.

Модуль coronaSPAdes — это особый режим собирателя SPAdes (Saint Petersburg Assembler) — флагманского продукта лаборатории «Центр алгоритмической биотехнологии» СПбГУ, известного во всем мире. При помощи SPAdes ученые из различных государств анализируют патогены, вызвавшие вспышку Ближневосточного респираторного синдрома (MERS) в Саудовской Аравии, Эболы в Конго, гонореи в Великобритании, менингита в Гане, лихорадки денге на Суматре и 10-ки остальных вспышек.

Собиратель SPAdes и разные режимы его работы разрешают создавать расшифровку геномов {живых} организмов, в том числе вирусов. Дело в том, что биологи до сего времени не могут читать геномы так же, как мы читаем книжку: от начала и до конца.

Заместо этого они «прочитывают» маленькие фрагменты, которые позже собирают в полный текст. Потому сборка генома не достаточно чем различается от сборки пазла из миллиона частей. Эта задачка относится к одной из самых сложных алгоритмических заморочек в биоинформатике, и, чтоб ее решить, нужно применять особые инструменты — геномные собиратели.

«На создание модуля coronaSPAdes нас подвигли запросы научного общества, — сказал сотрудник Центра алгоритмической биотехнологии СПбГУ Антон Коробейников, один из главных создателей новейшего продукта.

— Из различных лабораторий к нам поступали бессчетные вопросцы о том, как лучше при помощи утилит семейства SPAdes собирать РНК (Рибонуклеиновая кислота — одна из трёх основных макромолекул (две другие — ДНК и белки), которые содержатся в клетках всех живых организмов)-вирусы. Одними из таковых центров являются Европейский институт биоинформатики (EMBL-EBI), с которым у нас есть кооперативный грант Русского фонда базовых исследовательских работ, и общество ученых, работающих над поиском новейших корона- и остальных вирусов в общественных данных в рамках научной коллаборации Serratus. Потому что имеющиеся модули собирателя SPAdes не дают осязаемого достоинства перед программами-конкурентами, была поставлена задачка сделать новейший модуль, который учитывает неповторимые индивидуальности строения генома коронавирусов и данных секвенирования».

Решающая роль в данной нам разработке принадлежит сотруднику Центра алгоритмической биотехнологии СПбГУ Дмитрию Мелешко.

Также принципиально отметить, что coronaSPAdes основан на прошлых разработках лаборатории и кодовой базе семейства сборщиков SPAdes (metaSPAdes, rnaSPAdes, metaviralSPAdes, biosyntheticSPAdes). Без этих наработок создание модуля было бы неосуществимым.

Смотрите такжеПресс-релиз

Ректор РАНХиГС именовал главные уроки пандемии для системы высшего образования

7.07.2020Вирусология

У обезьян, инфицированных SARS-CoV-2, выработался краткосрочный иммунитет

6.07.2020

1-ая версия coronaSPAdes была разработана за пару недель. Выполнить работу в настолько сжатые сроки посодействовали тестовые данные, предоставленные научной коллаборацией Serratus.

Сейчас создатели собирателя заняты его предстоящим совершенствованием, но уже на данный момент он дозволяет восстанавливать геномы коронавирусов de novo, еще эффективнее и лучше, чем другие подходы. К примеру, из неких наборов данных были собраны полноразмерные геномы, по подготовительным данным, ранее неведомых коронавирусов.

Модуль coronaSPAdes учитывает индивидуальности данных секвенирования РНК (Рибонуклеиновая кислота — одна из трёх основных макромолекул (две другие — ДНК и белки), которые содержатся в клетках всех живых организмов), также реализует неповторимые алгоритмические решения, нацеленные на улучшение восстановления последовательности генома коронавирусов.

Наиболее того, подходы, заложенные в coronaSPAdes, могут быть применены в предстоящем для разработки новейших сборщиков, использующих информацию о структуре других типов геномов.

«Собиратель coronaSPAdes сходу стал интенсивно применяться учеными, но нам трудно оценить границы использования, поэтому что мы не отслеживаем всех юзеров. CoronaSPAdes является программкой с открытым начальным кодом (open source), которая доступна для скачки и использования всем желающим. По нашим данным, кроме EMBL-EBI энтузиазм к собирателю показали такие большие исследовательские общества, как Serratus, MetaSUB Consortium и NextFlow», — отметил Антон Коробейников.

Как поведала заместитель директора Центра алгоритмической биотехнологии Института трансляционной биомедицины СПбГУ Алла Лапидус, за куцее время в лаборатории сотворено несколько новейших программ, целью которых является стремительная и высококачественная обработка геномных данных, нужных для анализа вирусов (и не только лишь), вызывающих разные заболевания, и сначала коронавирусов.

«В 2020 году эпидемиологическая обстановка в мире не дозволяет ученым и докторам расслабиться — не успели еще совладать с коронавирусом, как возникли сообщения о, может быть, новеньком штамме свиного гриппа, получившем заглавие G4 EA H1N1, — отметила Алла Лапидус. — Узнать, вправду ли этот штамм новейший либо ранее узнаваемый сезонный штамм, сначала поможет анализ его генома.

-А на деньках возникли сообщения о вариантах бубонной чумы в Китае, вызываемой бактерией Yersinia pestis. В таковой сложный обстановке растет не только лишь потребность в аналитических способах, да и в грамотных спецах. В этом году прошел 1-ый в истории СПбГУ выпуск магистерской программки “Биоинформатика”, и я желаю нашим выпускникам огромных научных достижений и открытий».

Источник: ab-news.ru

Рекомендованные статьи