×
Программное обеспечение анализирует человеческий геном за 90 минут

Новое программное обеспечение, разработанное в Национальной детской больнице в Огайо, может взять необработанные данные о последовательности генома человека и найти в нем болезнетворные изменения в течение нескольких часов. Разработчики уверяют, что это ставит программу впереди всех как самое быстрое программное обеспечение для анализа генома в мире. Они считают, что это делает возможным масштабный анализ всей мировой популяции. На каждого человека придется примерно по 90 минут, если за дело возьмется мощный суперкомпьютер.

 

Разработка заняла 13 лет и стоила 3 млрд долларов. Но теперь программа по определению последовательности генома человека создана и ускорена. Старший автор проекта Питер Вайт (Peter White) отмечает, что в настоящее время «даже самые маленькие исследовательские группы теперь могут рассчитать геномную последовательность в течение нескольких дней, используя маломощные компьютеры. Время на калибровку и анализ миллиардов генерируемых точек данных для генетических вариантов, которые могут привести к заболеваниям, благодаря мощным компьютерам теперь с нескольких дней сократится до часов».

 

Вайт и его команда решили проблему путем автоматизации аналитического процесса в вычислительной схеме, которую они назвали «Черчилль». «Черчилль» разбивает каждый шаг анализа на части и делает его в процессе, который его создатели называют «сбалансированным региональным распараллеливанием». Причем «Черчилль» решает с особой тщательностью, необходимой для сохранения целостности данных. Так что результаты на 100 процентов достоверны, заверяют исследователи.

 

Так, испытания показали, что «Черчилль» может анализировать всю последовательность генома в качестве текстового формата FASTQ до выявления вариантных клеток при высокой степени уверенности за 90 минут. Производительность «Черчилль» была подтверждена Национальным институтом стандартов и критериев технологий. Там определили эффективность схемы в 99,7 процента по чувствительности, 99,99 процента по точности и 99,66 процента по эффективности производимой диагностики.

 

В то время как цель исследования заключалась в создании ультрабыстрого анализа, Уайт и его команда обнаружили неожиданный эффект. «Черчилль» стала работать эффективнее на нескольких серверах, что позволяет выполнять анализ более глобального масштаба.

 

Для первого этапа анализа ученые взяли1000 образцов геномов, накопленных в Институте международного научно-исследовательского сотрудничества с 2008 года, и создали обширный каталог генетической изменчивости человека по всему миру. «Черчилль» была запущена на Amazon Web Services 'Elastic Compute Cloud. И как отмечают исследователи, превзошла по скорости недельный анализ, проведенный на суперкомпьютере Cray XE6 в 2013, в пять раз.

 

Тест на суперкомпьютере Cray проанализировал 61 целый геном в течение двух дней, в среднем потратив по 50 минут на геном, в то время как «Черчилль» потребовалось только 10 минут на геном.

 

«Учитывая, насколько обширные геномные исследования ведутся в мире, мы считаем, что "Черчилль" может дать оптимальный подход к решению анализа обширных данных. Она просто ускорит все исследования в данной области в разы», – говорит Уайт.

 

Алгоритм «Черчилль» был лицензирован компанией под названием GenomeNext, как адаптированная технология для использования в коммерческих условиях. Люди могут получить свой геном в местной лаборатории или клинике, а затем загрузить исходные данные в систему GenomeNext для анализа.

 

Документ с описанием алгоритма «Черчилль» и исследование были опубликованы в журнале Genome Biology.

 

Автор: Степан Мазур