Самый большой центр в мире для геномов рака открывается

Исследователи в Калифорнии сегодня представили то, что они описывают как самый большой репозиторий в мире для геномов рака. База данных упростит для ученых анализировать огромное количество последовательных данных, льющихся из проектов генома (NCI) американского Национального Онкологического института.

Центр Геномики рака (CGHub), построенный бригадой в Калифорнийском университете, Санта-Круз (UCSC), будет держать сырые последовательные данные из Атласа генома рака (TCGA). Атлас является гигантским усилием NCI упорядочить ДНК нормальных клеток и опухолевых клеток от 10 000 человек с 20 типами рака. (В некоторых случаях проект упорядочивает целые геномы; в других случаях, только 1% генома, кодирующего для протеинов.) CGHub будет также держать данные от детства NCI – и связанные с ВИЧ проекты генома рака. Это вступит во владение для Национального Центра NIH информации о Биотехнологии, собиравшей данные об упорядочивании рака в течение прошлого августа.Физически базируемый в Супервычислительном центре Сан-Диего, компьютерная система CGHub готова сохранить 5 петабайтов ДНК и данных о РНК от больных раком. (TCGA генерирует 10 терабайт данных месяц и в конечном счете произведет 10 петабайтов [10 000 терабайт] данных.)

TCGA строит каталог ключевых ведущих рак генетических изменений, которые исследователи могут использовать для развития лечения, скроенного к генетике опухоли человека. Центральная база данных позволит исследователям сравнивать мутации и miswired пути через типы рака, говорит UCSC bioinformatician Дэвида Хаусслера, ведущего проект, финансируемый с контрактом за $10,3 миллионов от NCI: «Что очень важно, должен собрать данные в одном месте и упростить для исследователей делать сравнения поперечного набора данных». CGHub не будет держать данные из других международных проектов генома рака, как бы то ни было.На данный момент исследователи будут в состоянии только загрузить данные.

Но отправка данных о геноме через Интернет становится непрактичной как воздушный шар наборов данных в размере (посмотрите нашу историю 2011 года «Компьютеры, Разобьет Геномику?»). Хаусслер говорит, что в конечном счете, исследователи будут в состоянии работать над данными дистанционно по серверам CGHUB посредством облачных вычислений, как NIH делает с Amazon для данных из его 1 000 Проектов Геномов.


FBCONSTANTA.RU