Большие данные против рака

+7 926 604 54 63 address
 Сотрудники компании <i>Tamr</i> — Энди Палмер (Andy Palmer), Алан Вагнер (Alan Wagner) и Нидхи Аггарвал (Nidhi Aggarwal).
Сотрудники компании Tamr — Энди Палмер (Andy Palmer), Алан Вагнер (Alan Wagner) и Нидхи Аггарвал (Nidhi Aggarwal).

Правительство США планирует инвестировать 1 млрд долларов в проект Cancer Moonshot. Это должно ускорить проведение исследований в сфере выявления, лечения и предотвращения раковых заболеваний.

Куратор проекта — вице-президент Джо Байден. Его сын, Бо Байден умер от рака мозга в 2015 году в возрасте 46 лет. Название проекта появилось после речи Джо Байдена, в которой он призвал достичь прорыва в области борьбы с онкозаболеваниями, к новому национальному достижению, «полёту на Луну». Это амбициозная и важная задача — ежегодно от рака умирает около 600 000 американцев, заболевание диагностируется у 1,6 миллиона жителей США.

Цель Cancer Moonshot — удвоить нынешние темпы внедрения инноваций в медицинской отрасли. Это непростая задача, принимая во внимание то, что борьбой с раком занимается множество исследовательских коллективов. Деньги на это идут немалые, так 5,2 млрд долларов выделены только Национальному институту онкологии США (National Cancer Institute, NCI — входит в Национальный институт здоровья (National Institutes of Health, NIH)), а всего в мире на борьбу с раком уходит более чем 100 млрд долларов ежегодно.

Но план действий, озвученный Байденом, не предполагает крупных затрат, строительства центров по лечению рака или начала новых научных разработок. Вместо этого предлагается упростить бюрократические процедуры и найти способ объединить усилия контролирующих органов, промышленности, исследователей, групп пациентов и благотворительных организаций. Предполагается, что общими усилиями будет достигнуты результаты, превышающие возможности отдельных участников процесса. Таким образом, основная часть работы — сбор данных и организация обмена ими.

«По моему личному опыту, я знаю, что исследования и методы терапии на пороге невероятных открытий, — писал Байден в посте на medium.com в январе. — Только за последние четыре года мы увидели удивительный прогресс. И это переломный момент. Но научные открытия, данные и результаты исследований хранятся в закромах, препятствуя быстрому прогрессу и большей доступности инноваций для пациентов».

Данные и технологические новинки могут сыграть важную роль в «медицинской революции», если станут общедоступными, считает Байден. Если проекту удастся открыть для исследователей те обширные массивы связанных с раком данных, что различные организации собирали и хранили годами, то успех «полёта на Луну» весьма вероятен.

«Почти каждый онкологический центр держит базу данных — генетическая история, медицинские записи и банки тканей — что может содержать ключ к совершенствованию определённых способов лечения рака, — пишет Байден.  — Дать возможность исследователям и онкологам использовать этот кладезь информации — жизненно важно для ускорения темпов прогресса на пути к излечению. Если мы сделаем эти данные совместимыми и доступными для учёных, исследователей и врачей, то добьёмся ускорения научных достижений, улучшим уход за пациентами и подвинемся ближе к излечению».

О том, какие трудности ожидают Cancer Moonshot при работе с большими данными, говорит Нидхи Аггарвал (Nidhi Aggarwal), директор по продвижению и стратегическому развитию компании Tamr.

«Есть тысячи возможных источников, государственных и частных, которые потенциально могли бы быть использованы для продвижения исследований — всё, начиная от данных, полученных в ходе клинических испытаний, состоящие из несколько тысяч параметров, до геномных наборов данных, которые могут содержать миллионы элементов, — отмечает Аггарвал. — Проблем множество и они разнообразны».

Tamr на этой неделе объявила, что предоставит всем исследователям, связанным с Cancer Moonshot, своё программное обеспечение для работы с большими данными. В программах Tamr используются алгоритмы машинного обучения, предназначенные для организации, подготовки и интеграции слабоструктурированных и неструктурированных данных для анализа. Компания также привлекает к работе множество экспертов для контроля работы и улучшения алгоритмов.

Программное обеспечение Tamr используется такими фармацевтическими компаниями, как Novartis, GlaxoSmithKline и Merck.

Кроме проблемы обработки большого объёма данных, есть и другие сложности, в том числе отсутствие единых стандартов данных. Аггарвал отмечает, что попытки стандартизации данных были, так FDA выпускало требование, согласно которому все электронные данные по клиническим исследованиям должны представляться в виде, соответствующем стандартам обмена данными (CDISC), а Учреждение национальной координации медицинских информационных технологий (Office of the National Coordinator for Health Information Technology, ONC) планирует построить «взаимодействующую, конфиденциальную, безопасную общенациональную информационную систему здравоохранения». Но пока ни FDA, ни ONC не смогли достичь заявленных целей.

Вместо того чтобы полагаться на усилия Федеральных агентств по стандартизации, Аггарвал рекомендует использовать подход, использованный в проекте грузового космического корабля SpaceX, найти способ партнёрского взаимодействия государственного и частного секторов. Она также говорит, что стандартизация и унификация должны соблюдаться с самого начала работы над проектом.

Наконец, она отмечает, что масштаб данных и проблемы взаимодействия настолько велики, что люди и коллективы не должны пытаться решить задачу борьбы с раком в одиночку. Машинное обучение и искусственный интеллект развиваются стремительно, и нужно в полной мере использовать эти инструменты.

.
Комментарии