Код
#статьи

Халицин и другие лекарства: 💊 как Data Science помогает создавать новые препараты 💉

Рассказываем, как с помощью науки о данных открыли новый класс антибиотиков и ищут лекарства от болезней, включая COVID-19.

John Kohn / Pexels / Colowgee для Skillbox Media

Нам нужны лекарства

Учёные непрерывно создают и исследуют новые лекарственные вещества. И делают они это вовсе не из-за заговора фармацевтических компаний. Просто со временем «старые» препараты уже не помогают людям бороться с болезнями.

Наглядный пример — антибиотики. За время своего существования они спасли миллионы жизней. Но бактерии, которых они призваны убивать, рано или поздно приспосабливаются и становятся неуязвимыми.

С 1980-х и до 2020 года не удалось разработать ни одного принципиально нового класса антибиотиков. Хотя исследования в этом направлении активно проводились. И этот факт вызывал тревогу. Ведь если наши лекарства перестанут действовать, а другие не появятся, то мы останемся беззащитны против бактериальных инфекций.

Но современные компьютерные технологии способны помочь человечеству избежать такого ужасного развития событий. В 2020 году учёные из Массачусетского технологического института наглядно продемонстрировали это. При помощи искусственных нейронных сетей они впервые за 30 лет нашли новое вещество с высокой антибактериальной эффективностью.

Антибиотик получил название халицин (halicin) в честь вымышленного суперкомпьютера HAL 9000. Вещество испытали на лабораторных мышах и получили отличные результаты. Халицин успешно противостоит бактериям, уже успевшим выработать устойчивость к популярным лекарствам.

Кадр: фильм «Космическая одиссея 2001 года»

При этом антибиотик использует необычный принцип воздействия на вредные бациллы. Благодаря этому им будет очень трудно приспособиться. Есть основания полагать, что халицин может в течение многих лет сохранять эффективность при лечении множества бактериальных заболеваний.

In silico

Компьютерные методы, используемые при поиске новых лекарственных веществ, относят к направлению in silico («в кремнии»). Название образовано по аналогии с широко применяемыми в медицинских исследованиях in vitro («в пробирке») и in vivo («в живом организме»).

Если раньше учёные могли изучать новые лекарства только в пробирках или на живых организмах, то сегодня у них есть возможность делать это in silico при помощи вычислительных машин, основной деталью которых являются кремниевые процессоры.

При поиске лекарств методами in silico используют два основных подхода:

  • перепрофилирование: позволяет найти подходящее действующее вещество среди миллионов уже созданных человечеством лекарственных молекул;
  • моделирование (дизайн) новых веществ: наиболее сложный и дорогостоящий процесс. Требуется не только смоделировать молекулу на компьютере, но затем синтезировать её и проверить на живых организмах. К сожалению, есть вероятность, что лекарство не удастся производить в промышленных масштабах или что оно даст непредвиденные побочные эффекты.

Обнаружить халицин удалось как раз благодаря перепрофилированию. Вещество SU-3327, лежащее в его основе, синтезировали более десяти лет назад. Тогда его предполагали использовать для лечения диабета. Но оно показало низкую эффективность в борьбе с этим заболеванием, и исследования остановили.

Информация о молекуле SU-3327 много лет без пользы хранилась в базах данных фармацевтических компаний. Только в 2020 году американские учёные при помощи искусственного интеллекта разыскали её и применили в качестве антибиотика, получившего название «халицин».

Молекулы халицина (сверху). Фото: Массачусетский технологический институт

Найти халицин среди миллионов молекул

Специалисты по анализу данных целенаправленно искали новый антибиотик, используя для этого нейронные сети (было применено две сети ― основная и вспомогательная). Нейросети ― это компьютерные модели, имитирующие работу клеток человеческого мозга, их ключевая особенность ― способность обучаться.

Программисты Массачусетского технологического института обучили свою основную нейросеть на 2400 записях об известных веществах, обладающих антибактериальной эффективностью. В этот обучающий набор включили как официально зарегистрированные препараты, так и применяемые в медицине вещества растительного и животного происхождения.

Чтобы нейронная сеть могла эффективно работать с данными, информацию о молекулах лекарственных веществ по специальному алгоритму предварительно преобразовали в наборы чисел, которые затем подавали на входы сети.

После обучения в нейросеть загрузили базу, содержащую 6100 записей о молекулах, про которые не знали, есть ли среди них искомые антибиотики.
Затем ― ещё одну базу, в ней было уже 107 миллионов записей. Из этого огромного массива информации искусственный интеллект выделил несколько десятков подходящих молекул.

Затем записи об отобранных основной нейросетью веществах подали на вторую ― вспомогательную ― нейронную сеть. Она способна предсказывать токсичность лекарств. Для этого её обучили на датасете Американской академии клинической токсикологии ClinTox. В нём содержится информация о побочных эффектах тысяч препаратов, одобренных для использования в США и о проваливших клинические испытания из-за высокой токсичности.

На последнем этапе работы специалисты по анализу данных пропустили информацию о нескольких оставшихся молекулах-кандидатах через ещё один умный алгоритм. Он определял степень похожести найденных веществ на известные антибиотики.

Дело в том, что исследователи хотели отсеять из списка тривиальные аналоги широко применяемых лекарств. Им нужен был именно принципиально новый класс антибиотиков, способный справляться с бактериями, приспособившимися ко всем существующим препаратам.

В итоге у специалистов по анализу данных осталось только девять потенциально подходящих веществ, среди которых и была молекула SU-3327. При реальной проверке на лабораторных мышах (то есть in vivo) она показала отличные результаты, быстро заживив на их теле раны, инфицированные бактериями, устойчивыми к другим видам антибиотиков.

Учёные, вдохновлённые своими результатами, переименовали вещество SU-3327 в «халицин», а результаты исследования опубликовали в научной статье.

Фото: National Cancer Institute / Unsplash

Клиника машинного обучения

Столь сложные изыскания требуют тесного сотрудничества специалистов по искусственному интеллекту со множеством профессионалов в микробиологии, химии, фармацевтике и медицине. Нужны не только значительные вычислительные мощности, но и лабораторная база, подопытные животные и медицинские работники.

Для этого при Массачусетском технологическом институте в 2018 году была создана Клиника машинного обучения в области здравоохранения. Свою миссию её сотрудники видят в том, чтобы «произвести с помощью искусственного интеллекта революцию в профилактике, обнаружении и лечении заболеваний».

Открытие халицина ― одно из самых значимых достижений учёных этой клиники. Но это не единственная тема, над которой они работают. Список проектов, реализуемых Клиникой машинного обучения, довольно внушительный.

Например, разработанные специалистами из Массачусетского института умные алгоритмы широко использовались при клинических испытаниях одной из зарубежных вакцин от COVID-19. Благодаря им были определены группы населения и географические точки, в которых следовало проводить проверку вакцины, а также производились расчеты её эффективности.

Значимое достижение ученых Клиники — новая модель раннего обнаружения признаков болезни Альцгеймера с использованием глубокого машинного обучения.

Другие лекарства

Конечно, исследованиями в области in silico занимаются ученые по всему миру, а не только в массачусетской Клинике машинного обучения.

Например, в Японии при помощи нейронных сетей создали вещество DSP-1181, способное помочь при лечении психических заболеваний. Процесс разработки нового лекарства занял всего 12 месяцев вместо обычных в таких случаях пяти лет.

Ученые из Италии исключительно на основе методов компьютерного моделирования создали вакцину, направленную на профилактику бактериального менингита у детей.

Успехов добился и гонконгский стартап с говорящим названием Insilico Medicine, основанный известным учёным в области искусственного интеллекта Александром Жаворонковым. В 2019 году его сотрудникам удалось разработать новое лекарство для лечения фиброза.

Благодаря использованию искусственных нейронных сетей препарат создали за три недели и протестировали на лабораторных мышах. При использовании классических методов на это потребовались бы годы. Результаты работы опубликовали в научном журнале, а код модели нейросети выложен на GitHub.

Ведутся такие исследования и в нашей стране. Тема даже поднималась на одном из недавних совещаний у президента России. Из множества значимых достижений можно выделить несколько примеров.

Исследователи НИУ ВШЭ и Института органической химии им. Н. Д. Зелинского РАН в 2014 году смоделировали in silico лекарство от лейкемии, а в 2017-м ― против ревматоидного артрита. В 2020 году они же обнаружили молекулу, которая может помочь при лечении рака.

Также в 2020 году завершилось совместное исследование учёных из Сколтеха, МГУ и ИЭФБ РАН, проведенное на отечественном суперкомпьютере для машинного обучения «Жорес». На нём российские специалисты провели молекулярное моделирование лекарства для лечения депрессии и уже готовятся проверить его на животных.

COVID-19: лучше предотвратить, чем лечить

Активно ведутся исследования in silico и по поиску лекарств, способных победить новый коронавирус, принёсший человечеству столько бед.

Периодически появляются сообщения, что тем или иным научным коллективам с помощью компьютерного моделирования удалось найти вещество, способное излечить от COVID-19. И здесь учёные тоже идут по двум путям ― перепрофилирование существующих веществ или создание абсолютно новых молекул.

Например, российские исследователи in silico нашли два препарата, которые потенциально способны бороться с вирусом COVID-19. А вот их зарубежные коллеги по результатам одной из работ 2020-го года заявили об обнаружении сразу четырёх таких веществ.

Но само по себе моделирование, как и любые другие теоретические изыскания, ничего не стоит без экспериментальных подтверждений. У учёных сейчас есть несколько смоделированных in silico веществ, которые теоретически должны уничтожать новый коронавирус в человеческом организме. Но даже при самом благоприятном развитии событий потребуется время, чтобы проверить их эффективность и запустить в массовое производство.

Пока создать волшебную таблетку от COVID-19 не удалось даже с помощью Data Science. Поэтому вакцинация и превентивные меры (социальное дистанцирование, ношение масок и так далее), рекомендованные ВОЗ, сегодня остаются самыми действенными средствами, способными остановить пандемию.


Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Научитесь: Профессия Python-разработчик Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована