Код
#статьи

Предсказать эпидемии, спасти Олимпиаду и отследить всех комаров на планете 🐛🔍

Разбираемся, как ИИ может помочь бедным странам контролировать болезни, на которые мировая общественность предпочитает не обращать внимания.

официальный арт к игре StarCraft II: Wings of Liberty / Blizzard Entertainment

Data Science против забытых болезней

Миллионы жителей беднейших африканских, азиатских и южноамериканских стран страдают опасными инфекционными заболеваниями. Борьбой с этими эпидемиями почти никто не занимается, а мировое сообщество редко о них вспоминает. Эти заболевания объединяют под общим названием «забытые болезни».

К счастью, о них не забывают учёные, специализирующиеся на анализе данных и искусственном интеллекте. Они создают компьютерные системы для предсказания эпидемий и вносят свой вклад в дело спасения человеческих жизней.

Многие тропические инфекции переносят комары. Укус насекомого может привести к заражению лихорадкой денге, вирусом Зика и малярией.

Группы учёных из Малайзии, Доминиканы и других стран, жители которых не понаслышке знают об опасностях тропических болезней, объединили свои усилия в рамках международного проекта AIME. Название AIME расшифровывается как «Искусственный интеллект в медицинской эпидемиологии» (Artificial Intelligence in Medical Epidemiology).

Учёные создали алгоритм для прогнозирования вспышек лихорадки. Результаты работы опубликовали в научной статье в 2018 году.

Основная задача, которую специалисты AIME поставили перед собой, состояла в разработке программы, способной анализировать общедоступные источники.

Опытные эпидемиологи знают, что влажность и накопление дождевой воды на полях и в строительных котлованах способствуют размножению комаров — переносчиков лихорадки денге. А скученность населения, проживающего в беднейших кварталах тропических городов, и ветхость жилищ позволяют заболеванию распространяться с высокой скоростью.

Изучив основные факторы, от которых зависит вероятность вспышки лихорадки, учёные выделили 12 основных параметров и распределили их по четырём группам:

  • плотность населения, проживающего на исследуемой территории;
  • уровень заболеваемости в предыдущие периоды;
  • метеорологические данные (ветер, осадки, влажность и так далее);
  • обустроенность территории (тип жилищ, наличие поблизости незавершённых строек, сельхозугодий и так далее).
У пациента берут анализ крови, чтобы проверить, нет ли у него лихорадки денге. Фото: Zabed Hasnain Chowdhury / Shutterstock

Необходимо было построить алгоритм, способный автоматически анализировать все эти данные и выдавать прогноз о вероятности массового заболевания на несколько месяцев вперёд.

Учёные проекта AIME применили в своей программе алгоритм машинного обучения SVM, который считается одним из самых надёжных методов прогнозирования.

Предварительно учёные собрали сообщения министерства здравоохранения Малайзии о количестве заболевших лихорадкой денге с 2010 по 2014 год. Эти данные они сопоставили по времени с перечисленными выше параметрами.

Алгоритм SVM позволяет вычислить степень влияния каждого из входных параметров на прогнозируемую величину. Математики называют это корреляцией.

После обучения выяснилось, что наибольшая корреляция у вспышек лихорадки была с плотностью населения, количеством заболевших в предыдущий период и уровнем осадков. А вот направление ветра не оказывало особого влияния на итоговый результат.

Программа смогла предсказывать пики заболеваемости с точностью 89% и с упреждением до трёх месяцев. Интеллектуальная система может вычислять эпицентры вспышек болезни и визуализировать их на картах Google Maps с погрешностью менее 400 м.

Прогнозы AIME позволяют местным властям в Малайзии оперативно реагировать на вероятную угрозу и заранее готовить в подверженных эпидемии городах необходимые лекарства и места в больницах.

Система AIME прошла проверку не только в Малайзии, но и в Бразилии. Рост числа заболевших вирусом Зика поставил под угрозу Олимпийские игры в Рио-де-Жанейро летом 2016 года. Некоторые активисты тогда даже призывали к отмене соревнований или к их переносу.

В 2016 году специалисты AIME доработали программу, чтобы понять, как распространяется вирус Зика в Бразилии. Болезнь переносит тот же вид комаров, что и лихорадку денге. Система определила, что спортсмены и болельщики Олимпиады не спровоцируют новой вспышки заболевания.

Прогноз AIME оказался одним из весомых аргументов в пользу проведения игр в Рио в намеченные сроки. Сегодня уже очевидно, что искусственный интеллект тогда оказался прав. На Олимпиаде в Бразилии не было зафиксировано ни одного случая заражения вирусом Зика.

Личинки комаров. Фото: Ghiglione Claudio / Shutterstock

Эпидемия в Twitter

Учёные из Бразилии в рамках проекта ODL (Observatório da Dengue, «Отслеживание денге») создали программу, которая предсказывает место и время очередной вспышки лихорадки денге… по постам в Twitter!

Исследование проводилось с 2009 по 2017 год при участии двух ведущих бразильских институтов. Его результаты были опубликованы в научной статье и привлекли внимание прессы.

Практически у каждого жителя Бразилии есть смартфон с выходом в интернет, хотя многие из них и проживают в трущобах (фавелах) без водоснабжения и канализации. В случае заражения лихорадкой бедные люди скорее запостят в соцсетях сообщения о своём плохом самочувствии, чем обратятся к врачу. А эпидемия в это время будет незаметно развиваться. В результате официальная отчётность о количестве заболевших отстаёт от реальной ситуации на три-четыре недели.

Чтобы устранить этот пробел ODL сканирует тысячи твитов на португальском языке в режиме реального времени. Она ищет сообщения, содержащие такие ключевые слова, как «болезнь», «денге», «укус комара» и так далее. При этом поисковый алгоритм способен самостоятельно отсеивать сообщения, не относящиеся к самочувствию конкретного пользователя, но содержащие искомые слова. Такое случается, например, если человек решил порассуждать о системе здравоохранения или поделился анекдотом про врачей.

Программисты и эпидемиологи вручную собрали несколько тысяч подходящих твитов и загрузили их в программу для обучения. В результате алгоритм, оценивая структуру фразы, получил способность определять, идёт ли речь о персональном опыте автора твита или нет.

Программа также отслеживает географическую привязку смартфона (геотеги) и количество тревожных твитов, отправленных из каждого населённого пункта.

Пациенты с лихорадкой денге лежат на полу возле госпиталя Мугда. Фото: Sk Hasan Ali / Shutterstock

За год алгоритм бразильских учёных анализирует около 500 тысяч сообщений. Из них 75% содержат геометки, поставленные с использованием системы GPS-позиционирования. Если функция GPS на устройстве отключена, то программа определяет наиболее вероятное местоположение отправителя по адресу, указанному им во время регистрации в Twitter.

Программа умеет предсказывать всплеск заболеваемости в определённой местности за 8 недель до официального начала эпидемии. Точность прогноза — 94%, если алгоритм оценивает ситуацию на неделю вперёд, и 88%, если прогноз выдаётся на два месяца.

Программа также визуализирует на карте регионы, где ожидается начало эпидемии. Причём она не только способна делать это в масштабе всей Бразилии, но и может уточнить прогноз и на уровне каждого конкретного города, даже небольшого.

Комары под надзором

Специалисты компании Microsoft предложили оригинальный способ предсказания будущих эпидемий. Вместо того чтобы следить за заболевшими людьми, они создали систему для мониторинга первопричины тропических болезней — комаров, являющихся переносчиками инфекций.

В рамках проекта Premonition («Предостережение») Microsoft планирует устанавливать в тропических странах умные ловушки для насекомых. Эти устройства мгновенно проводят генетический анализ попавшихся комаров и передают результаты в облачные хранилища для дальнейшего исследования. Разработано несколько моделей ловушек: наземные, подвесные и даже летучие, которые переносят дроны.

Проблема в том, что тропические инфекционные заболевания вызывают принципиально разные по природе возбудители: вирусы, бактерии, простейшие, грибки. Но алгоритмы машинного обучения в ловушках способны выявлять паттерны, характерные для сотен распространяемых насекомыми болезней.

В базах данных Microsoft есть информация об эталонных фрагментах геномов почти всех инфекционных агентов, которые могут заражать людей и животных. Если комар переносит генетический материал той или иной опасной инфекции, экспресс-анализ распознает её. Искусственный интеллект сравнит материал с базой патогенов и найдёт наиболее похожий.

Чтобы продемонстрировать высокую эффективность распознавания, Microsoft в лабораториях создал несколько испытательных полигонов, где условия приближены к реальным.

Здесь учёные могут произвольно менять освещённость, температуру, влажность и так далее. В лабораториях Microsoft могут быть созданы условия окружающей среды, соответствующие любой точке на планете. Роботизированные ловушки тестируются в них на живых комарах, которых специально выращивают в искусственной среде.

Фото: Microsoft

Программное обеспечение ловушек настраивают, чтобы оно могло автоматически оценивать, представляет ли попавшее внутрь насекомое интерес. Для этого алгоритм обучили отличать комаров разных видов по движению крыльев в полёте. Система машинного зрения оценивает траектории полёта комара при освещении инфракрасным светом внутри ловушки.

Инженеры Microsoft вместе с учёными из Университета Джонса Хопкинса собрали профили движения крыльев тысяч комаров. Эти данные использовали для обучения алгоритма. Уже сегодня ловушки определяют «важных с эпидемической точки зрения» насекомых с точностью 90%. Это феноменальный результат, учитывая, что известно более 3600 видов комаров.

За один день ловушка способна идентифицировать до 10 тысяч насекомых и провести генетический анализ нескольких наиболее интересных особей. Корпус устройства защищён от внешних воздействий, что позволяет ему выдерживать тропические штормы и высокую влажность.

Концепция проекта Premonition впервые была представлена в 2015 году. За прошедшие годы Microsoft успела провести испытания основных элементов системы в реальных условиях. Проект тестировали в южных штатах США (Техас, Флорида), а также в Гренаде и в Танзании.

В 2020 году испытания системы были признаны успешными. И уже в ближайшее время Microsoft планирует начать её массовое внедрение. В первую очередь ловушки Premonition будут установлены в странах со слаборазвитой системой здравоохранения, правительства которых проявили интерес к инновационной разработке американских учёных.

В компании планируют за год развернуть несколько тысяч ловушек и дронов по всему миру, а также обеспечить визуализацию поступающих от них данных на общедоступной интерактивной карте.

Что в итоге

Благодаря технологиям искусственного интеллекта человечество получило системы раннего предупреждения, сигнализирующие об эпидемиях за несколько недель до того, как первые пациенты начинают попадать в больницы.

Конечно, прогноз не может предотвратить болезнь. Но он позволяет подготовиться к надвигающейся природной беде и действовать на упреждение, чтобы спасти тысячи жизней.

Учёные надеются, что вскоре получить прогноз развития эпидемии будет так же просто, как прогноз погоды. И такие сервисы будут даже в самых бедных странах.

Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Научитесь: Профессия Python-разработчик Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована