Скидки до 50% и 3 курса в подарок : : Выбрать курс
Код
#новости

Авторы алгоритмов 80-х годов, лежащие в основе современного ИИ, получили премию Тьюринга

Эти алгоритмы легли в основу создания рассуждающих ИИ-моделей и современных методов машинного обучения.

Ассоциация вычислительной техники присудила престижную премию имени Алана Тьюринга исследователям Эндрю Барто и Ричарду Саттону за их вклад в развитие методов обучения с подкреплением. Их исследования стали основой для создания современных интеллектуальных систем, включая модели логического рассуждения и автономного обучения.

Роль обучения с подкреплением в развитии ИИ

Обучение с подкреплением (Reinforcement Learning, RL) — это метод машинного обучения, при котором ИИ-агент принимает решения, опираясь на поощрения и штрафы, что позволяет ему адаптироваться к изменяющимся условиям. Барто и Саттон внесли ключевой вклад в развитие этого направления, что позволило разработать алгоритмы, способные обучаться на основе обратной связи.

Одним из важнейших результатов их работы стало создание обучения на основе метода временных различий (Temporal Difference Learning) — он позволяет ИИ‑системам прогнозировать будущее состояние на основе текущего опыта. Эта технология широко применяется в робототехнике, игровой индустрии и автономных системах.

Их учебник «Обучение с подкреплением: введение», опубликованный в 1998 году, стал основополагающим трудом в этой области и был процитирован более 75 тысяч раз, что подтверждает его значимость для научного сообщества.

Влияние на современные технологии

Методы обучения с подкреплением, разработанные Барто и Саттоном, в сочетании с глубинными нейросетями привели к появлению интеллектуальных систем, способных принимать сложные решения. Один из ярких примеров — программа AlphaGo, разработанная DeepMind, которая в 2016 году победила чемпиона мира по го Ли Седоля. Эта победа продемонстрировала, насколько мощными могут быть системы, обученные методом подкрепления.

Кроме игр, RL используется в таких областях, как:

  • робототехника — автономные роботы, способные адаптироваться к окружающей среде;
  • автоматизированное вождение — алгоритмы, которые обучаются управлять автомобилями в реальных дорожных условиях;
  • финансовые рынки — системы, принимающие инвестиционные решения на основе анализа данных;
  • медицина — оптимизация процессов лечения и диагностики заболеваний;
  • интернет-реклама — персонализированные рекомендации и оптимизация рекламных кампаний.

Премия Тьюринга, которую называют «Нобелевской премией» в области информатики, ежегодно присуждается учёным, внесшим значительный вклад в развитие компьютерных наук. В 2019 году ее получили первопроходцы глубокого обучения Йошуа Бенжио, Джеффри Хинтон и Ян Лекун. Теперь к этому списку присоединились Барто и Саттон, чьи исследования сформировали современный подход к машинному обучению.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Освойте топовые нейросети за три дня. Бесплатно
Нейросети прямо сейчас меняют код, дизайн, маркетинг. Научитесь применять ИИ в своей отрасли!
Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована