Скидка до 55% и 3 курса в подарок 2 дня 13 :30 :09 Выбрать курс
Код
#статьи

Что такое искусственный интеллект и как он работает

Объясняем сложные термины простым языком и разбираем реальные возможности ИИ.

Иллюстрация: Оля Ежак для Skillbox Media

Когда мы пользуемся картами, стриминговыми сервисами или чат-ботами, мы взаимодействуем с искусственным интеллектом — даже если не знаем, что это он. В статье разберём, что стоит за этим термином, как появился и развивался ИИ, а также какие задачи он действительно может решать.

Содержание


Что такое искусственный интеллект

Искусственный интеллект (ИИ) в широком смысле — это попытка воспроизвести человеческий интеллект с помощью машины. То есть научить её воспринимать информацию, обучаться, рассуждать, решать задачи и принимать решения.

На практике под «ИИ» чаще всего понимают не абстрактную «разумную машину», а конкретные технические решения — системы машинного обучения. Это модели, которые обучаются на данных и находят в них закономерности без заранее прописанных правил. Именно такие системы сегодня лежат в основе большинства сервисов, которые называют ИИ.

В отличие от классических программ, где разработчик описывает все условия и сценарии работы, поведение моделей машинного обучения формируется в процессе обучения и не сводится к фиксированному набору правил.

Простой пример — фильтрация спама в электронной почте. Классическую программу пришлось бы обучать правилам: если в письме встречаются фразы вроде «вы получили выигрыш» или «вам оставили наследство», значит, это спам. На практике такой подход быстро перестаёт работать: достаточно изменить формулировку — и правило больше не подходит.

ИИ же обучают на тысячах реальных писем и показывают, какие из них пользователи помечают как спам, а какие — нет. Со временем алгоритм начинает распознавать нежелательные сообщения даже без явных ключевых слов — по сходству с уже известными примерами.

Обучение на данных и обратной связи лежит в основе большинства современных ИИ-систем. При этом под общим термином «искусственный интеллект» скрывается несколько разных технологий. Разберёмся, как они устроены.

В чём разница между ИИ, машинным обучением и нейросетями

Термины «искусственный интеллект», «машинное обучение» и «нейросети» часто используют как синонимы, хотя на самом деле это технологии разного уровня. Понимание этих различий помогает понять, что именно стоит за громкими заявлениями компаний и почему не каждый «ИИ-сервис» действительно использует нейросети.

С технической точки зрения эти понятия связаны по принципу матрёшки: одно входит в другое. Рассмотрим каждое из них отдельно.

Искусственный интеллект — самое широкое понятие. Это набор инструментов, позволяющих решать задачи, требующие человеческого интеллекта: анализ данных, распознавание образов и речи, понимание языка, обучение и принятие решений.

Под термином «искусственный интеллект» объединяют самое разное ПО — от рекомендательных систем и навигации до шахматных программ, которые самостоятельно выбирают ходы, оценивая множество возможных вариантов.

Инфографика: Майя Мальгина для Skillbox Media

Машинное обучение — это набор методов искусственного интеллекта, позволяющих создавать самообучающиеся системы, в том числе нейросети. Такие системы особенно полезны там, где невозможно заранее описать все сценарии, например для распознавания речи или изображений.

Один из ключевых подходов машинного обучения — обучение с учителем (supervised learning): модели показывают данные и указывают, какой результат работы с ними считается правильным. На этой основе система постепенно выявляет закономерности и переносит их на новые ситуации.

Представим голосового ассистента: он учится на большом массиве аудиозаписей с привязанным текстом и постепенно начинает понимать, что разные варианты произношения могут соответствовать одним и тем же словам. Благодаря этому ассистент распознаёт речь даже в необычных или шумных условиях.

Нейросеть — это программа, которая обучается на данных и примерах. Название связано с тем, что её архитектура напоминает структуру человеческого мозга: она состоит из «нейронов», соединённых между собой связями. «Нейроны» обычно организованы в слои, которые последовательно обрабатывают информацию.

Генеративные модели — это нейросети, которые не выбирают ответ из готовых вариантов, а пошагово формируют новый результат: текст, изображение или звук. Во время обучения такие модели учатся угадывать следующий элемент — слово, пиксель или ноту — на основе большого количества примеров из обучающих датасетов. Это позволяет создавать связный и реалистичный контент по запросу пользователя. К таким моделям относятся ChatGPT, Midjourney и их аналоги.

Виды искусственного интеллекта

Обычно ИИ классифицируют по тому, насколько широкий круг задач он способен решать.

Узкий искусственный интеллект (ANI, Artificial Narrow Intelligence). Иногда его называют слабым ИИ (weak AI). Это единственная форма искусственного интеллекта, которая существует на сегодняшний день. Его модели предназначены для решения конкретных задач: ведение диалога, распознавание изображений и тому подобное.

Даже самые продвинутые языковые модели вроде DeepSeek или ChatGPT пока относятся к узкому ИИ: они хорошо решают отдельные задачи, но не обладают общим пониманием мира. Хотя некоторые исследователи отмечают, что языковые модели обладают признаками настоящего ИИ.

Общий искусственный интеллект (AGI, Artificial General Intelligence) — это гипотетический тип ИИ, способный решать широкий круг задач на уровне человека. Такой ИИ мог бы выполнять разные виды работы, осваивать новые навыки без дополнительного переобучения, управлять техникой, писать тексты и общаться с людьми.

Некоторые исследователи предполагают, что для этого AGI потребуется способность самостоятельно ставить цели и адаптировать своё поведение в новых ситуациях, однако единого мнения по этому вопросу нет. На сегодняшний день общий искусственный интеллект не создан и остаётся предметом научных исследований и дискуссий.

Искусственный суперинтеллект (ASI, Artificial Superintelligence) — это гипотетическая форма ИИ, которая превосходит человека по интеллектуальным способностям во всех или почти всех областях. Предполагается, что такой ИИ смог бы решать научные, технические и творческие задачи значительно эффективнее людей.

Наглядное представление об уровнях интеллекта и процессе развития ИИ
Инфографика: Polina Vari для Skillbox

История развития искусственного интеллекта

История искусственного интеллекта похожа на американские горки — со взлётами и падениями интереса к технологиям. Рассмотрим её отдельные этапы с ключевыми событиями.

1950–1970: Алан Тьюринг и появление термина

История искусственного интеллекта начинается в 1950 году с работы Алана Тьюринга «Вычислительные машины и разум». В ней он задаётся вопросом: могут ли машины мыслить?

Для этого он предложил тест: если машина с текстовым интерфейсом сможет обмануть человека, заставив его поверить, что он говорит с другим человеком, — значит, мы имеем право называть её разумной.

Алан Тьюринг в 16 лет
Фото: Arthur Reginald Chaffin / Wikimedia Commons

Идея Тьюринга вышла за рамки статьи и стала предметом активных научных споров о том, что вообще считать интеллектом и каким путём его можно создать.

В 1956 году в США прошла Дартмутская конференция, среди участников которой были Клод Шеннон, один из создателей теории информации и основоположник цифровой связи, и Джон Маккарти, исследователь в области компьютерных наук. Они предложили ввести в использование термин «искусственный интеллект».

После этого область ИИ стала быстро развиваться. Например, в 1966 году появился чат-бот Eliza, который задумывался как психотерапевт, способный слушать пользователя, анализировать сказанное и задавать уточняющие вопросы.

Внешний вид программы Eliza
Скриншот: Ysangkok / Wikimedia Commons

В период с 1966 по 1972 год Центр искусственного интеллекта при Стэнфордском исследовательском институте разработал Shakey — мобильного робота, оснащённого датчиками и телевизионной камерой. С их помощью Shakey ориентировался и перемещался в различных условиях. Несмотря на странный внешний вид, он стал важной вехой в робототехнике.

Благодаря Eliza и Shakey ИИ начал выходить за рамки теоретических концепций и стал системой, способной взаимодействовать с человеком и физическим миром. Именно в этот период начали формироваться основы диалоговых систем и автономной робототехники.

1970–1980-й: застой искусственного интеллекта

К началу 1980-х стало ясно, что убедительная имитация разумного поведения человека ещё не означает настоящего мышления. Эту проблему чётко сформулировал философ Джон Сёрл в мысленном эксперименте «Китайская комната», показав, что система может правильно отвечать, не понимая смысла своих действий. Сёрл показал, что имитация разумного поведения не равна пониманию.

Рисунок, иллюстрирующий суть мысленного эксперимента «Китайская комната»
Инфографика: Polina Vari для Skillbox Media

В 1973 году математик Майкл Джеймс Лайтхилл выпустил отчёт, в котором дал крайне сдержанную оценку развитию технологии, указав, что «ни в одной области ИИ достигнутые на тот момент результаты не оказали того значимого влияния, которое ранее обещалось». Отчёт Лайтхилла зафиксировал разрыв между обещаниями исследователей и реальными результатами — и стал формальным поводом сократить финансирование ИИ.

Оба события — публикация Джона Сёрла и отчёт Майкла Лайтхилла — привели к снижению доверия к технологиям и сокращению исследований. Этот период получил название «зима ИИ».

1981–2000-й: ИИ наносит ответный удар

Начавшаяся в 1970-х годах «зима ИИ» растянулась почти на два десятилетия. По-настоящему серьёзные инвестиции в исследования и разработки вернулись лишь к концу 1990-х.

При этом отдельные значимые эксперименты появлялись и раньше. В 1986 году немецкий учёный Эрнст Дикманн представил один из первых самоуправляемых автомобилей. Это был фургон Mercedes, оснащённый компьютерной системой и датчиками для анализа окружающей среды. Машина могла самостоятельно передвигаться по дорогам, однако только в условиях отсутствия других автомобилей и пешеходов.

Настоящим символом возвращения ИИ в публичное пространство стал шахматный поединок между человеком и машиной. В 1996 году компания IBM выставила свою систему Deep Blue против действующего чемпиона мира по шахматам Гарри Каспарова. Матч из шести партий завершился победой человека: ИИ удалось выиграть лишь одну партию. Однако уже в 1997 году, в реванше, Deep Blue одержал итоговую победу, завершив решающую партию всего за 19 ходов.

Одна из двух стоек Deep Blue с экраном и шахматной доской для игры с людьми
Фото: Computer History Museum

2001–2019-й: рост ИИ

В начале 2000-х искусственный интеллект стал выходить из лабораторий и работать в реальных условиях. Одним из символов этого периода стал робот Kismet — проект Лаборатории искусственного интеллекта MIT под руководством Синтии Бризил. Оснащённый датчиками, микрофоном и программной моделью эмоциональных процессов человека, Kismet мог интерпретировать эмоции и воспроизводить их, создавая впечатление живого взаимодействия.

В 2004 году NASA отправил на Марс два марсохода — Spirit и Opportunity. Оба аппарата были оснащены элементами ИИ, позволяющими им самостоятельно передвигаться по сложному каменистому рельефу и принимать решения в реальном времени, не полагаясь постоянно на команды с Земли. Эти проекты показали, что ИИ может работать вне строго контролируемых условий и решать практические задачи.

После успеха Deep Blue компания IBM в 2011 году представила суперкомпьютер — IBM Watson. Широкой аудитории он стал известен благодаря популярной американской телевикторине Jeopardy. IBM Watson установил новый рекорд по заработанной за программу сумме и значительно превзошёл соперников-людей по числу правильных ответов.

IBM Watson в 2011 году
Фото: Clockready / Wikimedia Commons

В том же году Apple представила виртуального ассистента Siri, а в 2014-м Amazon выпустил собственного виртуального помощника — Alexa. Обе системы использовали обработку естественного языка, понимая голосовые запросы и отвечая на них, что сделало ИИ привычным для пользователей повседневной техники.

Ключевым сдвигом в области ИИ стало появление нейросети AlexNet в 2012 году. Она выиграла конкурс по распознаванию изображений ImageNet и показала радикальное улучшение качества по сравнению с предыдущими подходами: по точности модель на 40% обгоняла ближайшего конкурента. Этот успех доказал, что при достаточном объёме данных и вычислительных ресурсов нейросети могут значительно превосходить традиционные алгоритмы.

Команда разработчиков AlexNet. Слева направо: Илья Суцкевер, Джеффри Хинтон и Алексей Крижевский
Фото: Johnny Guatto / University of Toronto

Следующий крупный сдвиг произошёл в 2017 году, когда инженеры Google опубликовали статью Attention Is All You Need и представили архитектуру Transformer. Разработчики научили модель анализировать текст и делать на его основе выводы.

На базе «трансформеров» в последующие годы появились системы, способные не только распознавать информацию, но и генерировать связный текст, код и другие формы контента. Именно они стали основой для популярных моделей: GPT-4, LLama и других.

Первые два десятилетия XXI века стали переходным этапом в развитии искусственного интеллекта. ИИ перестал быть экспериментальной технологией для лабораторий и начал работать в реальных, неконтролируемых условиях — от космических миссий до бытовых устройств. И именно в этот период были заложены технологические основы современного ИИ.

2020-й — настоящее время: эра генеративного ИИ

Последние годы характеризуются стремительным ростом интереса к генеративному ИИ — системам, создающим тексты, изображения и видео по текстовым запросам (промптам). В отличие от ранних решений, генеративные модели обучаются на огромных массивах данных и продолжают совершенствоваться с накоплением нового опыта, что расширяет их возможности далеко за рамки заранее заданных сценариев.

В 2020 году OpenAI представила модели GPT-3 и GPT-3.5 Turbo с 175 миллиардами параметров. Тексты, которые они генерировали, было сложно отличить от написанных человеком. На их основе в 2022 году появился чат-бот ChatGPT, ставший ключевым драйвером популярности генеративного ИИ и открывшим новую эпоху его практического использования.

Ключевая особенность эпохи, которая продолжается и сейчас, — демократизация ИИ. Продукты вроде ChatGPT или Claude сделали технологии, ранее доступные лишь исследовательским центрам и корпорациям, массовыми.

Генеративный ИИ начал трансформировать рынок труда, образование, медиа и разработку ПО, взяв на себя решение многих задач из этих сфер. Например, создание контента для социальных сетей или написание программного кода. Пока что это получается не идеально, но подобные модели появились совсем недавно, поэтому делать выводы о них рано.

Где используется искусственный интеллект

Компании используют технологии искусственного интеллекта почти во всех сферах, с которыми мы с вами сталкиваемся ежедневно: от прогноза погоды и анализа банковских транзакций до работы служб поддержки и расчёта стоимости такси. Рассмотрим несколько примеров.

Навигация и транспортные системы

Системы навигации в городах долгое время работали по упрощённой логике: медленное движение транспорта означало пробку, быстрое — свободную дорогу. Такой подход не учитывал реальную сложность городского трафика. На практике даже одна авария или перекрытие влияют не на отдельный участок транспортной сети, а на несколько прилегающих улиц или даже район в целом.

В 2020 году AI-подразделение Google — DeepMind — внедрило в навигационные сервисы компании модели на основе графовых нейросетей. В них город рассматривается как единая связанная система, а не набор отдельных участков. Это дало возможность прогнозировать, как изменения движения на одной улице отражаются на трафике во всём городе.

При возникновении замедления движения машин система заранее оценивает перераспределение потоков: куда поедут автомобили, какие маршруты окажутся перегруженными, а какие сохранят пропускную способность. Благодаря этому навигатор предлагает оптимальный маршрут с упреждением — ещё до того, как проблема станет заметна водителю или пешеходу.

Визуальное отображение графовой нейросети для построения маршрута
Изображение: Google DeepMind

Рекомендательные системы

Netflix, YouTube и другие стриминговые сервисы во многом опираются на рекомендательные алгоритмы, которые помогают точно подбирать следующий контент для просмотра.

Эти системы обучаются на поведении пользователей. Если видео или фильм досматривают до конца, модель получает положительный сигнал; если закрывают раньше — отрицательный. Со временем алгоритмы всё точнее улавливают предпочтения и сокращают время на поиск подходящего контента.

По оценке Netflix, персонализированные рекомендации экономят сервису около 1 миллиарда долларов в год за счёт снижения оттока пользователей и повышения удобства и длительности просмотра.

Медицина

В медицине ИИ чаще всего используют как вспомогательный инструмент там, где врачу или учёным требуется быстро проанализировать большие массивы данных: изображения, показатели анализов или истории болезни пациента.

В 2018 году Google DeepMind представило нейросеть AlphaFold, которая решала одну из ключевых задач современной биологии — предсказание структуры белков по их аминокислотной последовательности. Это важная задача, на решение которой обычно уходило от нескольких дней до недель.

AlphaFold существенно ускорила этот процесс, сократив его до нескольких часов. Её сразу же стали активно использовать в молекулярной биологии и медицине — например, чтобы лучше разобраться в механизмах развития заболеваний или разработать новое лекарство.

В 2024 году Демис Хассабис и Джон Джампер — разработчики AlphaFold — получили Нобелевскую премию по химии за создание алгоритма машинного обучения, который позволяет предсказывать структуры белков.

Погода

Прогноз погоды обычно строится на физических моделях — это сложные математические системы, которые требуют мощных суперкомпьютеров и много-много времени на вычисления. В последние годы к этому подходу начали добавлять и машинное обучение для ускорения расчётов и повышения точности.

Один из таких примеров — модель GraphCast, разработанная командой DeepMind. Она обучена на архивных данных о погоде и способна быстро прогнозировать развитие атмосферных процессов на несколько дней вперёд.

Визуальное отображение пошаговой работы модели GraphCast
Изображение: Google DeepMind

Как будет развиваться ИИ дальше

В развитии искусственного интеллекта в ближайшие годы можно выделить несколько трендов: появление большего числа моделей с мультимодальностью и повышение их качества, рост числа ИИ-агентов и появление AGI (общего ИИ), которые сравнится по способностям с человеком.

Развитие мультимодальности. В отличие от моделей, которые работают с одним типом данных — например, только с текстом или изображениями, — мультимодальный ИИ ближе к человеческому способу общения и восприятия реальности. Он должен уметь одновременно понимать визуальную информацию, речь, мимику и интонации.

Такие системы объединяют текст, голос, изображения, видео и другие данные, делая взаимодействие человека и компьютера более естественным. На их основе могут появиться продвинутые виртуальные ассистенты и чат-боты, способные разбирать сложные запросы и отвечать не только текстом, но и визуальными материалами или видеоинструкциями, адаптированными под конкретную задачу.

Развитие ИИ-агентов. ИИ-агенты — это программы, которые способны действовать самостоятельно для достижения заданной цели. Их ключевая особенность — автономность в рамках заданных правил. Агент получает цель, контекст и ограничения, после чего сам решает, какие действия выполнить: собрать данные, запустить код, проанализировать документы, отправить запросы другим системам или передать результат человеку. При необходимости он может разбивать сложную задачу на подзадачи и выполнять их последовательно.

Пример такой системы — Operator от OpenAI. Он способен выполнять многоэтапные задачи — например, заказывать товары или бронировать авиабилеты, даже если пользователь не указал конкретный ресурс или магазин. Для подтверждения важных действий, например покупок, агент поставит выполнение задачи на паузу, дожидаясь разрешения пользователя.

Появление AGI. В исследовании 2024 года эксперты в области ИИ оценивали вероятность того, что он превзойдёт человека во всех возможных задачах, в 10% к 2027 году и в 50% к 2047 году. В докладе Road to AI от Массачусетского технологического университета встречаются и более оптимистичные прогнозы: например, по мнению некоторых респондентов, AGI может быть достигнут к 2027 году с вероятностью 50%.

Но не стоит воспринимать эти оценки как непреложную истину. За последние 50 лет многие учёные из области ИИ ошибались в своих предположениях о времени появления AGI. Поэтому, возможно, мы ещё долго будем работать только со слабым искусственным интеллектом, решающим конкретные задачи.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!




Практический курс: «Нейросети» Узнать о курсе
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована