Лоран Акопян: искусственный интеллект соберёт за вас все справки и оформит загранпаспорт
Генеральный директор компании iPavlov — о российских достижениях в NLP и о проекте персонального голосового помощника «Иван Павлов».
Иллюстрация: rawpixel.com / Freepik / Дима Руденок для Skillbox Media
Эксперт
Лоран Акопян
Основатель и генеральный директор компании iPavlov, кандидат физико-математических наук, исполнительный директор НИЦ АО «Швабе» в МФТИ, руководитель Лаборатории интеллектуальных криптографических систем.
Библиотеку с открытым кодом DeepPavlov, предназначенную для обработки запросов на естественном языке (NLP, Natural Language Processing), скачали больше миллиона пользователей. Проект родился в студенческой лаборатории и привёл к созданию iPavlov — компании, которая разрабатывает программные продукты на основе искусственного интеллекта.
Мы поговорили с директором iPavlov о том, как и почему он с коллегами основал коммерческую AI-компанию, и о новом амбициозном проекте голосового ИИ-помощника «Иван Павлов».
— Расскажите подробнее о DeepPavlov.
— DeepPavlov — наш первый продукт. Он появился в 2017 году, когда iPavlov была ещё не компанией, а лабораторией МФТИ. Мы создали предобученные модели для работы с текстом на русском языке и выложили их в виде библиотеки с открытым исходным кодом. Это уникальный продукт.
Что такое предобученные модели
Предобученные модели — это нейросети, которые обучены на наборах данных, схожих с целевыми. Их использование позволяет не обучать нейросети с нуля, а лишь дообучить в соответствии с предстоящими задачами. Другими словами, это фреймворки нейросетей.
— До создания DeepPavlov аналогичных инструментов для работы с русским языком не было?
— Нет, мы — первые. Мировые разработчики сосредоточили усилия на английском и не спешили делать аналоги для других языков. Хотя следует отметить, что DeepPavlov — мультиязычная платформа.
Семь лет назад НТИ поставила цель: подготовить в России квалифицированных специалистов в области NLP. В 2016–2017 годах эта сфера только-только формировалась. В России не хватало экспертов (да и сейчас их дефицит), не было программ подготовки. Это считалось экзотикой.
DeepPavlov помогает вкатиться в тему NLP разработчикам, которые только начинают изучать алгоритмы и библиотеки. С этой точки зрения это одна из лучших библиотек для начинающего исследователя.
Мы её используем для демонстрации наших компетенций, подготовки кадров, взаимодействия с университетами и развития сообщества Data Science. В IT принято, чтобы компании-лидеры делились результатами с сообществом специалистов. Для нас DeepPavlov служит такой площадкой.
— Над какими проектами iPavlov работает сейчас?
— В 2020 году мы ушли в коммерческую разработку. И сейчас наши главные продукты — это софт с закрытыми программными модулями.
Мы создаём следующие виды платформ:
- цифровые помощники IVA, которые понимают человеческую речь и могут реагировать на неё так же, как и мы, живые люди;
- системы машинного зрения EYE, которые распознают и анализируют визуальную информацию, решают с помощью этого анализа промышленные задачи и позволяют отказаться от монотонного ручного труда на многих этапах производства;
- инструменты предиктивной аналитики ABI — пожалуй, самое модное, интересное направление в Big Data. С его помощью можно с большой точностью прогнозировать поведение исследуемых объектов — иными словами, предсказывать будущее;
- управление инфраструктурой города Smart City — все государственные и муниципальные учреждения, транспорт, здравоохранение и образование, безопасность, а также ЖКХ и ваша управляющая компания — у вас в смартфоне;
- сервисы Smart Clinic, разработанные специально для медучреждений.
Мы верим в добрый искусственный интеллект и считаем, что наша миссия — сделать ИИ доступным для каждого человека. В этом плане мы ответственны за создаваемый нами ИИ, за его позитивную роль в обществе.
«Иван Павлов» — ваш личный секретарь, почтальон и юрисконсульт
— Над каким проектом вы сейчас работаете?
— Я хотел бы рассказать про новый проект, который называется «Иван Павлов». Он основан на платформе IVA. Она сегодня хорошо продаётся. И это одна из наших главных коммерческих платформ. А «Иван Павлов» — это, скажем так, её новый потребительский виток.
— Вы назвали его в честь физиолога Павлова?
— Да, как и всю нашу компанию. Исследования Павлова во многом напоминают методы современного машинного обучения. Помните «собаку Павлова», которую он обучал? Сегодня мы делаем что-то подобное уже не с животными, а с компьютерами. Обучаем машины человеческому поведению.
— Понятно. И что же собой представляет виртуальный Павлов?
— «Иван Павлов» — это персональный искусственный интеллект, который будет решать все рутинные задачи пользователя. То есть это ваш личный секретарь, который с помощью диалога на естественном языке будет обслуживать практически все повседневные задачи. От заказа билетов до, например, оформления загранпаспорта.
Наша разработка поможет жителям России быстро и легко получать все виды государственных и муниципальных услуг, а также решать жизненные задачи, приобретать товары и услуги. Чтобы ей воспользоваться, достаточно просто быть гражданином России.
— Можете привести примеры?
— Сейчас, чтобы получить какую-то справку, вам надо заполнить огромное количество анкет, уплатить пошлину, потом сходить в МФЦ. «Иван Павлов» сможет избавить от этого. Достаточно будет только сказать ему голосом в свободной форме, что вам нужна справка, и ИИ всё за вас заполнит и выполнит все необходимые действия.
Если говорить об услугах, то сейчас человеку, чтобы, например, вызвать такси, нужно использовать приложение: надо его скачать, разобраться, как им пользоваться. С помощью «Ивана Павлова» вы ту же услугу сможете получить просто голосовой командой. Даже не обязательно произносить слово «такси» или называть точный адрес. Достаточно просто сказать: «Слушай, отвези меня домой».
В «Иване Павлове» ИИ обеспечивает продвинутую обработку естественного языка. В этом и заключается NLP — в том, чтобы ИИ весь семантический анализ проводил самостоятельно. И тогда человеку не придётся элементарные вещи объяснять машине по пунктам. Просто потому, что программа уже обучена человеческому языку.
Алгоритм, зная ваш домашний адрес, определит по геолокации, где вы сейчас находитесь, сам подберёт подходящего оператора такси и вызовет машину. Для уточнения деталей ему просто будет достаточно вживую беседовать с вами. Сама услуга будет вам оказана, по сути, в ходе беседы.
— Интересно. А ещё пример можете привести?
— Возьмём туристическую индустрию — ассистент уровня «Ивана Павлова» может сильно изменить эту отрасль. Сейчас есть огромное количество агрегаторов, через которые мы покупаем билеты, ищем номера в гостиницах. Тратим на их изучение кучу времени, читаем отзывы, ищем лучшие условия. Цифровой помощник кардинально изменит этот процесс.
Всё будет происходить в форме живого диалога, как будто вы разговариваете с личным помощником. Вы говорите: «Хочу в отпуск», а он отвечает: «Супер! Какие мысли? На море или в горы?» Начинает уточнять подробности и показывать картинки и видео тех мест, куда можно поехать. Как выглядит пляж, есть ли рядом достопримечательности и так далее.
Когда вы определитесь, где хотите отдохнуть, «Иван Павлов» перейдёт к оптимизации затрат. Он сам подыщет лучшие условия проживания, проезда, питания. И пользователь может быть уверен, что ассистент провёл большую аналитическую работу. Поэтому ИИ действительно предлагает оптимальный вариант.
В итоге вы ему скажете: «Я согласен, действуй!» И он оплатит вашей карточкой билеты, гостиницу, подаст, если нужно, заявки на загранпаспорт и получение визы.
Рынок на 500 миллиардов рублей
— «Иван Павлов» будет доступен бесплатно?
— Это коммерческая разработка. Планируем, что она будет работать по модели Freemium. Значительное количество функций будет бесплатным. Практически все госуслуги будут либо бесплатными, либо будут оказываться по тем же ценам, которые есть сейчас (то есть, за счёт пошлин и сборов). Мы обеспечим их работоспособность за счёт выручки компании.
Но часть услуг коммерческого характера в «Иване Павлове» будет платной. Деньги пойдут за счёт продаж, за счёт того, что онлайн-продавцы всевозможных услуг и товаров смогут напрямую установить отношения с конечным пользователем.
При этом сам «Иван Павлов» будет анализировать все имеющиеся предложения с точки зрения пользы для своего владельца. Компании не смогут подкупить ИИ или обмануть за счёт мелкого шрифта. Поэтому конкуренция от интернет-интеграторов перейдёт в прямую конкуренцию, когда товары и услуги будет оценивать ИИ.
— Какой эффект «Иван Павлов» окажет на экономику в целом?
— Мы полагаем, что внедрение «Ивана Павлова» окажет огромное социально-экономическое влияние на государство, на общество, на бизнес. Эксперты подсчитали, что запуск такого продукта создаст в России новый рынок объёмом в 500 миллиардов рублей ежегодно.
Это тот объём коммерческих услуг и продуктов, которые будут оказаны в отечественной экономике через «Ивана Павлова». В результате в России образуется полноценный рынок ИИ. Это будет грандиозный результат, способствующий росту российского ВВП!
— А как «Иван Павлов» повлияет на вашу компанию?
— Сегодня мы активны в сегментах B2B и B2G. А «Иван Павлов» будет нашим первым потребительским продуктом. Это будет новый бот, к которому мы откроем доступ для всех желающих познакомиться с искусственным интеллектом и, непосредственно внедряя, индивидуализировать его.
Если DeepPavlov был инструментом для разработчиков, то «Иван Павлов» станет общедоступным и для его использования не потребуется навыков программирования. С ним любой человек сможет наконец-то понять, что такое ИИ и как он работает.
— Вы просчитывали, что будет с теми людьми, которые сейчас выдают справки или работают с бумагами? Им придётся переучиваться или увольняться?
— Внедрение IT в государственных структурах проходит этапы: компьютеризация, цифровизация, затем ИИ и виртуальная реальность. Работников, о которых вы спросили, можно разделить на два типа.
Первые — продвинутые юзеры, находятся на этапе цифровизации. Это значит, что они уже работают с цифровыми данными. У них уже всё в компьютере. Просто сейчас система управления очень сложная, человеческая. ИИ возьмёт и заменит систему управления.
Этим работникам будет легко перейти на «Ивана Павлова». Они перестанут общаться с живыми людьми и будут всё время работать с виртуальной реальностью, с ИИ. Это снизит нагрузку, они будут управлять только ИИ, в то время как ИИ будет управлять цифровыми данными.
— А что будет с работниками второго типа?
Вторые — те, кто застрял на этапе компьютеризации или, к сожалению, даже с компьютерами не работает. Они не являются продвинутыми пользователями, не могут, например, понять бизнес-процедуру, как она работает. И они не могут без бумаг.
И для таких работников внедрение ИИ может быть травматичным. Но совсем не обязательно, что их всех придётся уволить. Они могут пройти обучение, чтобы понять, как взаимодействовать с ИИ.
Многие сотрудники, которые находятся на этапе компьютеризации, являются экспертами в своей области. Например, человек работает в госархиве, где хранятся бумажные не оцифрованные носители информации, — бесконечные ряды стеллажей с папками документов. Такой сотрудник чётко знает, что находится в 653-м ряду, а что в 324-м. И это очень ценное знание.
Такие сотрудники будут передавать документы на оцифровку, и это будет востребованная работа.
Эксперты будут создавать цифровые данные на базе своих знаний. Они смогут переносить в «цифру» и размещать реальные данные, чтобы ИИ мог их обрабатывать.
— Но общаться с людьми-клиентами специалисты уже не будут?
— Получается, что задача госорганов теперь будет не в обработке и обслуживании клиентов. А в том, чтобы контролировать правильность работы ИИ. Они должны постоянно обновлять и обучать ИИ, следить за ним.
И это упрощает работу, потому что вместо обслуживания 145 миллионов населения им нужно будет обслуживать только искусственный интеллект. А это всего лишь один юзер, под маской которого скрывается всё население страны. Согласитесь, что контролировать одного юзера намного легче, чем 145 миллионов. Но этот юзер будет суперсложным. Это будет машина, алгоритм.
Что у «Ивана Павлова» внутри
— «Иван Павлов» будет доступен со смартфона?
— Да, и не только. Помимо мобильного приложения, мы также разрабатываем программы для умных часов Apple Watch, планшетов, десктоп-версию. «Иван Павлов» будет доступен и на сайте «Госуслуг», через виджеты и в мессенджерах.
— Не будет ли проблем с размещением «Ивана Павлова» в магазинах приложений, учитывая нынешнюю ситуацию?
— Нет, не будет. В России уже появились собственные магазины приложений. Кроме того, есть отечественные социальные и корпоративные мессенджеры, с которыми «Иван Павлов» будет интегрирован. Эта проблема нашей IT-отраслью решена.
— Сейчас это приложение уже можно где-то опробовать?
— Пока нет. Для того чтобы система функционировала, нужно получить доступ ко всем госслужбам, с которыми необходимо интегрировать наш софт. Также нужно внести изменения в законодательство. И этот процесс занимает время.
На самом деле «Иван Павлов» у нас был практически готов ещё год назад. Готов с точки зрения алгоритмов и технологий. Всё, что связано с NLP-моделями и искусственным интеллектом, — у нас есть. Но государство немного медлит с внедрением такого рода продуктов.
Внедряться он будет постепенно. У нас есть план развития до 2030 года.
— «Иван Павлов» основан на уже существующей платформе IVA?
— Да. У нас уже есть платформа виртуальных цифровых помощников IVA. «Ивана Павлова» можно считать интерфейсом этой платформы для конечного пользователя.
То есть простые пользователи будут видеть только приложение «Иван Павлов», с которым и будут взаимодействовать. А вот у организаций, которые подключатся к системе (например, МВД, Пенсионный фонд, Миграционная служба и прочие), будет установлено платформенное, серверное приложение, которое называется IVA.
— Какие задачи решает IVA?
— Платформа позволяет любой организации, которая внедряет чат-боты, подробно описать (без программирования) сценарии их диалогов с пользователями, необходимые для различных сервисов. После описания достаточно нажать кнопку «Обучить» и будет создан бот, выполняющий этот сценарий.
Например, МВД оказывает какую-то госуслугу, и теперь они хотят, чтобы её оказывали бы не люди, а искусственный интеллект. Для этого нужно корректно описать реальный бизнес-процесс, и IVA сделает его полностью виртуальным.
Таким образом, на стороне организации будут работать их виртуальные помощники, а на стороне пользователя — «Иван Павлов». За счёт того, что все эти интеллектуальные агенты созданы на базе единой платформы IVA, они смогут между собой коммуницировать на одном языке и верифицировать информацию.
— У «Ивана Павлова» внутри будут нейронные сети?
— Нейронные сети, по большому счёту, являются просто математикой, алгоритмом. Подробное устройство «Ивана Павлова», конечно, является коммерческой тайной.
Но, если говорить в целом, внутри него будет особый пайплайн. То есть ряд связанных между собой моделей, через которые будет прогоняться и обрабатываться информация. В основном его можно свести к голосовым и текстовым моделям. Нам нужно ещё эти пайплайны доработать, чтобы они стали промышленными, чтобы могли выдержать большие нагрузки.
— Но выдача справок и заказ такси предполагают совершение действий, которые сильно различаются. У «Ивана Павлова» для каждой функции будет своя модель?
— Нет. Всё будут обрабатывать единые модели.
— Тогда зачем нужны пайплайны?
— Пайплайн предполагает, что для повышения точности нужно, чтобы машина обрабатывала данные не однократно, а многократно, чтобы они проходили через, допустим, 6–7 моделей.
Все они обрабатывают вашу речь, но, например, первая из них работает с результатом 40%. После того как мы пропустим информацию через вторую, точность повысится до 60%. И так до тех пор, пока не дойдём до 99%. То есть пайплайн обеспечивает качество распознавания того, что человек хочет получить от программы, и выдачу результата.
Есть, конечно, и вспомогательные модели, например когнитивный поиск для оптимизации запросов. Это очень сложные математические методы по оптимизации. Они позволяют ИИ самостоятельно разобраться, какой поставщик товаров и услуг наилучшим образом соответствует параметрам запроса.
Стратегически важный проект
— Государство поддерживает ваш проект?
— Проект действительно нацелен на плотную работу с государством. И АСИ (которое работает в кооперации с администрацией президента и с другими госструктурами), выбрало его среди множества других предложений.
Мы прошли государственную акселерацию и находимся на базовой поддержке АСИ. Нашему продукту дали статус стратегически важного проекта. В этом отношении можно говорить о поддержке на самом высоком уровне.
Одна из наших центральных точек взаимодействия с государством — это фундаментальное изменение законодательства и нормативной базы. Мы работаем над тем, чтобы ИИ был чётко прописан в законах, чтобы были очерчены границы его использования, сформулированы требования к процессам обработки информации и взаимодействия человека с ИИ.
Также с iPavlov активно работают губернаторы регионов России. Мы ведём с ними диалог по интеграции нашего софта в их контуры управления. Поэтому можно говорить о поддержке не только федерального, но и регионального уровня.
— Безопасно ли использовать «Ивана Павлова» с точки зрения утечки информации, хакерских атак?
— У МФТИ есть Лаборатория интеллектуальных криптографических систем, которую мы создали в 2019 году совместно с мировыми научными школами и с ведущими промышленными группами. Это «Швабе», «Ростех», которые являются активными стейкхолдерами.
Повсеместное внедрение ИИ создаёт для хакеров совершенно новую индустрию. (Смеётся.) Один из приёмчиков, применяемых киберпреступниками, заключается в том, чтобы использовать «плохой» ИИ против «хорошего» ИИ. У наших учёных есть позитивный опыт борьбы с этим — они разработали программный продукт для противодействия дипфейкам.
В «Иване Павлове» будут применяться передовые нейрокриптографические подходы, а также бурно развивающиеся экспериментальные отрасли — квантовые технологии и квантовые вычисления. То есть продвинутые методы, исключающие возможность того, что злоумышленники смогут систему скопировать и использовать во вред.
Но следует понимать, что, как в фильме «Матрица», неизбежно будут появляться люди, пытающиеся наши системы взломать, и мы будем вести непрерывную борьбу, чтобы эти угрозы купировать.
— Понятно, а что вы можете предложить тем людям, которые всё равно будут сомневаться в безопасности внедрения «Ивана Павлова» в их жизнь?
— Во-первых, человек, скачивая приложение, сам будет определять, какие права он даёт ИИ. То есть какие области своей жизнедеятельности доверяет «Ивану Павлову», а какие — оставляет за собой. Всегда есть возможность отказаться и вообще не пользоваться ИИ. Но тогда придётся по старинке ходить в МФЦ, стоять в очередях и терять время.
Во-вторых, будут демоварианты «Ивана Павлова», которые пользователь сможет опробовать. Например, можно будет доверить ИИ приобретение питьевой воды на 500 рублей в месяц. Никакой угрозы тут, очевидно, не будет.
Но так пользователь сможет посмотреть на ИИ в деле, убедится, насколько он эффективно работает. Более того, «Иван Павлов» сформирует графики, наглядно показывающие, сколько ИИ сэкономил для человека денег и времени, по сравнению с тем, сколько тратил, когда он раньше приобретал товар или услугу.
— И можно будет оценить, на что тратится жизнь человека?
— Да, «Иван Павлов» проведёт цифровую диагностику жизнедеятельности пользователя. Тогда человек будет понимать, на что уходит его время. И каждый из нас ужаснётся от того, что он, оказывается, 90% своего времени тратит на задачи, на которые он не хотел бы потратить свою жизнь.
И тогда пользователь поймёт, что искусственный интеллект — это не цифровое рабство, как многие думают, а, наоборот, это экономия денег, времени освобождение от рутины, в которой люди сейчас буквально погрязли.
— Звучит впечатляюще.
— Конечно. Только представьте, Россия может стать первой страной в мире, где у каждого жителя есть свой собственный ИИ. Это сравнимо с тем, как некоторые страны, богатые нефтью, выделяют каждому гражданину часть доходов от её продажи.
Если Россия даст каждому жителю мощный бесплатный ИИ в виде «Ивана Павлова», то у наших людей освободится огромное количество времени. ИИ реально решит большую часть задач, на которые они тратят жизнь. В результате социальный уровень в стране резко поднимется. ИИ обеспечит России и её гражданам цифровое превосходство. Это наша цель, наша мечта.