Лучшие альтернативы ChatGPT: знакомимся с Bard, Claude и GigaChat
Исследуем интеллектуальных чат-ботов, способных свести популярное творение OpenAI с пьедестала.
Иллюстрация: Brett Jordan / Nikola Topic / Unsplash / Annie для Skillbox Media
Пока ChatGPT и новая языковая модель GPT-4 от компании OpenAI победно шествовали по миру, удивляя специалистов своими невероятными возможностями, их конкуренты не теряли время даром. Свои аналоги ChatGPT уже разработали и IT-гиганты, и небольшие стартапы.
В этой статье мы познакомим вас с тремя альтернативными чат-ботами, основанными на оригинальных нейросетевых моделях. Изучим возможности и характеристики каждого аналога, опишем преимущества и недостатки. В нашей небольшой подборке — лучшие творения учёных из США и России.
Bard от Google — основной конкурент
11 мая 2023 года Google открыл пользователям из 180 стран (России в их числе нет) доступ к чат-боту Bard, основанному на собственной языковой модели PaLM 2. Правда запустить его удалось лишь со второй попытки.
Во время первой презентации Bard допустил досадную фактическую ошибку в ответе, что вызвало шквал критики в СМИ. Впрочем, аналогичные фейлы ChatGPT, которые он совершает постоянно, не помешали ему добиться успеха. Довольно быстро Google представил «улучшенную версию», в которой, по утверждениям разработчиков, были исправлены все обнаруженные баги.
Что умеет Bard
Bard — это универсальный чат-бот, который может и беседу на любые темы поддерживать, и программный код по текстовому описанию генерировать. Помимо текста Bard также может работать с мультимодальными запросами, содержащими изображения.
Одна из киллер-фич Bard — интеграция с поисковыми сервисами Google. Бот может правильно отвечать на вопросы, касающиеся актуальных событий, а также снабжать ответы ссылками на источники.
В этом Bard похож на Bing Chat, основанный на тандеме GPT-4 c поисковиком от Microsoft. Аналогичная функция в ChatGPT реализуется с помощью плагинов и пока доступна в ограниченном режиме.
К сожалению, Bard слабо знает иностранные языки. Изначально он мог понимать только английский, а позже в него добавили поддержку японского и корейского. Google обещает научить ИИ качественно общаться ещё на 40 языках, но с этим пока что-то не ладится.
Что у Bard под капотом
«Мозгом» Bard служит нейросеть PaLM 2 — языковая модель Google, основанная на архитектуре Transformer.
Первая сеть PaLM содержала 540 миллиардов параметров. По этому показателю она в три раза превосходила модель GPT-3.5, на которой работает базовая версия ChatGPT. Google уже успешно использовал PaLM для решения различных задач, включая управление роботами.
О PaLM 2 известно намного меньше, чем о её предшественнице. Google взял пример с OpenAI, засекретившей свою новую модель GPT-4, и также не собирается раскрывать характеристики нейросети.
Число параметров PaLM 2 неизвестно — разработчики лишь сообщают, что «PaLM 2 меньше, чем PaLM, но более эффективна». Улучшение характеристик нейронной сети достигается не за счёт размера, а за счёт архитектуры, методов обучения и более разнообразных датасетов.
Как получить доступ к Bard
Чтобы опробовать чат-бота, нужно зайти на страничку Bard и нажать на кнопку Sign in или Try Bard. К сожалению, нейросеть недоступна в России и ряде других стран.
Обратите внимание: доступ к Bard можно получить только с IP-адресов стран, перечисленных в этом списке. США и Великобритания точно есть в их числе.
Далее потребуется войти в Google-аккаунт. Российский аккаунт система не пропустит. Вы поймёте это по надписи «Bard isn’t currently supported in your country. Stay tuned!».
При регистрации укажите номер телефона той страны, IP-адрес которой используете. Можно также арендовать виртуальный номер в специальных сервисах, таких как 365SMS, simsms4.org и другие.
Если даже после этого Google будет отказываться считать вас иностранцем, то придётся подавать запрос на изменение страны аккаунта. Сделать это можно здесь. Процесс может занять до 30 дней, а результат не гарантирован, поскольку ребята из Google настороженно реагируют на попытки пользователя изменить местоположение.
Claude от Anthropic — конституционный ИИ
Группа бывших сотрудников OpenAI основала в 2021 году независимый стартап под названием Anthropic. Компания сумела привлечь инвестиции на сотни миллионов долларов, львиную долю которых вложил Google — основной соперник OpenAI и Microsoft в области внедрения ботов с ИИ.
В январе 2023 года Anthropic представила собственного чат-бота Claude, способного конкурировать с ChatGPT. По заявлениям создателей, бот «реже выдаёт токсичные ответы» за счёт метода обучения под названием конституционный ИИ (constitutional AI), основанного на наборе правил («конституции»).
Что умеет Claude
Компания Anthropic предлагает пользователям две версии программы: Claude Instant и Claude. Версия Instant работает быстрее и стоит меньше, чем Claude, но чаще ошибается, из-за чего выглядит менее «умной».
По мультимодальным возможностям Claude в любой доступной версии уступает основным конкурентам. На данный момент бот может воспринимать только текст.
Разработчики заявляют, что Claude понимает тексты на английском. Поддержка других языков официально не заявлена. Однако нам удалось поговорить с Claude на русском — хотя сам бот вначале утверждал, что не знает «великий и могучий».
Помимо простой болтовни, Claude также способен на программирование. Чат-бот поддерживает генерацию по текстовому описанию кода на HTML + CSS, Python, JavaScript, а также SQL-запросов. При попытке создать код на старом-добром Pascal или на других менее популярных языках, Claude отказался сделать это, заявив, что у него «нет таких знаний или навыков».
Обучающий датасет Claude, в соответствии с дисклеймером Anthropic, содержит данные, собранные до весны 2021 года. Поэтому бот, подобно ChatGPT, не может выдавать достоверные утверждения о событиях последних двух лет. Наши попытки выведать у Claude какую-либо информацию о свежих новостях не увенчались успехом.
Возможность выхода в интернет для поиска актуальной информации у бота Anthropic пока не предусмотрена. Также у Claude нет плагинов, подобных плагинам ChatGPT, которые могли бы добавить программе ряд дополнительных функций.
Зато Claude значительно превосходит всех существующих конкурентов по размеру контекстного окна. Версия Claude 100K способна воспринять 100 000 токенов (это примерно 75 000 английских слов). Для сравнения, самая продвинутая модель от OpenAI GPT-4-32k, встроенная в ChatGPT, может удерживать в памяти в три раза меньше слов.
Благодаря гигантскому контекстному окну Claude во время одного из демонстрационных прогонов «прочитал» весь текст «Великого Гэтсби» за 22 секунды и смог верно ответить на вопросы, относящиеся к тексту культового романа Фицджеральда.
При этом стоит отметить, что столь впечатляющая фича недоступна пользователям в упрощённой версии бота. Обычный Claude Instant может за один раз обрабатывать лишь 9000 токенов (примерно 7000 слов), что соответствует способностям конкурентов.
Что у Claude под капотом
Чат-бот базируется на закрытой модели Anthropic-LM. Информации о нейросети немного. Известно, что одна из её версий содержит 52 миллиарда параметров (в три раза меньше, чем у первой версии ChatGPT).
По-видимому, упрощённый вариант бота Claude Instant работает на ещё более компактной модели. Результаты сравнения показателей работы Anthropic-LM с другими популярными нейросетями можно посмотреть в исследовании инженеров Стэнфордского университета.
Изюминкой Anthropic-LM является оригинальный метод обучения, основанный на своде правил, который в компании гордо назвали «конституцией». Специалисты подробно описали подход в препринте, опубликованном в декабре 2022 года.
В отличие от метода обучения RLHF (мы писали о нём в этой статье), в основе обучения по «конституции» лежит ранжирование ответов искусственным интеллектом, а не людьми-экспертами. Учёные Anthropic отмечают, что ИИ может заменить работу экспертов в 90% случаев. Таким образом, для обучения Claude требуется привлекать меньшее число сотрудников.
Помимо экономии на зарплате, метод позволяет избежать включения в логику работы нейросети стереотипов и предубеждений, характерных для людей, участвующих в обучении. Часть тренировочных образцов и подсказок разработчики выложили на GitHub.
Благодаря тому, что Claude доступен по API, его широко внедряют в различные сервисы чат-ботов и интеллектуальных услуг. Например, на решении от Anthropic работает служба быстрых подсказок DuckAssist в интернет-поисковике DuckDuckGo, а также платформа чат-ботов Poe.
Как получить доступ к Claude
Официальный сайт Anthropic предлагает два варианта доступа к чат-боту Claude: через веб-версию или через мессенджер Slack. Чтобы ими воспользоваться, нужно перейти на сайт продукта, нажать на соответствующую кнопку и подать заявку на подключение. Но сработает это только для жителей стран, в которых сервис открыт — России, как вы могли догадаться, в их числе нет.
К счастью, есть альтернативный вариант, позволяющий «пообщаться» с Claude из России. Для этого нужно всего лишь зарегистрироваться на платформе чат-ботов Poe. Она предоставляет доступ к различным языковым моделям, включая разработки Anthropic.
Чтобы воспользоваться нейросетью Claude из России, нужно выполнить следующие действия:
- Зайти на официальный сайт платформы Poe.
- Выбрать пункт Use email.
- Ввести в появившееся окошко адрес вашей электронной почты («ящик» на российском сервере сработал без проблем).
- Проверить свою почту и найти в ней письмо, пришедшее от сервиса (если ничего нет — посмотрите в папке «Спам»). В письме будет числовой код подтверждения (verification code).
- Введите код в соответствующее окошко на платформе Poe.
Готово! Платформа предлагает на выбор три версии бота Claude. Доступ к «облегчённому» Instant предоставляется бесплатно и без ограничений на количество запросов. У «продвинутого» Claude есть ограничения на количество запросов, а версия с контекстным окном на 100 000 токенов требует обязательной оплаты.
Кроме Poe доступ к Claude можно получить через другие платформы чат-ботов, например Forefront.
GigaChat — российский ответ от «Сбера»
24 апреля 2023 года «Сбер» представил своего универсального чат-бота GigaChat. Он стал первой российской разработкой, способной предоставить пользователям набор функций по работе с текстами, сопоставимый с ChatGPT. В качестве полезного бонуса, которого нет у заокеанского конкурента, разработка «Сбера» также может генерировать изображения по текстовым запросам. Разработчики утверждают, что «у GigaChat лучше всего получается решать профессиональные и творческие задачи». Над созданием программы трудились учёные из Sber AI, SberDevices и Института искусственного интеллекта AIRI. На данный момент GigaChat находится на стадии бета-тестирования.
Возможности GigaChat
Само собой, отечественный сервис лучше всего работает с русским языком. Кроме того, с ним можно поговорить и на английском. В плане работы с текстом и программирования, отечественный GigaChat способен решать те же задачи, что и ChatGPT. Правда, пока, по признанию разработчиков, он делает это хуже заморской программы.
При сравнении на тестах SBS (side by side), в которых люди-эксперты определяют предпочтительный вариант ответа от разных моделей, счёт оказался 30:70 в пользу американца. Зато в борьбе с популярной опенсорсной нейросетью LLaMA 13B, верх взял GigaChat с результатом 58:42.
Возможность генерации изображений в том же чате, в котором ведётся диалог с ИИ, является полезной функцией GigaChat, отличающей его от конкурентов. Структура нейросетей, использованных в отечественном боте, намекает на то, что вскоре его мультимодальность будет расширена. И тогда GigaChat, помимо текста, также сможет получать на вход изображения и обрабатывать их.
Стоит отметить наличие у сберовского бота подробной инструкции на русском языке, описывающей, как формулировать запросы к GigaChat, а также списка эффективных промптов для ИИ.
Что у GigaChat под капотом
Для реализации мультимодальных возможностей отечественные специалисты разместили внутри GigaChat сразу четыре нейронные сети. Они образуют ансамбль моделей под названием NeONKA (Neural Omnimodal Network with Knowledge-Awareness).
В состав NeONKA входят:
- Языковые модели RuGPT-3.5 и FRED-T5.
- Нейросеть RuCLIP, обеспечивающая текстовое описание изображений.
- Генератор изображений Kandinsky 2.1.
Суммарный размер ансамбля равен 18 миллиардам параметров. У ChatGPT в момент запуска было почти в 10 раз больше. Но с тех пор специалисты по ИИ пришли к выводу, что размер не всегда имеет решающее значение, и перестали сравнивать нейросети только по числу параметров.
Отечественные разработчики в описании модели FRED-T5 отмечают, что датасет, на котором она обучалась, был собран в 2020 году. Чтобы дать нейросети представление о современных событиях, её отдельно дообучили на небольшом наборе свежих новостей и статей «Википедии».
Поэтому можно предположить, что знания GigaChat о событиях 2021–2023 годов могут оказаться менее твёрдыми, чем о предшествующем времени. Возможности выйти в интернет для поиска актуальной информации у бота пока нет.
Специалисты «Сбера» обещают выложить в открытый доступ свою текстовую модель RuGPT-3.5, подобно тому, как ранее они опубликовали её предшественницу RuGPT-3. В таком случае GigaChat сможет претендовать на лавры самого открытого и прозрачного универсального чат-бота нового поколения из всех, существующих в мире.
Как получить доступ к GigaChat
В отличие от иностранных сервисов, для доступа к GigaChat жителям России не понадобится VPN и прочие «танцы с бубном». После завершения бета-теста, GigaChat можно будет бесплатно использовать в единой среде разработки Studio от «Сбера», доступной по этому адресу. Для регистрации достаточно указать свою электронную почту, а также придумать пароль или воспользоваться «Сбер ID».
Это была хорошая новость. Плохая заключается в том, что пока проходит период тестирования, право испытать GigaChat доступно не всем. Чтобы попасть в число счастливчиков, нужно вступить в официальный телеграм-канал чат-бота. Там время от времени «Сбер» раздает ссылки для регистрации новых пользователей в GigaChat.
Получив такую ссылку, вы должны перейти по ней и зарегистрироваться в сберовской среде Studio. Только в этом случае у вас в кабинете появится пункт Мой GigaChat, нажав на который вы сможете приступить к диалогу с вожделенным ИИ с российской пропиской.
Если тестовый период пройдёт успешно, «Сбер» откроет доступ к GigaChat всем желающим и начнёт внедрять чат-бота в свои продукты, например в ассистента «Салют».
Пока же тестировщики, получившие право на доступ к чат-боту, видят сообщение о том, что сервис временно недоступен. В это время программисты «Сбера» фиксят баги и обновляют модель.
Поскольку период, в течение которого GigaChat недоступен, затянулся, мы обратились в пресс-службу «Сбера» за пояснениями. Там нас заверили, что с отечественным чат-ботом всё хорошо и после обновления он станет ещё круче, нужно только подождать.
Подведём итоги
Лидером среди аналогов ChatGPT, скорее всего, станет Bard за счёт массовой интеграции с популярными сервисами Google. Однако в России Bard недоступен.
Сберовский GigaChat основан на отечественных опенсорсных моделях, что отличает его от закрытых заокеанских конкурентов. GigaChat опережает соперников по мультимодальным возможностям и идеально поддерживает русский язык. Но в течение тестового периода получить к нему доступ непросто. Кроме того, сервис в данный момент (июнь 2023 года) недоступен даже для бета-тестеров из-за технических работ.
Разработка Anthropic — настоящая «рабочая лошадка». За счёт массового использования в различных сервисах и платформах чат-ботов получить доступ к Claude из России оказалось даже легче, чем к GigaChat. Среди явных преимуществ Claude — рекордное контекстное окно на 100 000 токенов, но фича доступна только в «продвинутой» версии. С другой стороны, бот Anthropic, в отличие от конкурентов, пока может работать только с текстом.