OpenAI: история компании, создавшей ChatGPT
Прометей, несущий огонь познания, или Пандора, выпустившая на волю все беды мира?
Иллюстрация: Delbo Andrea / Jamesonwu1972 / Shutterstock / Colowgee для Skillbox Media
Последний год в медиа только и разговоров, что о ChatGPT: то нейросеть напишет диплом, то собеседование в Google пройдёт, то ещё что-нибудь придумает. Да и имя OpenAI, разработчика чат-бота, звучит довольно громко — взять хотя бы историю с увольнением Сэма Альтмана (которое, похоже, так и не состоялось).
Тем не менее за жизнью OpenAI следят не так активно, как за её детищем. Частично в этом виновата сама «открытая» лаборатория, которая держится весьма закрыто и не слишком балует нас рассказами о внутренней кухне. Поэтому мы решили провести разведку по открытым источникам — выясним, что это за компания, кому принадлежит, как зарабатывает и в чём её сила.
Сегодня вы узнаете:
Рождение Прометея
OpenAI основали в 2015 году Илон Маск и Сэм Альтман (бывший президент стартап-инкубатора Y Combinator). Но, конечно, не одни — среди основателей числятся видные учёные Кремниевой долины, а среди первых инвесторов можно выделить Рида Хоффмана — основателя LinkedIn, человека, который помог раскрутиться «Фейсбуку»* и доброму десятку других стартапов долины.
Миссия OpenAI — создать мощный и гуманный ИИ, который будет работать на благо всего человечества, а не отдельных лиц и корпораций. Для этих целей компанию изначально зарегистрировали как НКО — предполагалось, что фонд будет создавать безопасный ИИ на деньги жертвователей, рассказывать о своей работе и держать исходный код открытым для изучения. Грубо говоря, это как если бы Линус Торвальдс решил заняться машинным обучением.
Больше всех идею создания прозрачного ИИ в публичном поле продвигал Маск — миллиардер не устаёт напоминать, что ИИ в перспективе может быть опаснее ядерной бомбы, а потому должен управляться обществом, а не корпоративными боссами из Сан-Франциско (или ещё кем похуже).
«С помощью искусственного интеллекта мы вызываем демона. Во всех тех историях, где есть парень с пентаграммой и святой водой, он как будто уверен, что сможет контролировать демона. Не получилось».
Илон Маск,
во время выступления в MIT
Впрочем, мечте о полностью неподкупном ИИ не суждено было сбыться. Чтобы создать сверхмощный компьютерный разум, нужно железо. И деньги. Поэтому топы OpenAI стали думать, как привлечь в проект ещё больше инвестиций. И здесь за дело уже взялся Сэм Альтман со своей хваткой венчурного инвестора и способностью выжимать деньги из воздуха.
Решение нашлось быстро — у компании появилась «дочка», рождённая специально для сбора денег. И с тех пор OpenAI — это целых две компании:
Основная (OpenAI) — собственно, НКО, которая разрабатывает ИИ, обучает нейросети и проводит исследования в области машинного обучения. У фонда нет владельцев — только совет управляющих, во главе которого стоит Сэм Альтман.
«Коммерческая» (OpenAI Limited Partnership) — компания-прокладка, которая собирает деньги для НКО и проводит за неё операции — например, продажу подписок на ChatGPT. Де-юре OpenAI LP принадлежит инвесторам, но именно НКО принимает все важные решения и распределяет заработанные деньги.
Трюк, очевидно, сработал: годом позже OpenAI выпускает прорывную модель GPT-2 на 1,5 млрд параметров, которая писала вполне осмысленные тексты и в целом была уже довольно близким предком ChatGPT. Правда, модель почти сразу свернули — слишком уж складно у неё получалось сочинять фейк-ньюс.
А ещё чуть позже в OpenAI через «дочку» занесла свой первый миллиард корпорация Microsoft. И тут нейросети посыпались уже, что называется, как из рога изобилия: сначала GPT-3, потом генератор картинок DALL-E и помощник программиста Copilot, а затем появился и сам ChatGPT.
Как вам такая некоммерческая организация? Впрочем, ни огромные инвестиции, ни выручка от продажи платных подписок и API, не выводят OpenAI на желаемый уровень прибыли: по данным инсайдеров, в 2022 году доходы компании составили 80 млн долларов при убытках в 500 млн.
Уход Илона Маска
В 2018 году Илон Маск покинул совет директоров OpenAI. Есть три версии, объясняющие, почему он так поступил:
Официальная. Из-за конфликта интересов между НКО и компанией Tesla, которую возглавляет Маск. Дело в том, что сотрудники Tesla работают над алгоритмами на базе ИИ для управления электрокарами. И Маск вполне мог использовать наработки OpenAI для совершенствования этих алгоритмов. Ну, или переманивать оттуда таланты — что, кстати, произошло с Андреем Карпати, который из простого научного сотрудника НКО вырос в целого главу автопилота Tesla (потом, правда, вернулся обратно, но это сути не меняет).
Правдоподобная. Люди, знакомые с ситуацией, рассказывают, что Маск хотел больше влияния в компании. Он считал, что OpenAI безбожно отстаёт от Google, а потому предложил взять бразды правления в свои руки. Другим акционерам это пришлось не по нраву, а потому Маск махнул рукой и распрощался с компанией. Чем, кстати, обрёк её на поиск источников дохода — лишившись инвестиций Маска, НКО уже не могла вносить астрономические суммы за аренду суперкомпьютеров для обучения ИИ.
Версия самого Маска. После ухода из компании миллиардер стал чуть ли не главным критиком OpenAI, обвиняя её в закрытости, алчности и слишком тесных связях с Microsoft, которая «чуть ли не напрямую контролирует» НКО. Родившись как некоммерческий фонд с открытым исходным кодом, OpenAI превратилась, по сути, в полную свою противоположность:
«Это похоже на то, как если бы создали организацию для спасения тропических лесов Амазонки, а превратили её в лесопромышленную компанию, вырубили лес и продали его за деньги».
Илон Маск,
в интервью телеканалу CNBC
Однако без дела Илон сидел недолго: летом 2023 года он основал новую ИИ-компанию xAI, на этот раз — ни много ни мало — чтобы «разобраться в истинной природе Вселенной». Для решения этой амбициозной задачи он собрал выходцев из лучших ИИ-лабораторий мира, включая OpenAI, DeepMind, Microsoft и Google Research, в том числе работавших над моделями GPT-3.5 и GPT-4.
Что это — зависть к успехам бывшей компании или желание показать, как действительно надо делать ИИ, — понять сложно. Но кажется, Маск всерьёз намерен конкурировать с ChatGPT — и уже даже выпустил первую версию своей языковой модели под названием Grok, которая не только отвечает на вопросы, но и может «подсказать, какие следует задать».
Контракт с Microsoft
В 2019 году Microsoft инвестировала в стартап 1 млрд долларов: частично в виде реальных средств, частично — в виде так называемых кредитов Azure. Кредиты Azure дают OpenAI возможность использовать серверные мощности для разработки своих моделей ИИ. Это сделало корпорацию главным поставщиком облачных услуг для OpenAI: по сути, всё, что вы генерируете с помощью ChatGPT и DALL-E, так или иначе проходит через серверы Microsoft.
Двумя годами позже Microsoft вложила в OpenAI ещё 2 млрд, а затем — ещё 10, что стало одной из самых крупных инвестиций компании последних лет. И это, конечно, неспроста: во-первых, майки наконец получили шанс утереть нос Google, причём в такой трепетной для них нише, как искусственный интеллект. Да не просто утереть: выход ChatGPT боссы «корпорации добра» восприняли как экзистенциальную угрозу и бросились впопыхах выпускать свои сырые нейросети в надежде обогнать и перегнать конкурентов.
А во-вторых, с помощью GPT майки серьёзно оживили свои продукты: друг за другом резко поумнели поисковик Bing, сервис Teams, Loop, аналог Notion, и даже, прости господи, Paint уже собрался генерировать картинки. Но главное — новую жизнь получили корпоративные сервисы Microsoft, которые приносят компании больше всего прибыли: это и офисный пакет Microsoft 365, и Windows Server, и облачная инфраструктура Azure AI.
Продукты OpenAI
Работа OpenAI в сотрудничестве с Microsoft оказалась весьма плодотворной: с 2019 года компании совместно выпустили целый пул мощных ИИ-продуктов.
Языковые модели GPT
Разработанная компанией языковая модель GPT позволила реализовать алгоритм NLP, нацеленный на обработку естественного языка. Модель обучается на основе массива текстов. Так, для обучения GPT-2 использовали 40 ГБ текстовых данных, а для GPT-3 — уже 530 ГБ.
GPT-3 вышла в 2020 году и стала на тот момент самым мощным ИИ. Она умела генерировать связный текст, переводить с одного языка на другой точнее онлайн-переводчика, писать код и вести диалог с пользователем.
Правда, доступ для обычных пользователей к GPT-3 так и не открыли: эксклюзивную лицензию на использование исходников получила только Microsoft. Однако разработчикам открыли доступ через API — и уже через девять месяцев после запуска GPT-3 установили более чем в 300 приложениях.
Следующая, четвёртая версия модели вышла весной 2023 года. Количество параметров нейрости неизвестно, но OpenAI утверждает, что оно намного больше, чем у GPT-3. А ещё, по сравнению с предшественницей, нейросеть стала мультимодальной: она одновременно может обрабатывать и текст, и картинки — например, объяснить, в чём юмор отдельно взятого мема.
ChatGPT
Основанный на GPT-3.5 и GPT-4 чат-бот, который умеет генерировать любые тексты по запросу: от поста для блога до эссе или кода простого приложения.
А ещё чат-бот может помочь в составлении резюме, сформировать сводную таблицу в Excel или подготовить текст для презентации. Примечательна и история Александра Жадана, студента РГГУ, который написал и отредактировал диплом с помощью ChatGPT. Правда, писать пришлось по кусочкам, учитывая ограничения по объёму в 5000 символов.
И конечно, появление столь мощного ИИ не обошлось без эксцессов. Дело в том, что в определённых условиях модель может испытывать галлюцинации — то есть выдавать неверные ответы и подкреплять их несуществующими фактами. Более того — иногда и откровенно хамить. Так, пользователь Reddit указал основанному на ChatGPT чат-боту Bing на ошибку в датах, в ответ на что ИИ в грубой форме попросил пользователя извиниться.
DALL-E
DALL-E — мультимодальная нейросеть для генерации картинок по текстовому запросу, разработанная на основе GPT-3 и CLIP — двух дополняющих друг друга алгоритмов.
По текстовому запросу DALL-E может генерировать изображение в высоком разрешении либо отредактировать предложенную ей картинку. А благодаря умению распознавать и достраивать картинки нейросеть может даже проходить визуальные задания из тестов на IQ.
Whisper
Система распознавания речи и перевода её в текст. Распознаёт речь на 99 языках и работает с файлами практически любого формата. Whisper пригодится для расшифровки лекций, конференций или интервью.
Правда, с установкой придётся немного попотеть, поскольку отдельного приложения у Whisper нет. Придётся или локально ставить программу из GitHub, или работать в браузере через Google Colab.
«Увольнение» Сэма Альтмана: что будет дальше
17 ноября 2023 года OpenAI в своём блоге объявила об увольнении Сэма Альтмана. Решение принял совет директоров, мотивировав его почти что классическим «в связи с утратой доверия» — дескать, Альтман был не всегда честен с советом, а потому оставаться на посту не может. Весь переворот занял что-то около получаса: монарх явился на будничный созвон в Google Meet, где верные подданные и «отрекли» его от престола.
Вся эта история, конечно, не понравилась инвесторам — и особенно Microsoft, акции которой на фоне новостей просели на 7%. А тут ещё вслед за Тимуром стала увольняться и его команда: сначала топы, а затем и обычные кадры. Стали думать, как вернуть всё назад: сначала предложили Альтману и всем уволившимся места в Microsoft. Но когда поняли, что уволившихся больше, чем мест (а уйти грозился почти весь штат), стало ясно, что надо наказывать зачинщиков. На том и порешили: Альтман возвращается в кресло, а совет директоров почти в полном составе — в отставку.
В Microsoft были только рады — Сатья Наделла заявил в Twitter, что его «воодушевляют изменения в совете директоров OpenAI». В общем, хэппи-энд как он есть.
Что это значит? По самой популярной в Сети версии, всему виной — идейный конфликт между Альтманом и другими отцами-основателями НКО. Мол, слишком уж сильно дядюшка Сэм заигрался в «Монополию», совсем забыв об изначальной миссии компании. Что якобы злило многих в верхушке OpenAI, которые тайно стояли на позициях Маска и опасались, что погоня за длинным долларом приведёт к приходу Скайнета, порабощению человечества и прочим апокалиптическим сценариям.
Но даже если это и так, роспуском совета директоров этот конфликт не разрешится, и OpenAI ещё предстоит выяснить, кто она: Прометей, несущий людям огонь познания или Пандора, выпустившая наружу все беды мира.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!
* Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».