Meta* представила свою нейросеть для исследователей в области ИИ

Это как ChatGPT, только для учёных.

Максим Сафронов

Шеф-редактор Skillbox Media «Код». Пишет о разработке, софт-скиллах и культовых личностях в IT. Обожает Swift, продукты Apple и мемы про код.

Зачем понадобилась ещё одна нейросеть

Проблема: несмотря на продвинутые возможности, современные нейронки могут глючить — ошибаться, додумывать информацию, а иногда и грубить людям. Например, недавно новый Bing от Microsoft попросил пользователя извиниться за своё поведение, когда тот указал чат-боту на его ошибку.

Ситуацию осложняет закрытость крупных нейронок: нельзя просто так взять и посмотреть, как там всё устроено, даже если вы крупный исследователь в области нейросетей и могли бы сделать их работу стабильнее.

Решение: чтобы дать учёным возможность «подержать в руках» достижения современного ИИ, Meta* на днях выпустила свою нейросеть — называется LLaMA. По сути это та же самая GPT-3, которая работает «под капотом» у нашумевшего ChatGPT, только с бесплатной лицензией для исследователей.

Что она умеет

По словам Марка Цукерберга, LLaMA может делать всё то же, что и другие генеративные языковые модели, а именно:

вести беседы;
писать письма, статьи и посты в соцсетях;
писать код для простых программ;
отвечать на сложные вопросы;
кратко пересказывать содержание текста;
решать математические задачи.

Правда, есть нюанс: LLaMA не заточена на общение с реальными пользователями. То есть она вполне может ошибиться, сказать что-то лишнее, а то и вовсе огрызнуться. Загвоздка в том, что для обычных людей это сырой и ненадёжный продукт, а для исследователей — богатый материал для изучения.

Как устроена

Технически LLaMA — это не одна нейросеть, а целых четыре: на 7, 13, 33 и 65 млрд параметров. Количество параметров показывает, каких вычислительных мощностей требует нейросеть:

Лёгкие версии (на 7 и 13 млрд параметров) можно запустить всего на одном графическом процессоре. Это актуально для небольших учреждений, у которых нет денег на дорогостоящее оборудование.
Тяжёлые версии (на 33 и 65 млрд параметров) нацелены на то, чтобы конкурировать с мощными нейронками вроде DeepMind от Google, — и для них уже потребуются полноценные дата-центры.

Кто может попробовать

Все, кто имеет хоть какое-то отношение к ИИ, — исследовательские центры, университеты, отдельные учёные, политические и некоммерческие организации и так далее. Если вы тоже хотите поучаствовать, можете подать заявку на доступ к LLaMA через Google-форму. Правда, нужно будет указать ссылки на научные публикации, связанные с нейросетями и ИИ.

*Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».

Больше интересного про код в нашем телеграм-канале. Подписывайтесь!

Читайте также: