Зачем понадобилась ещё одна нейросеть
Проблема: несмотря на продвинутые возможности, современные нейронки могут глючить — ошибаться, додумывать информацию, а иногда и грубить людям. Например, недавно новый Bing от Microsoft попросил пользователя извиниться за своё поведение, когда тот указал чат-боту на его ошибку.
Ситуацию осложняет закрытость крупных нейронок: нельзя просто так взять и посмотреть, как там всё устроено, даже если вы крупный исследователь в области нейросетей и могли бы сделать их работу стабильнее.
Решение: чтобы дать учёным возможность «подержать в руках» достижения современного ИИ, Meta* на днях выпустила свою нейросеть — называется LLaMA. По сути это та же самая GPT-3, которая работает «под капотом» у нашумевшего ChatGPT, только с бесплатной лицензией для исследователей.
Что она умеет
По словам Марка Цукерберга, LLaMA может делать всё то же, что и другие генеративные языковые модели, а именно:
- вести беседы;
- писать письма, статьи и посты в соцсетях;
- писать код для простых программ;
- отвечать на сложные вопросы;
- кратко пересказывать содержание текста;
- решать математические задачи.
Правда, есть нюанс: LLaMA не заточена на общение с реальными пользователями. То есть она вполне может ошибиться, сказать что-то лишнее, а то и вовсе огрызнуться. Загвоздка в том, что для обычных людей это сырой и ненадёжный продукт, а для исследователей — богатый материал для изучения.
Как устроена
Технически LLaMA — это не одна нейросеть, а целых четыре: на 7, 13, 33 и 65 млрд параметров. Количество параметров показывает, каких вычислительных мощностей требует нейросеть:
- Лёгкие версии (на 7 и 13 млрд параметров) можно запустить всего на одном графическом процессоре. Это актуально для небольших учреждений, у которых нет денег на дорогостоящее оборудование.
- Тяжёлые версии (на 33 и 65 млрд параметров) нацелены на то, чтобы конкурировать с мощными нейронками вроде DeepMind от Google, — и для них уже потребуются полноценные дата-центры.
Кто может попробовать
Все, кто имеет хоть какое-то отношение к ИИ, — исследовательские центры, университеты, отдельные учёные, политические и некоммерческие организации и так далее. Если вы тоже хотите поучаствовать, можете подать заявку на доступ к LLaMA через Google-форму. Правда, нужно будет указать ссылки на научные публикации, связанные с нейросетями и ИИ.
*Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».
Больше интересного про код в нашем телеграм-канале. Подписывайтесь!