Специалисты из Центра искусственного интеллекта «Т-Банка» выпустили языковую ИИ-модель, которая содержит 8 миллиардов параметров. Внутренние и индустриальные бенчмарки показали, что модель «Т-Банка» продемонстрировала лучшие результаты в решении бизнес-задач на русском языке в своем классе.
ИИ-модель для бизнес-задач
Разработчики компании представили T-lite в рамках первой конференции «Т-Банка» по машинному обучению Turbo ML Conf. Модель представляет собой инструмент разработки, с помощью которого бизнес сможет создавать LLM-приложения для собственного использования без передачи данных третьим лицам. Например, это могут быть ассистенты поддержки для обработки запросов, ответов на вопросы и так далее.
Согласно результатам тестов, ИИ-модель «Т-Банка» обогнала по показателям зарубежные Llama3-8b-instruct и Chat-gpt 3.5. Стоит отметить, что T-lite создавали с использованием всего 3% вычислительных ресурсов, которые обычно требуются для подобных моделей.
Экономическая выгода
Обычно при увеличении числа параметров ИИ-модели способны выполнять более сложные задания, но одновременно ухудшается их экономическая эффективность. В случае с T-lite ситуация иная — после дообучения для выполнения бизнес-задач она выдаёт ответы, сопоставимые по качеству с проприетарными моделями размером от 20 миллиардов параметров, при этом T-lite значительно дешевле в эксплуатации.
T-lite входит в семейство собственных языковых моделей «Т-Банка» Gen-T, которые способны обучаться для решения конкретных узкоспециализированных задач.
Модель T-lite доступна для скачивания на файлообменнике Dropbox. Архив с моделью и архив с инструкциями весят по 11,85 гигабайта.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!