Код

11 июл 2025
0

«Я не тороплюсь, но всё ближе к работе в data science»: история Станислава

Станислав много лет работает в IT. Несколько лет назад он решил сменить направление: он изучил data science и готов к новому витку карьеры.

Иллюстрация: Logan Voss / Dao Hi U / Unsplash / Дима Руденок для Skillbox Media

Александра Галимова

Копирайтер, переводчик, гострайтер, мама троих сыновей. Играет в шахматы, пишет о книгах и психологии.

Станислав Страхов

Россия, Москва

Пройденные курсы

«Профессия Data Scientist: машинное обучение»

Достижения

Окончил курс, развивается в новой сфере.

ссылки

Станислав рассказал:

как складывалась карьера в IT;
почему он проходил курс четыре года;
как разработал два дипломных проекта;
почему HeadHunter уже не так и хорош;
почему он настроен постоянно учиться;
какие есть направления в профессии data scientist;
что он планирует делать дальше.

«В IT я давно, но несколько лет назад заинтересовался ИИ»: о карьере

Я учился в институте на специальности, связанной с автоматизацией техпроцессов и производств. Мы изучали микроконтроллеры и системы управления, которые применяют в промышленности и в быту, — например, для автоматического управления освещением или инженерными сетями в зданиях.

Во время учёбы я уже работал по специальности. А после получения диплома немного поменял направление деятельности — с автоматизации техпроцессов на автоматизацию бизнеса. Работал на проектах Oracle Siebel CRM. Делали коробочное решение для крупных российских банков.

Станислав со своей собакой Джеком
*Фото: личный архив Станислава Страхова*

Сейчас я разработчик в иностранной компании. Мы делаем процессинговую систему для топливных карт. Я дорабатываю терминальный софт. У нас в России тоже есть подобные системы — «Лукойл», «Интеркарт».

В общем, в IT я уже давно, но машинным обучением и искусственным интеллектом заинтересовался в 2018–2019 годах. Мне всё чаще попадались статьи на «Хабре» или в ленте новостей: о том, что сгенерирована картинка по текстовому описанию, или о том, что кота скрестили с собакой с помощью ИИ... Всё это было очень интересно, и я подумал, что неплохо бы мне перейти в эту сферу. Для этого нужно было пройти структурированное обучение от людей, которые работают в этой области, — чтобы не просто нахвататься обрывочных знаний, а получить хорошую базу.

Я обратил внимание на курс Skillbox «Data Scientist Pro» (так он тогда назывался). Там были лекторы по разным направлениям из интересных компаний. Программа курса была очень разнообразной, и я решился — приобрёл его в 2020 году.

«Я учился долго, но специалисты по ИИ стали ещё более востребованы»: об обучении

Проходил я этот курс долго — четыре года. Был загружен на работе и не был готов полностью пожертвовать свободным временем, чтобы быстро-быстро изучать все модули и сдавать работы. Решил, что лучше двигаться медленно, досконально разбираться во всём и погружаться в задачи. И вот наконец курс полностью пройден, и я защитил два дипломных проекта.

Я думаю, что всё сделал правильно: область ИИ всё так же (если не больше) популярна, а востребованность специалистов растёт.

Модули, которые были в начале, давались мне легко. Python и работа с данными проблем не вызывали. Сложности начались, когда стали проходить нейросети, где много математики «под капотом». Пришлось потратить немало времени, чтобы настроить модель на достаточно точный результат.

Сложнее всего было справиться с техническими ограничениями. Компьютер у меня тогда был не самый мощный, а дипломный проект я делал в Google Colab — это облачная среда для работы с кодом, которой часто пользуются специалисты в сфере data science. В бесплатной версии запуск шёл на удалённой машине, модель обучалась с перебоями и иногда просто «падала». Ушло много времени, но зато я получил ценный опыт: научился настраивать и корректировать архитектуру нейросетей.

Свою нейросеть с нуля собирать смысла нет — это как изобретать велосипед.

Я выбрал готовую архитектуру и занялся её дообучением: читал документацию (вся, конечно, на английском), искал статьи с похожими задачами, разбирался, как делать fine-tuning-модели. Это кропотливая, почти исследовательская работа — но она действительно даёт понимание о том, как всё устроено внутри.

«Потратил много времени, но результатом доволен»: о финальных проектах

Мой первый проект был связан с онлайн-кинотеатром, который придумал Skillbox, — «Самые зрелищные сериалы РФ». Идея такая: нейросеть оценивает сериалы по реакции зрителя. Например, человек смотрит «Короля Льва», а система отслеживает выражения его лица — злость, интерес, радость, разочарование.

Мне выдали датасет — фотографии с эмоциями, которые нужно было разметить по девяти базовым состояниям. Но данные оказались далеко не идеальными: дубли, странные ракурсы (например, видно только нос и ухо), разный размер и качество изображений, противоречивая разметка. Пришлось всё аккуратно вычищать, готовить и нормализовать.

Я подключил нужные библиотеки, загрузил датасет в ноутбук, почистил и начал собирать прототип нейросети на базе архитектуры ResNet.

Станислав на плато Путорана в Заполярье, лето 2024 года
*Фото: личный архив Станислава Страхова*

Второй проект был связан с рекомендательными системами. Я делал её для пользователей онлайн-гипермаркета Instacart. Один покупает набор здорового питания, второй — дешёвый джанк фуд, третий — ещё что-то. И вот на базе прошлых покупок нужно выстроить рекомендации. С помощью коллаборативной фильтрации библиотеки я делал нейросеть, с помощью которой можно было учитывать привычки и метрики качества.

Времени на эти проекты я потратил много, но в результате у меня получились хорошо работающие продукты. Я доволен.

«Рынок труда изменился»: о поиске работы

Сразу после вуза я начал активно пользоваться HeadHunter — и долгое время это отлично работало. У меня инженерная специальность, напрямую с IT не связана, но это не помешало устроиться на позицию, где нужно было работать с CRM-системами. Тогда никто не рассматривал резюме под лупой: если видели подходящий опыт, приглашали на собеседование.

Сейчас всё по-другому. Рынок перегрет, откликов на вакансии сотни, и эйчарам просто физически сложно отобрать релевантных кандидатов. Я бы, наверное, на их месте делал перезапуск вакансии — чтобы отсеялись случайные отклики и остались те, кому действительно интересно. Хотя понимаю, почему так происходит: многие шлют резюме на всё подряд и не всегда оценивают свои навыки и соответствие позиции. Это усложняет поиск для всех — и для соискателей, и для работодателей.

Резюме на HeadHunter словно уходят в никуда. Меня даже на собеседование ни разу не позвали.

Сейчас планирую рассмотреть другие варианты поиска работы — в профильных телеграм-каналах, в сообществах дата-сайентистов. А я участвовал в вебинарах по поиску работы от Центра карьеры Skillbox. С моим персональным менеджером мы общаемся, корректируем резюме, обсуждаем варианты. Уверен, что и это тоже сработает. Просто делаю поправку на то, что сейчас лето, сезон отпусков.

Плюс сказывается макроэкономическая нестабильность. Многие компании запускают проекты в области data science и искусственного интеллекта, формируют команды, набирают опытных специалистов. Но если проект не начинает приносить быструю прибыль или его сложно продать клиентам, его могут свернуть уже на старте.

«Эта сфера стремительно развивается, и нужно ещё и учиться самому»: о работе в области ИИ

Сейчас я в поиске работы в сфере искусственного интеллекта — хочу применить полученные знания на практике. Я понимаю, что рынок меняется очень быстро: появляются новые нейросети, растёт количество задач, обновляются библиотеки.

Чтобы оставаться востребованным, нужно постоянно учиться и подтягивать свои навыки под актуальные требования. Это нормально — я воспринимаю это как часть профессии.

Например, я делал проект по распознаванию эмоций с помощью свёрточной нейросети — всё строилось на старых версиях библиотек. Если сейчас делать такую же задачу для реального заказчика, придётся пересобирать код: что-то переписать, что-то убрать или добавить, чтобы он соответствовал текущим требованиям и работал стабильно.

Многое зависит от проекта и заказчика. Скажем, если это система распознавания лиц с уличных камер — такая, что работает на всю Россию, с высокой нагрузкой и тысячами пользователей, — тут лишние обновления могут только навредить. Любая попытка модернизации может привести к сбоям. Поэтому такие продукты дорабатывают не в техническую глубину, а в сторону взаимодействия с заказчиком.

А вот если продукт работает в конкурентной нише и нацелен на массового пользователя — как, например, генераторы дизайнов или видео в Telegram-ботах, — его постоянно улучшают, дополняют, дорабатывают. Там без быстрых обновлений просто не выжить.

Станислав в Самарканде возле гробницы Тамерлана с местной жительницей
*Фото: личный архив Станислава Страхова*

Станислав (посередине) в Узбекистане, на горнолыжной трассе Амирсой на горном хребте Тянь-Шань с туристами из Австралии
*Фото: личный архив Станислава Страхова*

«Это кропотливая работа»: о профессии data scientist

В разных командах под этой ролью могут скрываться совершенно разные задачи. Data science — это не одна профессия, а целая группа направлений.

ML-инженеры (Machine Learning Engineers) — это те, кто разрабатывает и обучает модели машинного обучения. Они пишут код нейросетей, подбирают архитектуру (например, количество слоёв в модели), тестируют, дообучают и следят за результатами. А когда модель готова — деплоят её на сервер, чтобы она могла работать с реальными данными. ML-инженеры тоже бывают разными: кто-то работает с компьютерным зрением (CV), кто-то — с текстами (NLP), кто-то — с голосом или чат-ботами.

Аналитики данных чаще работают на подготовительном этапе. Они исследуют данные, очищают их, находят закономерности и подготавливают «сырьё» для дальнейшего обучения моделей. От качества этой работы зависит, насколько точной получится модель.

Data-инженеры создают инфраструктуру — хранят, обрабатывают и передают большие объёмы данных. Без них данные просто не дошли бы до нужных специалистов в нужной форме.

Мне ближе всего работа ML-инженера. Мне нравится собирать нейросети, наблюдать, как они обучаются, и настраивать архитектуру таким образом, чтобы добиться нужного результата. Хотя и анализ данных интересен, это как археология — ты погружаешься в массив цифр и постепенно начинаешь понимать, как они работают.

В целом, все роли в data science объединяет одно — постоянное развитие и внимание к деталям. Это работа, для которой нужно любить учиться и не бояться ошибок.

«Так или иначе я буду профессионально заниматься ИИ»: о планах

Data science — сфера динамичная, конкурентная, и я сразу понимал, что лёгкого пути не будет. Но у меня не было иллюзий. Я ничего не бросал, не делал резких шагов с непредсказуемыми последствиями. Просто начал изучать data science в свободное время — потому что было интересно.

Сейчас продолжаю держать руку на пульсе: слежу за новыми инструментами, читаю про кейсы и задачи. Уверен, что со временем найду способ войти в эту сферу профессионально.

Я не начинающий специалист: с компьютером на «ты», за плечами — годы работы в IT. Не хотелось бы идти на позицию стажёра или джуна. Быстро вникаю в новые задачи, умею работать в команде, не потребую времени на «введение в профессию». Работа у меня есть, так что я ищу вдумчиво и без спешки проект, в котором мои знания и опыт действительно пригодятся.

Мне пока не хватает коммерческого опыта в ИИ, но я его получу. Возможно, через хакатоны и контесты. Вот недавно было мероприятие от сообщества Open Data Science. VK, «Авито» и «Яндекс» часто проводят митапы и викторины, дают решать алгоритмические задачи, поправлять фрагменты кода, который криво сгенерировала нейросеть. В общем, я пробую разные варианты и обязательно достигну цели.

Читайте также: