«Data Science — это синтез всех моих интересов»
Когда надоело программирование, Жираслан занялся Data Science. Работая в крупном банке, он ставит себе целью стать гуру в новой профессии.
Фото: личный архив Жираслана Шеджема
Жираслан Шеджем
Россия, Москва
Пройденные курсы
Достижения
Прошёл курс Skillbox, стажировался в «ВТБ Капитал», работает аналитиком данных в «Тинькофф Банке».
Жираслан рассказал:
- кто такие аналитики-универсалы и почему они нужны компаниям;
- что дата-сайентист обсуждает с заказчиком перед выполнением проекта;
- сложно ли новичку найти работу в Data Science (спойлер — нет);
- как нечестные исследования вредят бизнесу;
- что он думает о нейросетях, которые пишут книги.
«Я мечтаю стать аналитиком-универсалом. Эти специалисты полностью меняют IT-индустрию»
— Жираслан, почему ты выбрал Data Science?
— Я неплох в математике, мне нравится кодить. А ещё совсем недавно я увлёкся экономикой и ведением бизнеса. Математиком, программистом или экономистом себя не вижу, но зато я понимаю, как применять знания из этих областей в аналитике данных. Data Science — это синтез моих интересов.
— А ты пробовал программировать?
— Да, я учился на инженера-программиста. Но интересно было только первые два года, пока нам преподавали математику и физику. А когда началась разработка мобильных и веб-приложений, работа с серверной частью и изучение новых программ, мне всё жутко наскучило, я понял, что инженера из меня не выйдет, да и программиста, постоянно сидящего за компьютером в офисе, тоже. Бросать универ не хотел — до конца учёбы оставалось полтора года, а идти в армию было бы очень некстати. Решил доучиться и параллельно учиться новой профессии дата-сайентиста в Skillbox.
— Как удавалось совмещать учёбу в двух местах?
— Поначалу с трудом. Я всегда ответственно относился к учёбе на курсах, поэтому, когда в универе накопились первые долги, у меня появился стресс. С одной стороны, я получал кайф от того, что наконец-то нашёл себя в новом деле. А с другой — я не был морально готов к отчислению. Но со временем привык — расставил приоритеты, научился относиться к учебным долгам как к издержкам и уже в последний год не особо переживал по этому поводу.
— Ты сказал, что заинтересовался экономикой и ведением бизнеса. Почему это вдруг?
— Мне всегда казалось, что технарей недооценивают. Гениальные изобретения, работа инженеров и учёных не слишком обсуждаемы в обществе. А новости экономики, бизнеса и юриспруденции всегда на первых полосах. В вузах эти направления были популярными всегда, и у меня сформировалось ощущение, что я что-то упускаю.
Поэтому сейчас, когда я окончил бакалавриат и нашёл работу в Data Science, я наконец-то решил утолить свой интерес к экономике и бизнесу. Я пошёл в магистратуру, чтобы лучше разбираться в предметной области и погрузиться в сферу финансов.
— Ты постоянно учишься! Откуда у тебя такая потребность?
— Считаю, это нужно делать, чтобы повышать свою ценность на рынке труда. Особенно если ты выбрал сферу Data Science. Я мечтаю стать аналитиком-универсалом. Такие специалисты совершают открытия, полностью переворачивая IT-индустрию. Главное — компании нуждаются в специалистах, которые на высоком уровне разбираются в разных аспектах Data Science. Чтобы стать таким профессионалом, я много учусь и практикуюсь.
«Работодатели в Data Science уделяют внимание не столько опыту, сколько скиллам и знаниям»
— До интервью ты поделился со мной, что проходил стажировку в «ВТБ Капитал». Как это было?
— Это было круто! Я начал стажироваться там через полгода после начала обучения в Skillbox. Чтобы попасть на стажировку, я прошёл много тестов на логику, восприятие графиков, чисел, диаграмм, а также собеседование на английском. Было непросто, но я отлично справился со всеми вступительными испытаниями. На стажировке я писал запросы в базы данных и составлял в итоге отчёт, который рассылал потом по почте сотрудникам компании.
В целом мне понравилось. Я увидел работу аналитика изнутри, да и прокачался в общении с людьми — понял, что дата-сайентисту необходимо уметь правильно разговаривать с заказчиками.
— Правильно — это как?
— Бывает так, что заказчик объясняет задачу, плохо представляя конечный результат. Например, он просит дата-сайентиста узнать, как метрики отражают «экономику» компании, не поясняя, что он подразумевает под «экономикой». И тут мы начинаем додумывать: «Экономика — это суммарная выручка или средний чек покупки? А может, заказчик хотел, чтобы я нашёл информацию о стоимости привлечения одного нового клиента?»
У меня несколько раз случались такие конфузы, прежде чем я понял: чтобы не гадать и потом не переделывать свою работу по несколько раз, грамотный аналитик данных должен уточнить, что именно заказчик ожидает от проекта.
— Что было после стажировки в ВТБ?
— Ещё полгода я учился и узнавал новое по профессии, а потом решил, что набрался достаточно опыта для полноценной работы дата-сайентистом. Я нашёл вакансию аналитика данных в «Тинькофф Банке» и решил к ним попасть.
— Сложно ли junior-специалисту найти работу в Data Science?
— Я бы так не сказал. Считаю, что работодатели в Data Science уделяют внимание не столько опыту, сколько скиллам и знаниям. Конечно, специалисты бывают разные: у кого-то больше опыта и знаний, у кого-то меньше — джун джуну рознь :) Но я думаю, что прошедшим профильные курсы и умеющим применять свои знания на практике найти работу не составит труда.
— Чем занимаешься в «Тинькофф»?
— Я аналитик в отделе контроля качества. Слежу за доступностью банковских сервисов и составляю отчёты с графиками и статистикой о том, насколько стабильно они работают. Эти отчёты нужны сотням людей, начиная от моих коллег по отделу и заканчивая топ-менеджментом, таким образом они могут оценить работу банка.
Честно говоря, я просто кайфую :) В мои задачи входит работа с данными, их предобработка, визуализация, написание запросов к базам данных и программирование на Python. Это круто и в то же время непросто. Я с первого дня понял, что в «Тинькофф» рабочие задачи будут сложнее, чем в «ВТБ Капитал». Но, как я уже сказал раньше, познавать новое — это суть моей профессии.
«При работе с данными важно быть непредвзятым. Так делают не все»
— Помимо работы, как ты прокачиваешь свои скиллы в Data Science?
— На работе я практически не сталкиваюсь с машинным обучением. И когда я почувствовал, что постепенно забываю теорию в этой области, решил поучаствовать в студенческой олимпиаде «Яндекса» «Я — профессионал». Мне понравилось! Выполняя задачи, я освежил свои знания из курса. Думаю, что на работе или в учёбе я бы не смог так прокачаться. Теперь планирую периодически участвовать в таких олимпиадах и турнирах для дата-сайентистов.
И ещё как-то раз я выполнил для саморазвития два pet-проекта. Они прекрасно дополнили моё портфолио.
— Что это за проекты?
— В первом я описывал методы разделения электронных писем на спам и не спам. Задача была в том, чтобы я выбрал самый эффективный метод распределения писем в одну из этих двух групп. В ходе своего исследования я изучил элементы естественного языка, его обработку и классические методы машинного обучения.
Во втором проекте я определял наиболее правдоподобные цены на жильё, исходя из разных параметров: численности населения исследуемого района, близости к метро или к побережью, климата, транспортных схем. На основании этих данных я составлял модель машинного обучения, которая предсказывала примерную стоимость недвижимости. Думаю, это полезно тем, кто ищет жильё, и тем, кто его сдаёт.
— Что, по-твоему, особенно важно учитывать при работе с данными?
— Всегда быть честным и непредвзятым. Иногда случается так, что проводимые тесты и исследования дают не те результаты, которые ты ожидал. Тогда у некоторых дата-сайентистов может возникнуть соблазн продлить проверки гипотез, набрать ещё больше данных, хотя их целевое количество уже есть. Тогда есть риск необъективно оценить то, что говорят цифры, искусственно получить желаемое и представить его как действительное.
Естественно, это сильно вредит бизнесу. Вместо того чтобы получать новую прибыль, компании приходится подсчитывать убытки. Поэтому профессиональный аналитик никогда не будет врать в своих исследованиях. Об этом, кстати, есть очень интересная книга — «Как лгать при помощи статистики» Дарелла Хаффа.
О гимнастике для мозга и нейросетях-писателях
— Как ты отдыхаешь от учёбы и работы?
— Я без ума от футбола — стараюсь периодически играть с друзьями. Ещё я люблю шахматы. И обожаю художественную литературу о личностях, которые сделали себя сами — «Трилогия желания» Теодора Драйзера, «Мартин Иден» Джека Лондона и «Дело, которому ты служишь» Юрия Германа.
— А чем тебе нравятся шахматы?
— Шахматы — гимнастика для мозга. В игре нужно постоянно думать наперёд — это умение бесценно в жизни. К тому же обдумывание ходов и игровой процесс дают возможность прокачивать мозг и становиться лучше.
— Последний вопрос к тебе, как любителю книг: что думаешь о нейросетях, которые сами пишут литературные произведения?
— С одной стороны, они меня пугают. Я привык читать произведения, написанные человеком, а не машиной. Да и сами NLP-алгоритмы ещё не так развиты, как, например, компьютерное зрение и автопилоты.
Но есть и другие примеры: у Илона Маска в первой половине 2021 года вышла новая нейросеть, которая научилась составлять текст и общаться с людьми. Учёным было сложно определить, что с ними разговаривает машина, а не живой человек. Так что вполне возможно, что скоро NLP-алгоритмы станут гораздо популярнее и масштабнее. И это явление очень интересно исследовать.