Образовательный курс

Профессия Data Scientist:
анализ данных

Станьте специалистом по анализу данных: используйте продвинутые методы и инструменты, чтобы автоматизировать рутину, работать быстрее или получить высокооплачиваемую должность.

Первым 20 участникам курса — скидка 20%.

Курс идеально подойдет

Новичкам

Получите структурированные знания и начнете свой путь в профессии аналитика данных. Овладеете технической специальностью, даже если у вас нет глубоких знаний в теории вероятностей и статистике.

Новичкам

Аналитикам

Сможете автоматизировать и ускорить свою работу, строя достоверные прогнозы и подкрепляя свои выводы статистикой. Получите повышение или сможете перевестись на более интересную и высокооплачиваемую должность.

Аналитикам

Менеджерам и бизнесу

Научитесь извлекать из массивов данных информацию для правильных управленческих решений. Автоматизируете рутину, сделаете бизнес-процессы прозрачными, поменяете Excel на продвинутые инструменты анализа.

Менеджерам и бизнесу

Чему вы научитесь

Новые знания и навыки можно будет сразу же применять на практике.

Освоите программирование на Python

это самый популярный язык для работы с данными.

Сможете работать с источниками данных

CSV, XML и XLSX, JSON.

Научитесь визуализировать данных

с помощью библиотеки Matplotlib.

Разберетесь в программировании на R

сможете обрабатывать статические данные и работать с графикой.

Создадите аналитические панели.

разработаете визуальные дашборды с интерактивной инфографикой на фреймворках Shiny и Dash.

Поработаете с СУБД

будете использовать базы данных Vertica, Exasol, ClickHouse.

скидка 20% первым студентам

Программа курса

Программа курса содержит 3 основных блокa.

  1. Аналитика. Начальный уровень

    Введение в Python
    • Причины выбора Anaconda для Python.
    • Установка окружения.
    • Jupyter Notebook: интерфейс, ячейки и разметка текста, формулы, изображения, работа в меню.
    • Python: базовые вычисления, операции с числами.
    • Переменные в Python: создание и изменение, типы значений и переменных, преобразование типов.
    • Работа с коллекциями: списки и кортежи в Python.
    • Условные конструкции и циклы в Python: конструкция if-else, циклы for и while.
    • Работа с коллекциями: словари в Python.
    • Функции в Python.
    • Отладка и дебаг.
    • Классы. 
    Библиотека NumPy
    • Основные идеи NumPy.
    • Ndarray: базовая концепция и операции над массивами.
    • Базовые операции над массивами.
    • Вычисления с массивами.
    • Создание массивов.
    • Условия и булевы массивы.
    • Изменение размерности списков.
    • Изменение списков.
    • Создание новых списков на основе старых.
    • Дополнительные концепции NumPy.
    • Структурированные списки.
    • Чтение/запись списков.
    Библиотека pandas
    • Основные структуры.
    • Индексы и метод .iloc.
    • Индексы и метод .loc.
    • Характеристики датафрейма pandas.
    • Операции над датафреймами.
    • Применение функций и метод .apply ( ).
    • Группировка и агрегирование.
    • Сортировка и упорядочивание.
    • Работа с NaN.
    • Иерархическое индексирование.
    Чтение и запись данных
    • Чтение текстовых и CSV-файлов.
    • Работа с данными формата HTML.
    • Работа с данными формата XML.
    • Работа с данными формата XLSX.
    • JSON.
    • Pickle — сериализация объектов.
    • Работа с данными формата HDF5.
    • Работа с базой данных SQLite3.
    • Работа с базой данных PostgreSQL.
    • Работа с базой данных из pandas.
    • Работа с базой данных MongoDB.
    Введение в SQL
    • Структура БД, запрос DESCRIBE.
    • Выбор и фильтрация данных, запрос SELECT.
    • Функции и выражения, агрегация данных.
    • Отношения и соединение таблиц: JOIN.
    • Группировка.
    • Модификация данных.
    • Подзапросы.
    • Объявление и изменение структуры данных.
    Работа со строками
    • Стандартные приемы работы с текстом.
    • Регулярные выражения Python.
    • Статистики текста.
    Визуализация данных с помощью matplotlib
    • Архитектура Matplotlib.
    • Простой график Matplotlib.
    • Сохранение и дальнейшая работа с графиком.
    • Добавление элементов на график.
    • Простые графики Matplotlib.
    • Сложные графики Matplotlib.
  2. Статистика и теория вероятности

    Основы статистики и теории вероятности
    • Случайные величины.
    • Анализ распределения случайной величины.
    • Корреляционный анализ.
    • Ищем взаимосвязи в данных.
    • Доверительные интервалы.
    • Учимся вычислять доверительные оценки.
    • Аномалии в данных.
    • Ищем аномальные значения.
  3. Аналитика. Средний уровень

    Язык программирования R
    • Установка R и RStudio.
    • Работа с консолью.
    • Знакомство с интерфейсом RStudio.
    • Типы данных.
    • Структуры данных (векторы, списки, датафреймы).
    • Управляющие структуры.
    • Функции.
    • Область видимости.
    • Отладка кода и профилирование.
    • Чтение и запись файлов.
    • Работа с датафреймами в R.
    • Работа с tidyverse (dplyr), группировка и агрегирование данных.
    • Простейшая графика.
    • Основы графики с ggplot2.
    Создание аналитических панелей (Dashboard) — R View
    • Введение во фреймворк Shiny.
    • Обзор возможностей.
    Создание аналитических панелей (Dashboard) — Python View
    • Введение во фреймворк Dash.
    • Обзор возможностей.
    A/B-тестирование
    • А/B-тест как проверка статистической гипотезы.
    • Предсказательный интервал.
    • Доверительный интервал.
    • Математические основы доверительного интервала.
    • Метод bootstrap для вычисления доверительного интервала.
    • Определение объема репрезентативной выборки для А/B-теста.
    • Математика определения объема репрезентативной выборки.
    • Использование статистики для оценивания А/B-тестов.
    • Дополнительные сведения о проверке гипотез.
    • Практические примеры аналитики А/B-теста.
    Анализ временных рядов
    • Понятие временного ряда.
    • Стационарность временного ряда.
    • Тесты на стационарность.
    • Базовые методы прогнозирования.
    • Способы обработки временных рядов.
    • Эконометрический подход.
    Выявление аномалий
    • Постановка задачи детектирования аномалий.
    • Алгоритм LocalOutlierFactor.
    • Алгоритм SVM для детекции аномалий.
    • Алгоритм EllipticEnvelope.
    • Алгоритм изолирующего леса.
    Аналитические СУБД
    • База данных Vertica.
    • База данных Exasol.
    • База данных ClickHouse.

Получите полную программу и индивидуальную консультацию

Преподаватели

Как проходит обучение

Вы выполняете домашние задания и открываете доступ к новому уникальному контенту по теме. Достаточно выделить 3–5 часов в неделю.

  1. Изучаете
    тему

    В курсе — полезные видеоуроки.

    Интерфейс системы обучения
  2. Выполняете домашнее задание

    В том темпе, в котором вам удобно.

    Интерфейс системы обучения
  3. Общаетесь с наставником

    Закрепляете знания и исправляете ошибки.

    Интерфейс системы обучения
  4. Защищаете дипломный проект

    И дополняете им свое портфолио.

    Интерфейс системы обучения

Ваше резюме после обучения

Аделина Ветрова Аделина Ветрова аналитик данных

Ожидаемая зарплата от 80 000

Владение инструментами:
  • Python Язык программирования общего назначения, применяется для работы с данными.

  • Jupyter Notebook Командная оболочка для интерактивных вычислений.

  • NumPy Библиотека с открытым исходным кодом для Python.

  • Pandas Программная библиотека на Python для обработки и анализа данных.

  • SQL Язык программирования для работы с реляционными БД.

  • Matplotlib Библиотека на Python для визуализации данных 2D-графикой.

  • MongoDB Документоориентированная СУБД с открытым исходным кодом, не требует описания схемы таблиц.

  • R Язык программирования для статистической обработки данных и работы с графикой.

  • Shiny Пакет языка R, которые позволяет легко создавать интерактивные веб-приложения.

  • Plotly|Dash Фреймворк для создания аналитических дашбордов.

Ключевые навыки:
  • Python для работы с данными
  • Чтение и запись данных, работа с библиотеками.
  • Визуализация данных на Matplotlib.
  • Написание A/B-тестов.
  • Анализ временных рядов.
  • Выявление аномалий данных.
  • Создание аналитических панелей на R.

Диплом Skillbox

Подтверждает успешное прохождение курса «Профессия Data Scientist: анализ данных»

Профессия Data Scientist: анализ данных

Стоимость обучения

Скидка 20% первым 20

Стоимость обучения 88 500

2 949 Рассрочка без первого взноса

70 800 Для первых 20 студентов

Запишитесь на курс

Дата начала: 17 ноября

Осталось: 15 мест

О Skillbox

Максимально практическое обучение от лидеров digital-рынка. Курсы от компаний, работающих на реальных проектах.

После обучения вы можете трудоустроиться в эти компании или к партнёрам университета.

25 000 +

студентов учатся на наших курсах

82%

студентов довольны преподавателями

89%

выпускников получают карьерный рост

94%

выпускников довольны курсом и результатом

Часто задаваемые вопросы

  1. Я никогда не программировал. У меня получится?

    Курс подходит для людей, не имеющих навыков работы с данными, языками программирования. Наши методики и система поддержки позволят вам научиться всему с нуля.

  2. Какой график обучения? Получится ли совмещать его с работой?

    Вы можете работать с материалами курса в любое удобное время, двигаясь по программе в подходящем вам темпе. Более того, все уроки будут доступны и по окончании курса, навсегда. Так что вы сможете освежить свои знания в любой нужный момент. Весь формат обучения построен таким образом, чтобы вы могли совмещать его с работой, учебой и личной жизнью.

  3. Сколько часов в неделю мне нужно будет уделять учебе?

    Вы сами выбираете нагрузку и скорость, с которой будете проходить курс. Хотите — занимайтесь два часа в неделю, хотите — шесть часов в день. Но в любом случае не забывайте отдыхать.

  4. Я могу общаться с преподавателем?

    Да, у вас будет доступ к закрытому Telegram-чату. Преподаватель будет лично комментировать домашние задания и давать полезные советы. Так вы сможете перенять уникальный опыт, профессиональные знания и лайфхаки от нашего преподавателя.

  5. Действуют ли какие-нибудь программы рассрочки?

    Да, вы можете купить курс в рассрочку — и спланировать свой бюджет, разбив всю сумму на мелкие ежемесячные платежи.

  6. А я точно смогу трудоустроиться?

    Курс дает достаточно знаний, чтобы получить позицию аналитика данных. Конечно, многое будет зависеть и от вас самих.

или получить

Появились вопросы по курсу?

Оставьте ваш номер телефона, и наш специалист свяжется с вами, чтобы дать подробную информацию.