Образовательная платформа

Скидка 30% до 31 июля

Курс

Язык R для анализа данных

Язык R для анализа данных

Вы научитесь обрабатывать большие массивы данных, использовать библиотеки и строить графики. Сможете автоматизировать задачи и прокачаться до нового уровня в аналитике с помощью языка R.

Кому подойдёт этот курс

Чему вы научитесь

  1. Обрабатывать данные базовыми средствами R и с помощью библиотеки tidyverse
  2. Выполнять разведывательный анализ данных в R
  3. Создавать интерактивные графики с помощью библиотеки Plotly
  4. Визуализировать данные с помощью библиотеки ggplot2
  5. Анализировать линейные регрессионные модели и представлять результаты
  6. Создавать интерактивные аналитические панели с помощью библиотеки Shiny

Как проходит обучение

  1. Изучаете тему

    В курсе — практические видеоуроки.

    Изучаете тему
  2. Выполняете задания

    В удобном для вас темпе.

    Выполняете задания
  3. Работаете с преподавателем

    Закрепляете знания и исправляете ошибки.

    Работаете с преподавателем
  4. Защищаете дипломную работу

    И дополняете ею своё портфолио.

    Защищаете дипломную работу

Программа

Онлайн-лекции и практические задания с подробным разбором.

  • 17 тематических модулей
  • 72 онлайн-урока

Язык программирования R

  1. Знакомство с языком R и базовые операции

    Установите R и RStudio — среду для разработки на R — и познакомитесь с её интерфейсом. Узнаете, как создавать файлы R и Rmarkdown, начнёте изучать синтаксис языка и познакомитесь с понятием вектора в R.

  2. Типы и структуры данных

    Изучите типы данных в R и научитесь преобразовывать данные из одного типа в другой. Разберёте структуры данных в R: векторы, матрицы, датафреймы и списки. Узнаете, как с ними работать.

  3. Управляющие конструкции

    Научитесь использовать условную конструкцию if-else, проверять условия, работать с циклами и функциями.

Обработка данных. Библиотека tidyverse

  1. Чтение и запись файлов в R

    Узнаете, как работать с файлами в рабочей папке, читать и записывать файлы форматов csv, txt и Excel.

  2. Обработка данных базовыми средствами R

    Научитесь использовать датафреймы и работать с данными с помощью базовых средств R. Узнаете, как выводить описание датафрейма, работать со строками и столбцами.

  3. Обработка данных с библиотекой tidyverse: часть 1

    Познакомитесь с библиотекой tidyverse и её возможностями. Разберёте особенности синтаксиса tidyverse и изучите работу с разными функциями. Узнаете, как группировать и агрегировать данные, выгружать сводную информацию с помощью библиотеки stargazer.

  4. Обработка данных с библиотекой tidyverse: часть 2

    Научитесь трансформировать структуру данных и объединять таблицы.

  5. Работа с пропущенными значениями в R

    Научитесь выполнять поиск и подсчёт пропущенных значений и искать в них закономерности. Поймёте, как визуализировать пропущенные значения с помощью библиотек mice и VIM и заполнять пропуски средствами tidyverse.

  6. Работа с порядковыми и категориальными данными в R

    Изучите шкалы данных: числовую, порядковую и категориальную. Разберёте особенности факторных данных в R и операции с ними. Научитесь работать с категориальными данными с forcats.

Визуализация данных

  1. Визуализация данных в R

    Научитесь строить простейшие графики базовыми средствами R — гистограмму, диаграмму рассеяния и линейный график. Узнаете, как их настраивать и выгружать в файл.

  2. Визуализация данных с библиотекой ggplot2

    Узнаете, как строить графики с библиотекой ggplot2. Научитесь работать с одномерными, двумерными и нечисловыми данными и группировать данные на графиках.

Статистический анализ данных в R

  1. Разведывательный анализ данных в R

    Познакомитесь с описательными статистиками в R. Научитесь пользоваться библиотекой psych и искать нетипичные значения. Изучите коэффициенты корреляции Пирсона и Спирмена и поймёте, как их применять. Узнаете о понятии корреляционных матриц, сможете их визуализировать и выгружать в отчёт.

  2. A/B-тесты: выборочное оценивание

    Узнаете, как ставить задачи и выбирать дизайн для A/B-тестирования. Научитесь проводить выборочное оценивание, выявлять проблемы в выборке и вычислять её объём с учётом погрешности и уровня доверия к данным. Сможете рассчитывать и анализировать доверительные интервалы в A/B тестировании.

  3. A/B-тесты: проверка статистических гипотез

    Научитесь проверять статистические гипотезы с помощью тестов и разберёте возможные ошибки при проверке. Узнаете, как сравнивать доли и средние в A/B-тестировании, и изучите алгоритм запуска A/B-теста.

  4. Поиск взаимосвязей в данных в R

    Научитесь выделять взаимосвязи в количественных и категориальных данных. Изучите простую линейную регрессию. Узнаете, как работать с регрессионной моделью, проверять её качество, выгружать результаты и включать их в отчёт Rmarkdown.

Продвинутая визуализация и представление результатов анализа

  1. Интерактивные графики с библиотекой Plotly

    Познакомитесь с проектом Plotly, разберёте его возможности, особенности синтаксиса и функции. Научитесь строить интерактивные графики Plotly в 2D и 3D и публиковать результаты на RPubs.

  2. Аналитические панели в R: фреймворк Shiny

    Изучите проект Shiny, его возможности и устройство кода. Установите библиотеку Shiny, научитесь редактировать шаблонное приложение, добавлять на дэшборд меню, строки датафрейма и элементы интерфейса.

Дипломный проект

  1. Обработка и анализ социально-экономических данных

    Вы выгрузите данные из разных файлов, соберёте их в единый датафрейм и обработаете его. Проведёте разведывательный анализ, построите регрессионные модели и графики, а затем представите результаты и интерпретацию в отчёте.

Спасибо!

Ваша заявка успешно отправлена

Преподаватель

Алла Тамбовцева

Алла
Тамбовцева

Преподаватель НИУ ВШЭ

Ведёт курсы по статистике, анализу данных и программированию на языках R и Python.

  • Старт курса: 1 августа
  • Осталось: 15 мест

Стоимость обучения

Рассрочка на 12 месяцев

  • 2 858 ₽/мес
  • 34 300 ₽
  • 49 000 ₽

Скидка 30% до 31 июля

Часто задаваемые вопросы