Курс участвует в новогодней распродаже Скидка 55% до 8 декабря
Язык R для анализа данных
Онлайн-курс
−55% до 8 декабря

Язык R для анализа данных

Вы научитесь обрабатывать большие массивы данных, использовать библиотеки и строить графики. Сможете автоматизировать задачи и прокачаться до нового уровня в аналитике с помощью языка R.

Кому подойдёт этот курс

Чему вы научитесь

  1. Обрабатывать данные базовыми средствами R и с помощью библиотеки tidyverse
  2. Выполнять разведывательный анализ данных в R
  3. Создавать интерактивные графики с помощью библиотеки Plotly
  4. Визуализировать данные с помощью библиотеки ggplot2
  5. Анализировать линейные регрессионные модели и представлять результаты
  6. Создавать интерактивные аналитические панели с помощью библиотеки Shiny

Как проходит обучение

  1. Изучаете тему

    В курсе — практические видеоуроки.

    Изучаете тему
  2. Выполняете задания

    В удобном для вас темпе.

    Выполняете задания
  3. Работаете с наставником

    Закрепляете знания и исправляете ошибки.

    Работаете с наставником
  4. Защищаете дипломную работу

    И дополняете ею своё портфолио.

    Защищаете дипломную работу

Программа

Онлайн-лекции и практические задания с подробным разбором.

  • 17 тематических модулей
  • 72 онлайн-урока

Язык программирования R

      1. Установите R и RStudio — среду для разработки на R — и познакомитесь с её интерфейсом. Узнаете, как создавать файлы R и Rmarkdown, начнёте изучать синтаксис языка и познакомитесь с понятием вектора в R.
      1. Изучите типы данных в R и научитесь преобразовывать данные из одного типа в другой. Разберёте структуры данных в R: векторы, матрицы, датафреймы и списки. Узнаете, как с ними работать.
      1. Научитесь использовать условную конструкцию if-else, проверять условия, работать с циклами и функциями.

Обработка данных. Библиотека tidyverse

      1. Узнаете, как работать с файлами в рабочей папке, читать и записывать файлы форматов csv, txt и Excel.
      1. Научитесь использовать датафреймы и работать с данными с помощью базовых средств R. Узнаете, как выводить описание датафрейма, работать со строками и столбцами.
      1. Познакомитесь с библиотекой tidyverse и её возможностями. Разберёте особенности синтаксиса tidyverse и изучите работу с разными функциями. Узнаете, как группировать и агрегировать данные, выгружать сводную информацию с помощью библиотеки stargazer.
      1. Научитесь трансформировать структуру данных и объединять таблицы.
      1. Научитесь выполнять поиск и подсчёт пропущенных значений и искать в них закономерности. Поймёте, как визуализировать пропущенные значения с помощью библиотек mice и VIM и заполнять пропуски средствами tidyverse.
      1. Изучите шкалы данных: числовую, порядковую и категориальную. Разберёте особенности факторных данных в R и операции с ними. Научитесь работать с категориальными данными с forcats.

Визуализация данных

      1. Научитесь строить простейшие графики базовыми средствами R — гистограмму, диаграмму рассеяния и линейный график. Узнаете, как их настраивать и выгружать в файл.
      1. Узнаете, как строить графики с библиотекой ggplot2. Научитесь работать с одномерными, двумерными и нечисловыми данными и группировать данные на графиках.

Статистический анализ данных в R

      1. Познакомитесь с описательными статистиками в R. Научитесь пользоваться библиотекой psych и искать нетипичные значения. Изучите коэффициенты корреляции Пирсона и Спирмена и поймёте, как их применять. Узнаете о понятии корреляционных матриц, сможете их визуализировать и выгружать в отчёт.
      1. Узнаете, как ставить задачи и выбирать дизайн для A/B-тестирования. Научитесь проводить выборочное оценивание, выявлять проблемы в выборке и вычислять её объём с учётом погрешности и уровня доверия к данным. Сможете рассчитывать и анализировать доверительные интервалы в A/B тестировании.
      1. Научитесь проверять статистические гипотезы с помощью тестов и разберёте возможные ошибки при проверке. Узнаете, как сравнивать доли и средние в A/B-тестировании, и изучите алгоритм запуска A/B-теста.
      1. Научитесь выделять взаимосвязи в количественных и категориальных данных. Изучите простую линейную регрессию. Узнаете, как работать с регрессионной моделью, проверять её качество, выгружать результаты и включать их в отчёт Rmarkdown.

Продвинутая визуализация и представление результатов анализа

      1. Познакомитесь с проектом Plotly, разберёте его возможности, особенности синтаксиса и функции. Научитесь строить интерактивные графики Plotly в 2D и 3D и публиковать результаты на RPubs.
      1. Изучите проект Shiny, его возможности и устройство кода. Установите библиотеку Shiny, научитесь редактировать шаблонное приложение, добавлять на дэшборд меню, строки датафрейма и элементы интерфейса.

Дипломный проект

  1. Вы выгрузите данные из разных файлов, соберёте их в единый датафрейм и обработаете его. Проведёте разведывательный анализ, построите регрессионные модели и графики, а затем представите результаты и интерпретацию в отчёте.

Спасибо!

Ваша заявка успешно отправлена

Преподаватель

Алла Тамбовцева

Алла
Тамбовцева

Преподаватель НИУ ВШЭ

Ведёт курсы по статистике, анализу данных и программированию на языках R и Python.

Курс участвует в новогодней распродаже Скидка 55% до 8 декабря

Стоимость обучения

−55% до 8 декабря
  • Рассрочка на 12 месяцев 1 590 ₽
  • Стоимость
    со скидкой 19 080 ₽
  • Первоначальная
    стоимость 42 400 ₽

Часто задаваемые вопросы