Новая образовательная платформа
Курс НГУ Исследование статистических взаимосвязей
Курс

Исследование статистических взаимосвязей

Исследование статистических взаимосвязей

Хочешь находить неочевидные взаимосвязи? Тогда тебе к нам! Профессионалами НГУ и компании 2GIS научат тебя анализировать данные, проверять статистические гипотезы и строить модели линейной регрессии. В конце курса ты выполнишь исследовательский проект на реальных данных компании 2GIS.

Этот курс — часть профессии «Анализ данных» от НГУ.

Курс Новосибирского государственного университета

• НГУ входит в 24 международные коллаборации, 19 из них — в области физики элементарных частиц и астрофизики.
• Университет реализует модель «образование через исследования»: 80% преподавателей НГУ — действующие учёные, поэтому студенты с младших курсов работают над реальными исследовательскими проектами.
• Выпускники НГУ работают в ведущих зарубежных университетах и научно-исследовательских центрах.
• НГУ — центр экосистемы новосибирского Академгородка, где в шаговой доступности находятся один из самых высокоэффективных в России технопарков и 35 исследовательских организаций.

Трейлер курса

Превью видеозаписи

Кому подойдёт этот курс

  • Студентам

    Мы научим тебя находить и анализировать взаимосвязи в данных, считать корреляции и строить модели линейной регрессии, покажем, как это работает, на простых и понятных примерах, дадим алгоритмы решения таких задач в SPSS и R.
    Ты выполнишь исследовательский проект на данных, которые аналитики компании 2GIS используют в своей работе.

  • Начинающим

    Мы дадим тебе практические инструменты поиска и анализа взаимосвязей в данных, научим анализировать таблицы, считать корреляции и строить регрессии. Затем покажем, как это работает, на реальных данных компании 2GIS, и поможем тебе сделать свой собственный исследовательский проект.

  • Аналитикам данных

    Ты освоишь конкретные технологии и инструменты анализа взаимосвязей и прогнозирования, которые многократно проверили на практике профессионалы компании 2GIS, и сразу применишь их на практике на реальных данных.

Чему вы научитесь

  1. Проверять статистические гипотезы
  2. Находить взаимосвязи в данных
  3. Рассчитывать и анализировать корреляции
  4. Строить модели линейной регрессии
  5. Отличать случайности от закономерностей
  6. Решать задачи поиска взаимосвязей в SPSS и R

Содержание курса

Курс состоит из 4 модулей, каждый из которых посвящен отдельному классу задач: критериям согласия, способам проверки статистических гипотез, поиску взаимосвязей в данных, построению модели линейной регрессии. Каждый модуль завершается практическими видео решения задач в SPSS и R.В конце каждого модуля и в конце курса вас ждет итоговый тест; также вы выполните практический проект на данных компании 2GIS.

  • 34 видеоурока
  • 6 практических видео с разбором решения задач в SPSS и R
  1. Вводные материалы о специализации

  2. Вводная лекция: структура и содержание специализации

  3. Тексты

      1. О чём этот курс и как он устроен
      2. Дополнительные материалы по статистическим пакетам
      3. Данные, на которые мы опираемся и ссылаемся
  4. Материалы курса

  5. Модуль 1. Введение в статистические критерии

    В этом модуле мы поговорим о логике проверки статистических гипотез. Вы узнаете, чем статистическая гипотеза отличается от "обычного предположения", какие бывают статистические гипотезы, и какие статистические критерии разработаны для их проверки. В результате вы научитесь формулировать статистические гипотезы для решения исследовательских задач, а также выбирать подходящие критерии для их проверки. Этот модуль создаёт основу для следующих модулей курса, в которых на примерах рассматривается применение разных статистических критериев.

      1. 1.1. Статистическая гипотеза
      2. 1.2. Статистические критерии
      3. 1.3. Алгоритм проверки статистических гипотез
      4. 1.4. Свойства критериев
      5. 1.5. Метод Монте-Карло
  6. Модуль 2. Критерии согласия

    В этом модуле мы разберем один из классов статистических критериев, которые позволяют проверять соответствие распределения признаков известным законам распределения. Форма распределения - не менее важное ограничение для применения статистических методов, чем тип шкалы, в которой измерен признак, и если не учитывать связанные с ней ограничения, можно сделать некорректные статистические выводы. Многие меры и методы работают только в том случае, если признак распределен в соответствии с известным законом (к примеру, имеет нормальное распределение). Пройдя этот модуль, вы научитесь определять такие соответствия.

      1. 2.1. Гипотеза о согласии
      2. 2.2. Критерий согласия Хи-квадрат
      3. 2.3. Группирование данных
      4. 2.4. Критерий согласия Колмогорова — Смирнова
      5. 2.5. Критерии типа Омега
      6. 2.6. Критерий Шапиро — Уилка
      7. 2.7. Практика 1. Построение критериев согласия в R
      8. 2.8. Практика 2. Построение критериев согласия в SPSS
  7. Модуль 3. Поиск взаимосвязей в данных и оценка их статистической значимости

    В этом модуле мы поговорим о способах выявления статистических взаимосвязей. Рассмотрим методы, применимые для выявления взаимосвязей признаков в зависимости от шкалы измерения и формы распределения признака, научимся определять силу и значимость связей между признаками. Применение основных методов оценки взаимосвязей мы разберем на реальных данных; к примеру, проверим, что важнее для того, чтобы человек был удовлетворён жизнью: материальное благополучие или уважение окружающих. Кроме того, мы покажем, как рассчитывать основные коэффициенты связи в R и SPSS.

      1. 3.1. Понятие статистической взаимосвязи: идея и основные виды
      2. 3.2. Исследование взаимосвязей: разные шкалы — разные инструменты
      3. 3.3. Линейные взаимосвязи между двумя признаками. Коэффициенты корреляции
      4. 3.4. Проверка значимости коэффициентов корреляции
      5. 3.5. Таблицы сопряженности: введение
      6. 3.6. Исследование взаимосвязей при помощи критерия Хи-квадрат
      7. 3.7. Таблицы сопряжённости: исследование силы и характера взаимосвязи
      8. 3.8. Пример исследования взаимосвязей на основе таблиц сопряженности
      9. 3.9. Практика 1. Вычисление коэффициента корреляции в R
      10. 3.10. Практика 2. Исследование взаимосвязей в SPSS: коэффициенты корреляции и таблицы сопряженности
  8. Модуль 4. Линейная регрессия

    В заключительном модуле курса мы поговорим о модели линейной регрессии, которая позволяет не только делать вывод о связи между признаками, но и строить прогноз, т.е., рассчитать значение одного (зависимого) признака, зная значения других, определяющих его. Мы начнём с общей идеи модели, поговорим о возможностях и ограничениях инструмента, затем на примере пошагово разберём, как построить модель линейной регрессии, как оценить её качество, и как строить прогноз на основе построенной модели. Базовый пример модуля - модель, построенная на реальных данных, предоставленных компанией 2GIS.

      1. 4.1. Модель линейной регрессии: основная идея
      2. 4.2. Типы данных
      3. 4.3. Оценки параметров регрессии
      4. 4.4. Оценка качества модели
      5. 4.5. Отбор значимых признаков
      6. 4.6. Мультиколлинеарность
      7. 4.7. Гетероскедастичность
      8. 4.8. Проверка предположений о модели
      9. 4.9. Прогноз
      10. 4.10. Практика 1. Линейная регрессия в R
      11. 4.11. Практика 2. Линейная регрессия в SPSS
  9. Модуль 5. Итоговый тест и оцениваемое задание

      1. Итоговый тест
      2. Практическое задание

Спикеры

Наталья Галанова

Наталья
Галанова

Аналитик данных компании 2GIS

Виктор Демин

Виктор
Демин

Team lead, аналитик данных компании 2GIS, кандидат технических наук

Ольга Ечевская

Ольга
Ечевская

Социолог-исследователь, кандидат социологических наук, преподаватель курсов по анализу данных в НГУ

Стоимость курса

  • Единоразовая оплата:
  • 4 845
  • 5 700
Курс НГУ Исследование статистических взаимосвязей

Шаг 1. Выберите вариант оплаты

Шаг 2. Заполните контактные данные

Похоже, произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

Нажимая на кнопку, я соглашаюсь с публичной офертой и политикой обработки персональных данных

Спасибо!

Ваша заявка успешно отправлена

Часто задаваемые вопросы

  • Как пройти курс?

    Для получения сертификата о прохождении курса вам необходимо набрать проходной балл по каждому из обязательных заданий: тесты по итогам каждого модуля, итоговый тест по курсу и практический проект по анализу данных.
    Видео, материалы для самостоятельного изучения, а также тренировочные упражнения помогут вам подготовиться к сдаче оцениваемых заданий.
  • Кто будет мне помогать в обучении на платформе?

    У вас будут кураторы в Telegram-чате курса. Они прокомментируют практические работы, дадут полезные советы и ответят на любые вопросы. Вы сможете перенять их опыт, профессиональные знания и лайфхаки.