Новая образовательная платформа
Курс НГУ Введение в данные
Курс

Введение в данные

Введение в данные

Хочешь сделать первые шаги в анализе данных? Сделай их вместе с профессионалами НГУ и компании 2GIS! На нашем онлайн-курсе ты научишься решать простые задачи, познакомишься со средами анализа данных SPSS и R и выполнишь свой первый исследовательский проект.

Этот курс — часть профессии «Анализ данных» от НГУ.

Курс Новосибирского государственного университета

• НГУ входит в 24 международные коллаборации, 19 из них — в области физики элементарных частиц и астрофизики.
• Университет реализует модель «образование через исследования»: 80% преподавателей НГУ — действующие учёные, поэтому студенты с младших курсов работают над реальными исследовательскими проектами.
• Выпускники НГУ работают в ведущих зарубежных университетах и научно-исследовательских центрах.
• НГУ — центр экосистемы новосибирского Академгородка, где в шаговой доступности находятся один из самых высокоэффективных в России технопарков и 35 исследовательских организаций.

Кому подойдёт этот курс

  • Студентам

    Мы научим тебя базовым навыкам анализа данных, покажем, как это работает, на простых и понятных примерах, дадим пошаговые алгоритмы решения простых задач в популярных средах SPSS и R. Ты попробуешь себя в решении задач, которые аналитики компании 2GIS решают каждый день.

  • Новичкам

    Мы дадим тебе практические инструменты сбора и анализа данных, научим строить таблицы и графики, расскажем и покажем, как это работает, на реальных данных компании 2GIS и поможем сделать свой первый исследовательский проект.

  • Аналитикам данных

    Ты освоишь конкретные технологии и инструменты, которые проверили на практике профессионалы из международной компании 2GIS, и попрактикуешься в их применении. Преподаватели имеют большой опыт анализа данных и принятия управленческих решений на их основе, и с удовольствием поделятся им с тобой.

Трейлер курса

Превью видеозаписи

Чему вы научитесь

  1. Применять базовые инструменты анализа данных
  2. Понимать основы теории вероятностей и математической статистики
  3. Ставить исследовательские задачи
  4. Визуализировать данные
  5. Решать простые задачи в SPSS и R
  6. Грамотно формировать выборки

Содержание курса

Курс состоит из 4 модулей, каждый из которых посвящен отдельному классу задач: основам теории вероятностей, описанию распределений, визуализации данных, формированию выборок. В конце каждого модуля и в конце курса тебя ждет итоговый тест. Кроме того, ты познакомишься с работой в популярных средах анализа данных SPSS и R и выполнишь практический проект на данных компании 2GIS

  • 28 видеоуроков
  • 4 практических видео с разбором решения задач
  1. Модуль 1. Основы теории вероятностей

    В первом модуле курса мы вспомним основы теории вероятностей. Мы поговорим о вероятности и её свойствах, о случайных величинах и их характеристиках, а также об основных распределениях случайных величин и их ключевых свойствах. Этот модуль формирует основы для понимания принципов, на которых строится статистический анализ данных.

    • Материалы к курсу
      1. О чем этот курс и как он устроен
      2. Дополнительные материалы по статистическим пакетам
      3. Данные, на которые мы опираемся и ссылаемся
    • Видеолекции модуля 1.
      1. 1.1. Введение в теорию вероятностей
      2. 1.2. Свойства вероятности
      3. 1.3. Характеристики случайных величин
      4. 1.4. Непрерывные распределения. Часть 1
      5. 1.5. Нормальные и логнормальные непрерывные распределения
      6. 1.6. Дискретные распределения
  2. Модуль 2. Основы статистического анализа выборочных данных

    В этом модуле мы поговорим об описательных статистиках и о двух типа характеристик распределений: меры центральной тенденции (или просто меры центра: что типично для исследуемого распределения) и меры вариативности (или меры разброса: насколько разнообразны значения признака, распределение которого исследуется). Для начала мы разберемся с типами данных, немного поговорим о выборках, и затем рассмотрим основные меры центра и разброса, применимые для данных разных типов. В завершении модуля мы посмотрим, как рассчитываются описательные статистики в SPSS и в R.

      1. 2.1. Типы данных
      2. 2.2. Выборка случайных величин
      3. 2.3. Меры центральной тенденции
      4. 2.4. Меры вариативности
      5. Материал к лекции 2.4. (текст) Обзор способов расчета процентилей и межквартильного размаха
      6. 2.5. Несмещенная дисперсия
      7. 2.6. Меры и типы переменных: что и где применимо?
      8. Практика 1. Описательные статистики в R
      9. Практика 2. Описательные статистики в SPSS
  3. Модуль 3. Графический анализ данных

    В этом модуле мы займемся графическим анализом данных. Сначала мы увидим, как по-разному могут выглядеть распределения, обладающие похожими характеристиками. Затем рассмотрим основные виды графиков, поймём области их применения и основные ограничения для каждого графического инструмента. В практической части курса мы научимся строить графики в SPSS и в R.

      1. 3.1. Почему важно визуализировать данные. Квартет Энскомба.
      2. 3.2. Гистограмма и методы её построения
      3. 3.3. Box plot, или ящик с усами
      4. 3.4. Диаграмма рассеяния
      5. 3.5. Графики для неметрических шкал
      6. Практика 1. Построение графиков в R
      7. Практика 2. Построение графиков в SPSS
  4. Модуль 4. Формирование выборок и подготовка данных

    В этом модуле мы поговорим о том, как строить выборки, а также научимся работать с пропущенными и неопределенными данными. Мы рассмотрим основные виды выборок, научимся рассчитывать необходимый объем выборки и ошибку выборки, а также разберём, как кодировать пропущенные и неопределённые данные и что делать с ними дальше. В практической части модуля мы научимся формировать массив данных в SPSS так, чтобы сэкономить время на этапе обработки и анализа данных.

      1. 4.1. Выборки
      2. 4.2. Ошибки выборки
      3. 4.3. Определение необходимого объема выборки
      4. 4.4. Работа с пропущенными наблюдениями
      5. 4.5. Кодирование неопределённых ответов
      6. 4.6. Формирование массива данных в SPSS. Практика
  5. Модуль 5. Итоговый тест и оцениваемое задание

      1. Итоговый тест
      2. Практическое задание
  6. Дополнительный материал: данные для выполнения задания

Авторы курса

Наталья Галанова

Наталья
Галанова

Аналитик данных компании 2GIS

Виктор Демин

Виктор
Демин

Team lead, аналитик данных компании 2GIS, кандидат технических наук

Ольга Ечевская

Ольга
Ечевская

Социолог-исследователь, кандидат социологических наук, преподаватель курсов по анализу данных в НГУ

Стоимость курса

  • Единоразовая оплата:
  • 4 845
  • 5 700
Курс НГУ Введение в данные

Шаг 1. Выберите вариант оплаты

Шаг 2. Заполните контактные данные

Похоже, произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

Нажимая на кнопку, я соглашаюсь с публичной офертой и политикой обработки персональных данных

Спасибо!

Ваша заявка успешно отправлена

Часто задаваемые вопросы

  • Как пройти курс?

    Для получения сертификата о прохождении курса вам необходимо набрать проходной балл по каждому из обязательных заданий: тесты по итогам каждого модуля, итоговый тест по курсу и практический проект по анализу данных.
    Видео, материалы для самостоятельного изучения, а также тренировочные упражнения помогут вам подготовиться к сдаче оцениваемых заданий.
  • Кто будет мне помогать в обучении на платформе?

    У вас будут кураторы в Telegram-чате курса. Они прокомментируют практические работы, дадут полезные советы и ответят на любые вопросы. Вы сможете перенять их опыт, профессиональные знания и лайфхаки.