Новая образовательная платформа
Курс НГУ Введение в данные
Введение в анализ данных
Курс

Введение в анализ данных

Хотите сделать первые шаги в анализе данных? Начните вместе с профессионалами НГУ и 2ГИС! На онлайн-курсе вы научитесь решать простые задачи, познакомитесь со средами анализа данных SPSS и R, а в конце — выполните свой первый исследовательский проект.

Курс — часть профессии «Анализ данных» от НГУ.

Курс Новосибирского государственного университета

• НГУ входит в 24 международные коллаборации, 19 из них — в области физики элементарных частиц и астрофизики.
• Университет реализует модель «образование через исследования»: 80% преподавателей НГУ — действующие учёные, поэтому студенты с младших курсов работают над реальными исследовательскими проектами.
• Выпускники НГУ работают в ведущих зарубежных университетах и научно-исследовательских центрах.
• НГУ — центр экосистемы новосибирского Академгородка, где в шаговой доступности находится один из самых высокоэффективных в России технопарков и 35 исследовательских организаций.

Трейлер курса

Превью видеозаписи

Кому подойдёт этот курс

  • Студентам

    На простых примерах научитесь анализировать данные, освоите язык R и работу в среде SPSS. Попрактикуетесь на задачах, которые аналитики «2ГИС» решают каждый день.

  • Новичкам

    Освоите практические инструменты сбора и анализа данных, научитесь строить таблицы и графики на реальных данных от «2ГИС». Выполните свой первый исследовательский проект.

Чему вы научитесь

  • Применять базовые инструменты анализа данных

  • Понимать основы теории вероятностей и математической статистики

  • Ставить исследовательские задачи

  • Визуализировать данные

  • Решать простые задачи в SPSS и R

  • Грамотно формировать выборки

Содержание курса

Каждый модуль посвящён отдельному классу задач и завершается тестом. В конце курса вы пройдёте итоговое тестирование и выполните практический проект на данных компании «2ГИС».

  • 1 месяц обучения
  • 28 видеоматериалов
  1. Модуль 1. Основы теории вероятностей

    Вы вспомните основы теории вероятностей — свойства, случайные величины, основные распределения. После прохождения этого модуля вы поймёте принципы, на которых строится статистический анализ данных.

    • Материалы к курсу
      1. О чём этот курс и как он устроен.
      2. Дополнительные материалы по статистическим пакетам.
      3. Данные, на которые мы опираемся и ссылаемся.
    • Видеолекции модуля 1
      1. Введение в теорию вероятностей.
      2. Свойства вероятности.
      3. Характеристики случайных величин.
      4. Непрерывные распределения. Часть 1.
      5. Непрерывные распределения. Часть 2. Нормальные и логнормальные непрерывные распределения.
      6. Дискретные распределения.
  2. Модуль 2. Основы статистического анализа выборочных данных

    Узнаете об описательных статистиках и о 2 типах характеристик распределений — мерах центральной тенденции и мерах вариативности. Сначала разберётесь с типами данных, а затем рассмотрите основные меры центра и разброса для данных разных типов. Научитесь рассчитывать описательные статистики в SPSS и в R.

      1. Типы данных.
      2. Выборка случайных величин.
      3. Меры центральной тенденции.
      4. Меры вариативности.
      5. Несмещённая дисперсия.
      6. Меры и типы переменных: что и где применимо?
      7. Практика. Описательные статистики в R.
      8. Практика. Описательные статистики в SPSS.
  3. Модуль 3. Графический анализ данных

    Вы узнаете, как по-разному могут выглядеть похожие по характеристикам распределения. Рассмотрите основные виды графиков, научитесь их применять и строить с помощью SPSS и R.

      1. Почему важно визуализировать данные. Квартет Энскомба.
      2. Гистограмма и методы её построения.
      3. Box plot, или «ящик с усами».
      4. Диаграмма рассеяния.
      5. Графики для неметрических шкал.
      6. Практика. Построение графиков в R.
      7. Практика. Построение графиков в SPSS.
  4. Модуль 4. Формирование выборок и подготовка данных

    Научитесь строить выборки, работать с пропущенными и неопределёнными данными. Сможете сформировать массив данных в SPSS так, чтобы сэкономить время на этапе обработки и анализа.

      1. Выборки.
      2. Ошибки выборки.
      3. Определение необходимого объёма выборки.
      4. Работа с пропущенными наблюдениями.
      5. Кодирование неопределённых ответов.
      6. Практика. Формирование массива данных в SPSS.
  5. Модуль 5. Итоговый тест и задание на оценку

      1. Итоговый тест.
      2. Практическое задание.

Авторы курса

Ольга Ечевская
Ольга
Ечевская
Социолог-исследователь, кандидат социологических наук, преподаватель курсов по анализу данных в НГУ
Наталья Галанова
Наталья
Галанова
Аналитик данных компании 2GIS
Виктор Демин
Виктор
Демин
Team lead, аналитик данных компании 2GIS, кандидат технических наук
Иконка для блока Дисклеймер

Курс будет доступен позже

Часто задаваемые вопросы

  • Как пройти курс?
    Для получения сертификата о прохождении курса вам необходимо набрать проходной балл по каждому из обязательных заданий: тесты по итогам каждого модуля, итоговый тест по курсу и практический проект по анализу данных.
    Видео, материалы для самостоятельного изучения, а также тренировочные упражнения помогут вам подготовиться к сдаче оцениваемых заданий.
  • Кто будет мне помогать в обучении на платформе?
    У вас будут проверяющие эксперты и куратор в Telegram-чате курса. Они прокомментируют практические работы, дадут полезные советы и ответят на любые вопросы. Вы сможете перенять их опыт, профессиональные знания и лайфхаки.