
Наталья
Галанова
Аналитик данных компании 2GIS
Хочешь находить неочевидные взаимосвязи? Тогда тебе к нам! Профессионалами НГУ и компании 2GIS научат тебя анализировать данные, проверять статистические гипотезы и строить модели линейной регрессии. В конце курса ты выполнишь исследовательский проект на реальных данных компании 2GIS.
Этот курс часть профессии «Анализ данных» от НГУ.
• НГУ входит в 24 международные коллаборации, 19 из них в области физики элементарных частиц и астрофизики.
• Университет реализует модель «образование через исследования»: 80% преподавателей НГУ действующие учёные, поэтому студенты с младших курсов работают над реальными исследовательскими проектами.
• Выпускники НГУ работают в ведущих зарубежных университетах и научно-исследовательских центрах.
• НГУ центр экосистемы новосибирского Академгородка, где в шаговой доступности находятся один из самых высокоэффективных в России технопарков и 35 исследовательских организаций.
Мы научим тебя находить и анализировать взаимосвязи в данных, считать корреляции и строить модели линейной регрессии, покажем, как это работает, на простых и понятных примерах, дадим алгоритмы решения таких задач в SPSS и R.
Ты выполнишь исследовательский проект на данных, которые аналитики компании 2GIS используют в своей работе.
Мы дадим тебе практические инструменты поиска и анализа взаимосвязей в данных, научим анализировать таблицы, считать корреляции и строить регрессии. Затем покажем, как это работает, на реальных данных компании 2GIS, и поможем тебе сделать свой собственный исследовательский проект.
Ты освоишь конкретные технологии и инструменты анализа взаимосвязей и прогнозирования, которые многократно проверили на практике профессионалы компании 2GIS, и сразу применишь их на практике на реальных данных.
Курс состоит из 4 модулей, каждый из которых посвящен отдельному классу задач: критериям согласия, способам проверки статистических гипотез, поиску взаимосвязей в данных, построению модели линейной регрессии. Каждый модуль завершается практическими видео решения задач в SPSS и R.В конце каждого модуля и в конце курса вас ждет итоговый тест; также вы выполните практический проект на данных компании 2GIS.
В этом модуле мы поговорим о логике проверки статистических гипотез. Вы узнаете, чем статистическая гипотеза отличается от "обычного предположения", какие бывают статистические гипотезы, и какие статистические критерии разработаны для их проверки. В результате вы научитесь формулировать статистические гипотезы для решения исследовательских задач, а также выбирать подходящие критерии для их проверки. Этот модуль создаёт основу для следующих модулей курса, в которых на примерах рассматривается применение разных статистических критериев.
В этом модуле мы разберем один из классов статистических критериев, которые позволяют проверять соответствие распределения признаков известным законам распределения. Форма распределения - не менее важное ограничение для применения статистических методов, чем тип шкалы, в которой измерен признак, и если не учитывать связанные с ней ограничения, можно сделать некорректные статистические выводы. Многие меры и методы работают только в том случае, если признак распределен в соответствии с известным законом (к примеру, имеет нормальное распределение). Пройдя этот модуль, вы научитесь определять такие соответствия.
В этом модуле мы поговорим о способах выявления статистических взаимосвязей. Рассмотрим методы, применимые для выявления взаимосвязей признаков в зависимости от шкалы измерения и формы распределения признака, научимся определять силу и значимость связей между признаками. Применение основных методов оценки взаимосвязей мы разберем на реальных данных; к примеру, проверим, что важнее для того, чтобы человек был удовлетворён жизнью: материальное благополучие или уважение окружающих. Кроме того, мы покажем, как рассчитывать основные коэффициенты связи в R и SPSS.
В заключительном модуле курса мы поговорим о модели линейной регрессии, которая позволяет не только делать вывод о связи между признаками, но и строить прогноз, т.е., рассчитать значение одного (зависимого) признака, зная значения других, определяющих его. Мы начнём с общей идеи модели, поговорим о возможностях и ограничениях инструмента, затем на примере пошагово разберём, как построить модель линейной регрессии, как оценить её качество, и как строить прогноз на основе построенной модели. Базовый пример модуля - модель, построенная на реальных данных, предоставленных компанией 2GIS.
Наш специалист свяжется с вами и ответит на любые ваши вопросы
Наш менеджер свяжется с вами
в ближайшее время
Сумма первых 5 платежей поступит на Ваш счет, с которого будет списываться плата за обучение.
Ваши собственные средства начинают списываться только с 6 месяца обучения