
Наталья
Галанова
Аналитик данных компании 2GIS
Всегда хотел научиться строить максимально точные прогнозы? Что ж, самое время! Мы научим тебя прогнозировать на основе трендов и классификаторов, а еще находить в данных скрытые переменные, анализировать данные в динамике, строить факторы и деревья решений. В конце курса ты выполнишь исследовательский проект на реальных данных компании 2GIS.
• НГУ входит в 24 международные коллаборации, 19 из них в области физики элементарных частиц и астрофизики.
• Университет реализует модель «образование через исследования»: 80% преподавателей НГУ действующие учёные, поэтому студенты с младших курсов работают над реальными исследовательскими проектами.
• Выпускники НГУ работают в ведущих зарубежных университетах и научно-исследовательских центрах.
• НГУ центр экосистемы новосибирского Академгородка, где в шаговой доступности находятся один из самых высокоэффективных в России технопарков и 35 исследовательских организаций.
Мы научим тебя анализировать тренды, проводить факторный анализ, применять классификаторы (деревья решений, логистическую регрессию и другие) и строить прогнозы.
Мы покажем, как это работает, на простых и понятных примерах, и дадим алгоритмы решения таких задач в SPSS и R.
Ты выполнишь исследовательский проект на данных, которые аналитики компании 2GIS используют в своей работе.
Мы дадим тебе практические инструменты анализа трендов, выявления скрытых структур в данных, научим применять алгоритмы классификации для задач прогнозирования и решать прогнозные задачи в SPSS и R. Покажем, как это работает, на реальных данных компании 2GIS, и поможем тебе сделать собственный исследовательский проект.
Ты освоишь конкретные технологии и инструменты прогнозирования на основе анализа трендов и применения классификаторов, научишься выявлять скрытые переменные в данных и анализировать их эффекты.
Мы покажем, как решать такие задачи в SPSS и R, и ты сразу применишь полученные знания на практике, сделав свой проект на реальных данных компании 2GIS.
Курс состоит из 4 модулей, каждый из которых посвящен отдельному классу задач: анализу временных рядов, прогнозу временных рядов, построению факторной модели и методам классификации. Каждый модуль завершается практическими видео решения задач в SPSS и R.В конце каждого модуля и в конце курса вас ждет итоговый тест; также вы выполните практический проект на данных компании 2GIS.
В этом модуле мы начнем разговор о временных рядах. Сначала разберемся с понятием временного ряда, затем поговорим об анализе временных рядов. Рассмотрим такие компоненты временного ряда, как тренд, сезонность и остатки. После этого рассмотрим методы разложения временного ряда на составляющие и поймём, как и зачем выделять описанные компоненты во временных рядах. В заключении поговорим о том, как выявлять выбросы в данных, а также посмотрим на практике, как разложить временной ряд на трендовую составляющую, сезонную компоненту и остатки, используя R.
В этом модуле мы продолжим разговор о временных рядах и научимся не только анализировать, но и прогнозировать их. Сначала рассмотрим авторегрессионную модель (AR) и сезонную авторегрессионную модель (SAR), которые подходят для решения задач прогнозирования, а также модели скользящего среднего (MA-модели), позволяющие сглаживать выбросы и описывать данные. Дальше поговорим о комбинации этих моделей (ARMA и ARIMA). Во второй части модуля мы поговорим об адаптивных моделях, обсудим их основные виды, а также поговорим о следящем контроле как инструменте их мониторинга. В заключении модуля попрактикуемся: построим прогноз временного ряда в R.
В этом модуле поговорим о факторном анализе. Сначала поймем общий принцип: что это за модель, и для решения каких задач она применяется. Дальше разберем методы факторного анализа и научимся строить факторы одним из самых распространенных способов: методом главных компонент. В заключительных лекциях модуля мы поговорим о том, как оценить качество факторной модели, как можно использовать построенные переменные для дальнейшего анализа, а также пошагово разберем построение факторной модели в SPSS.
В завершающем модуле курса мы поговорим о методах классификации. Для начала поставим задачу классификации: для чего применяются классификаторы, какие задачи из реальной жизни они помогают решать. Затем разберем некоторые методы классификации: линейный и Байесовский классификаторы, дерево решений, модель бинарной логистической регрессии и способы оценки её качества. Вы научитесь прогнозировать класс, в который попадёт объект с заданной вероятностью (к примеру, отдаст ли заёмщик кредит, или закончит ли студент курс), а также познакомитесь с тем, как применять методы классификации в R и SPSS на реальных данных.
Наш специалист свяжется с вами и ответит на любые ваши вопросы
Наш менеджер свяжется с вами
в ближайшее время
Сумма первых 5 платежей поступит на Ваш счет, с которого будет списываться плата за обучение.
Ваши собственные средства начинают списываться только с 6 месяца обучения