Как кластерный анализ работает в маркетинге — разбираем методы и алгоритмы на примере
Сегментация клиентов — базовая задача маркетолога. Узнайте, как выполнять её быстрее с помощью кластерного анализа.
Кадр: мультсериал «Футурама» / The Curiosity Company / 20th Century Fox Television
Кластерный анализ — это метод анализа, при котором объекты разделяют на группы по важным критериям. Простой пример: в супермаркете продукты расположены по рядам, и каждый подписан — «овощи», «мясо», «крупы». Говядина не попадёт к гречке, потому что это мясо, а не крупа. Деление объектов на группы называется кластеризацией.
Полученные после кластеризации группы (или сегменты) изучают. Допустим, алгоритм анализа выделил несколько групп клиентов. В одну из них попали люди, которые покупают продукт двадцать раз в год, в другую — те, кто покупает его раз в год. Маркетолог может изучить этот кластер и понять, как сделать, чтобы люди из него покупали чаще.
Кластерный анализ полезен везде, где нужно выделять группы клиентов и объектов. Например, банки используют анализ для определения кредитного рейтинга, а страховые компании — чтобы выявлять мошеннические операции.
Чтобы рассказать вам о кластерном анализе, мы перевели статью Improvado — платформы для анализа маркетинговых данных. Из перевода вы узнаете:
- как кластерный анализ используют в маркетинге;
- зачем использовать кластерный анализ, когда есть другие методы;
- как работает кластеризация;
- как использовать метод кластеризации по шагам;
- плюсы и минусы кластерного анализа;
Как кластерный анализ используют в маркетинге
Собирать и хранить много данных о своих клиентах полезно для бизнеса. Но когда вы решите проанализировать эти данные, то поймёте, что невозможно изучать информацию о каждом клиенте отдельно. Наш мозг не в состоянии обрабатывать такое большое количество информации, а ещё это непрактично.
Изучить всю информацию разом тоже нельзя, так как данные сильно различаются от клиента к клиенту. Нужно найти золотую середину между анализом всего и сразу и изучением каждого клиента по отдельности. Поэтому нужно разделить всех клиентов на несколько групп. Так можно будет понять, что нужно разным типам клиентов.
Для этого и нужен кластерный анализ — клиентов сегментируют по одному или нескольким критериям. Если данных о клиентах очень много, для кластерного анализа используют алгоритмы машинного обучения.
Чаще всего кластерный анализ в маркетинге нужен для сегментации клиентов. Но с его помощью кластеризуют и другие объекты — товары, филиалы, объявления.
Вот несколько примеров того, как кластеризацию используют в маркетинге.
Описание поведения клиента. Пользователей можно кластеризовать, основываясь на разных данных:
- как часто и как глубоко они просматривают сайт;
- как часто покупают и на какую сумму;
- какие товары покупают;
- как ведут себя в офлайне.
Описание процесса покупки. Можно кластеризовать клиентов по разным критериям. Например:
- когда купили товар или услугу;
- кто купил продукт — клиент или кто-то для него;
- в каком магазине купили товар.
SEO. Кластерный анализ можно использовать для анализа ключевых слов — разделять их на группы в зависимости от рейтинга, релевантности, сложности и других параметров.
В своей работе вы также можете использовать кластеры:
- чтобы настраивать ретаргетинг и ремаркетинг;
- корректировать рекламные и маркетинговые сообщения;
- персонализировать пользовательский интерфейс;
- персонализировать продукт под потребности клиентов.
Зачем использовать кластерный анализ, когда есть другие методы
Главная задача кластерного анализа — сегментация. Разделить объекты на группы можно и вручную, но кластерный анализ позволяет работать с большим объёмом данных.
В сервисах вроде «Яндекс Метрики» или Google Analytics есть функция ручной сегментации. Там можно выбрать интересующие сегменты трафика и пользователей и проанализировать их.
Но у этих инструментов есть ограничения. С ними удобно работать, если пользовательских данных мало. А когда их много, становится тяжело обработать всю информацию — например, удержать в голове данные одновременно о множестве сегментов, составленных по сотням параметров.
Тогда на помощь приходит кластерный анализ. Автоматизированные системы для работы с данными могут сами провести его, вам останется только оценить сегменты. Такие системы высвобождают ресурсы и могут использовать больше параметров для анализа, чем человек.
Как работает кластеризация
Кластеризация считается неконтролируемой методикой машинного обучения, потому что при ней мы не задаём, какой результат ожидаем получить. С помощью машинного обучения данные сами должны проявить естественные структуры внутри них. Звучит сложно, но станет понятно на простом примере.
Предположим, что вы управляете компанией по производству футболок. Вы планируете подгонять футболки по фигуре своих клиентов. У вас есть данные некоторых клиентов: их рост и вес. Вы можете построить график, где по одной оси будет рост, по другой — вес, и расположить клиентов на этом графике в виде точек.
На основе этих расчётов алгоритм выявляет схожесть точек. Чем меньше расстояние между парой точек, тем больше они похожи. Чем больше расстояние, тем сильнее они различаются. В результате получаются группы, точки в которых находятся близко к друг другу. Группа — это кластер. В кластере находятся клиенты с похожим ростом и весом. Алгоритм окрашивает кластеры в разные цвета, чтобы было понятно, к какой группе относится покупатель.
Если вы используете всего две переменные — такие как рост и вес, то кластерный анализ кажется простым и интуитивно понятным. Если начать добавлять переменные, всё станет сложнее. Тогда можно использовать алгоритм k-средних.
Алгоритм k-средних — метод кластеризации, который позволяет разбивать данные на группы, похожие по пяти, десяти и более признакам. Его идея в том, что кластеризация выполняется не за один раз.
Если простыми словами, то алгоритм работает так. Ему задают, сколько нужно выделить кластеров, и он делает множество подходов (итераций), чтобы найти их. Во время первой итерации он находит две удалённые друг от друга точки и формирует кластеры вокруг них. Во время следующих берёт другие точки и строит новые кластеры. Так он ищет группы точек с наиболее близкими средними значениями. Алгоритм завершается, когда при очередной итерации кластеры не изменяются.
Какая роль у маркетолога в этом процессе? Маркетолог задаёт переменные — показатели, по которым формируют кластеры. Например, это могут быть не «рост» и «вес», а «доход клиента», «возраст», «стоимость покупки» и другие. Также маркетолог описывает кластеры, созданные алгоритмом, и определяет, можно ли использовать полученные результаты.
Маркетолог может экспериментировать: добавлять или удалять переменные и повторно запускать алгоритм. Это позволяет проверить, создаёт ли алгоритм более осмысленные кластеры.
Как использовать метод кластеризации: рассказываем пошагово
Вот что нужно сделать, чтобы провести кластерный анализ.
- Подготовить данные. Вы должны убедиться, что у вас есть все необходимые сведения. Это должны быть детализированные данные по каждому клиенту или продукту. Агрегированные данные не подойдут.
- Перевести данные в цифры. Это нужно, чтобы можно было посчитать расстояние между «точками» — объектами, которые нужно кластеризовать. Например, если один из параметров — город, можно присвоить Москве код 402, Санкт-Петербургу — 403 и так далее.
- Объединить данные в хранилище. Это нужно скорее для удобства. Например, можно собрать данные в BigQuery от Google.
Возможно, вам также понадобится преобразовать данные, если они выражены в разных единицах измерения. Например, можно стандартизировать все значения так, чтобы они находились в диапазоне от 0 до 1.
Когда данные обработаны, можно использовать алгоритм. Есть несколько способов кластеризации:
- использовать программный метод — например, если в команде есть специалисты по анализу данных, они могут применять для кластерного анализа языки R или Python;
- обратиться к аналитическим сервисам вроде Tableau — в них есть встроенные инструменты для кластеризации;
- работать с хранилищами данных — например, в BigQuery можно визуализировать результаты, если вы знаете синтаксис языка SQL;
- использовать Excel и считать всё вручную, но это подходит только для небольшого числа объектов — например, если нужно разнести семь объектов с двумя параметрами на две группы.
На изображении ниже видно, как результат кластерного анализа может выглядеть на практике. Это пример из сервиса Tableau, в котором есть функция кластеризации. Большое количество продуктов сгруппированы в три отдельных кластера по цене и рентабельности.
В алгоритм кластеризации можно включить гораздо больше переменных. Но даже при использовании только двух переменных результат анализа может быть действительно информативным. Например, если вы отвечаете за маркетинг и стратегию, вы можете на его основе определить, какие продукты стоит продвигать в первую очередь, а от каких лучше отказаться.
Плюсы и минусы кластерного анализа
Кластерный анализ — не идеальное решение для всех. Вот плюсы и минусы, о которых стоит помнить.
Плюсы:
- данные просто визуализировать и интерпретировать;
- анализ легко масштабировать на миллионы записей;
- система динамичная — если изменить данные, то кластеры тоже изменятся.
Минусы:
- разные выполнения алгоритмов могут давать разные результаты;
- при использовании алгоритма k-средних маркетолог должен заранее определить, сколько кластеров должно быть;
- перед применением кластерного анализа нужно подготовить данные.
Главное о кластерном анализе
- Кластеризация подходит для деятельности, при которой важно разделять данные на группы.
- Если данных мало, кластерный анализ не нужен — можно использовать «Яндекс Метрику» или другие простые аналитические инструменты. Кластерный анализ подходит, когда данных много.
- Кластеризация данных происходит с помощью алгоритмов. Они разделяют все объекты на группы на основе расстояния между «точками».
- Для кластеризации важно подготовить детализированные данные и собрать их в одном месте.
- Кластерный анализ хорош тем, что с его помощью можно легко анализировать большой объём данных и визуализировать их.
Как узнать больше об анализе данных в маркетинге
- Если хотите разобраться в веб-аналитике, прочитайте обзор сервиса «Яндекс Метрика» и гайд по Google Analytics 4. Это самые популярные инструменты веб-аналитики в России. Из материалов Skillbox Media вы узнаете, какие функции в них есть и как с ними работать.
- Для анализа также пригодится Excel — в нём можно проводить расчёты, строить диаграммы, сравнивать показатели. Прочитайте статьи о ВПР, базах данных и сортировке. А чтобы научиться большему, используйте нашу подборку бесплатных уроков.
- Чтобы понять, насколько эффективно работает маркетинг, или отследить путь каждого клиента, нужно объединить большой объём данных из разных источников. В этом могут помочь сервисы сквозной аналитики. В Skillbox Media есть статья о сквозной аналитике — из неё вы узнаете, как работает и чем полезна технология.
- Один из самых простых и интуитивно понятных инструментов для аналитики — «Яндекс Метрика». Это бесплатный многофункциональный сервис, который позволяет отслеживать поведение посетителей сайта. Рассказали в статье, как начать им пользоваться — установить и настроить.
- Если у вас сложная система, например онлайн-магазин с несколькими источниками трафика, вам нужна сквозная аналитика. Подробно о том, как она работает и для чего её используют, говорим в этом материале.
- Кластерный анализ — не единственный маркетинговый метод. Освоить другие методы анализа и научиться правильно интерпретировать данные можно на курсе Skillbox «Профессия Маркетолог-аналитик». На нём учат автоматизировать рутинные процессы, использовать Python, SQL и Google BigQuery.
- Аналитика нужна везде — в компаниях работают финансовые, системные, бизнес-аналитики и другие специалисты. Стартовать в профессии можно с курса Skillbox «Аналитик данных с нуля». На нём учат структурировать, обрабатывать и анализировать данные с помощью BI-систем, языков Python и SQL. С этими навыками можно устроиться в штат, а потом — выбрать узкую специализацию в аналитике.
Другие статьи Skillbox Media о маркетинге и аналитике
- Ценностное предложение, или value proposition: изучаем модель на примерах Airbnb и Slack
- Введение в конкурентный анализ: изучаем конкурентов за 11 шагов на примере Nintendo и Sony
- Главное о бизнес‑аналитике: как она работает и чем поможет компании
- Что такое веб-аналитика и зачем она нужна
- Автоворонки продаж: что это такое, в каких каналах их создают и как запустить свою