Исходный размер 1140x1600

Покупательское поведение в торговом центре

PROTECT STATUS: not protected

В этом проекте я работаю с датасетом, содержащим информацию о покупательском поведении клиентов торгового центра. Данные представлены в формате CSV и включают демографические характеристики посетителей (пол и возраст), а также показатели годового дохода и уровня потребительской активности, выраженного через индекс трат (Spending Score).

Я выбрала этот датасет из интереса к задаче — исследовать, как социально-демографические факторы связаны с потребительским поведением в офлайн-ритейле. Количественные данные позволяют выявить различия в уровне трат между группами покупателей и проследить зависимости между доходом, возрастом и потребительской активностью. Использование визуализации помогает наглядно сравнить поведенческие паттерны разных групп клиентов и сформулировать выводы, которые могли бы быть полезны для анализа аудитории торгового центра.

Исследовательский вопрос:

Как социально-демографические характеристики клиентов торгового центра (пол, возраст и уровень дохода) связаны с их потребительским поведением?

Подготовка

На начальном этапе проекта была подготовлена рабочая среда в Google Colab, что позволило выполнять код на Python и работать с визуализациями без локальной установки программного обеспечения. Для анализа были подключены основные библиотеки: pandas для загрузки и обработки табличных данных, numpy для численных операций и работы с интервалами, а также matplotlib для построения графиков. Датасет с данными о клиентах торгового центра был загружен в среду Colab и считан в формат DataFrame, после чего названия столбцов были переименованы в более удобный и читаемый вид. Это обеспечило корректную и понятную дальнейшую работу с данными.

0

Перед построением визуализаций был заранее настроен единый визуальный стиль проекта. Для всех графиков был выбран основной цвет #0BB8A1, который используется последовательно во всех типах диаграмм, а также задан дополнительный нейтральный цвет для сетки и вспомогательных элементов. Кроме того, был подключён шрифт SuisseIntl-Regular, чтобы обеспечить единое типографическое оформление. Для улучшения читаемости визуализаций были отключены лишние рамки графиков и добавлена ненавязчивая сетка, что позволило сделать графики более аккуратными и визуально согласованными между собой.

Построение графиков

На первом этапе анализа была построена круговая диаграмма, отражающая распределение суммарного индекса трат между мужчинами и женщинами. Для этого данные были сгруппированы по полу, после чего рассчитана общая сумма показателя Spending Score для каждой группы. Визуализация позволяет наглядно сравнить вклад мужчин и женщин в общий уровень потребительской активности.

Исходный размер 2880x1620

Распределение трат по полу

Для анализа покупательского поведения мужчин был построен столбчатый график, показывающий зависимость среднего уровня трат от годового дохода. Доход был разбит на интервалы, после чего для каждого интервала вычислялось среднее значение Spending Score. Такой подход позволяет оценить, как изменяется потребительская активность мужчин при росте дохода.

Исходный размер 2880x1620

Соотношение дохода и трат у мужчин

Аналогичный анализ был проведён для женской аудитории, однако данные представлены в виде линейного графика. Для этого были рассчитаны средние значения трат по интервалам дохода, а также добавлена линия тренда, отражающая общую направленность зависимости. Визуализация позволяет проследить динамику потребительского поведения женщин в зависимости от уровня дохода.

Исходный размер 2880x1620

Соотношение дохода и трат у женщин

На заключительном этапе был построен точечный график, демонстрирующий связь между возрастом женщин и уровнем их трат. Каждая точка на графике соответствует отдельному клиенту торгового центра. Такой формат визуализации позволяет выявить возможные возрастные паттерны потребления и оценить распределение трат внутри возрастных групп.

Исходный размер 2880x1620

Зависимость трат от возраста у женщин

Выводы

Результаты анализа показывают, что уровень трат распределяется между мужчинами и женщинами неравномерно, а зависимость между доходом и потребительской активностью проявляется по-разному для разных полов. Для мужской аудитории изменение дохода сопровождается изменением среднего уровня трат, тогда как у женщин эта зависимость имеет более выраженный тренд. Анализ возрастного фактора позволяет дополнительно увидеть, что потребительская активность распределена неоднородно и варьируется в разных возрастных группах, что подчёркивает комплексный характер покупательского поведения.

Описание применения генеративной модели

Генеративная модель ChatGPT использовалась в проекте в ограниченном объёме и носила исключительно вспомогательный характер. В отдельных случаях модель применялась для уточнения формулировок, проверки логики отдельных фрагментов кода и улучшения читаемости текстовых описаний.

Основная работа по анализу данных, написанию кода, построению визуализаций и интерпретации результатов выполнялась самостоятельно. Структура исследования и итоговые выводы были сформированы автором проекта, а использование генеративной модели не заменяло самостоятельную аналитическую деятельность.

Покупательское поведение в торговом центре
Проект создан 11.02.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше