Исходный размер 900x1289

Телевизионные тренды в цифрах: аналитический взгляд на индустрию дорам

PROTECT STATUS: not protected

Выбор данных и их источник

Для исследования я выбрала датасет о популярных корейских дорамах, включающий 3550 строк с информацией о названиях сериалов, годах выпуска, рейтингах, жанрах, возрастных рейтингах, синопсисах, а также актерах. Данные были взяты из открытых источников с платформы Kaggle.

Причины выбора

Исследование корейских дорам было выбрано в качестве темы, поскольку они представляют собой не только значимое культурное явление и форму искусства, но и мощную глобальную индустрию с собственными законами развития и тенденциями. Анализ данных позволяет выявить ключевые закономерности в зрительских предпочтениях и общих трендах этого медиарынка:

— зависимость рейтингов и популярности от жанра, актерского состава и студии-производителя — распределение популярности дорам по странам и демографическим группам зрителей — анализ тематик и сюжетных архетипов, наиболее востребованных в разные периоды времени — выявление взаимосвязи между элементами сценария, визуального стиля и успеха у аудитории

Такой анализ может стать основой для принятия стратегических решений в области медиапроизводства, международного дистрибуции контента и маркетингового позиционирования новых проектов.

Выбор типов визуализации

Для эффективного представления данных я выбрала несколько различных типов визуализаций:

  1. «Количество дорам по годам (с 2000 года)» — столбчатая диаграмма, используется для показа динамики выпуска дорам по годам.
  2. «Распределение рейтингов дорам» — гистограмма с KDE, иллюстрирует распределение пользовательских рейтингов.
  3. «Распределение числа голосов» — гистограмма, показывает, как распределена популярность дорам по числу голосов.
  4. «Топ-10 жанров по количеству дорам» — горизонтальная столбчатая диаграмма, отражает самые распространённые жанры.
  5. «Жанры с наивысшим средним рейтингом» — столбчатая диаграмма, сравнивает жанры по среднему рейтингу.
  6. «Рейтинг и число голосов» — диаграмма рассеяния, демонстрирует связь между популярностью и оценкой.
  7. «Распределение дорам по возрастным рейтингам» — столбчатая диаграмма, показывает, на какую аудиторию ориентировано большинство дорам.
  8. «Распределение рейтингов по возрастным рейтингам» — boxplot (ящик с усами), используется для сравнения распределений оценок между возрастными категориями.

Каждый тип визуализации был выбран с учетом характера данных и конкретных аналитических задач.

Этапы работы

Процесс анализа включал последовательную работу с датасетом дорам и состоял из нескольких этапов.

  1. Загрузка и подготовка данных: датасет был загружен с использованием библиотеки pandas; выполнена первичная очистка данных, приведение типов столбцов и отбор релевантных признаков; проведена проверка структуры таблицы, наличия пропусков и аномальных значений.

  2. Предварительный анализ: рассчитаны основные статистические характеристики числовых переменных; проанализированы распределения рейтингов, голосов, годов выпуска и категориальных признаков (жанры, возрастные рейтинги); определены ключевые показатели, представляющие интерес для дальнейшего анализа и визуализации.

  3. Агрегация и трансформация: выполнена группировка данных по годам, жанрам и возрастным рейтингам; рассчитаны средние рейтинги, количества дорам и другие агрегированные метрики; сформированы сводные таблицы и отфильтрованные подвыборки данных для построения графиков.

  4. Визуализация и интерпретация: построены различные типы графиков (гистограммы, столбчатые диаграммы, диаграмма рассеяния и ящик с усами); добавлены подписи осей, заголовки и ограничения по диапазонам значений; на основе визуализаций сделаны выводы о динамике выпуска дорам, популярности жанров и взаимосвязи рейтингов с количеством голосов.

Основными инструментами анализа выступили библиотеки pandas для обработки и агрегации данных, а также matplotlib и seaborn для построения и оформления визуализаций.

Использование нейросетей

В процессе работы я использовала языковую модель gemini от google, нейросеть помогла:

  1. Структурировать код для эффективной обработки данных.
  2. Выбрать оптимальные типы визуализаций для разных аспектов анализа.
  3. Создать словари перевода категорий и цветов
  4. Интерпретировать результаты анализа.

Основные промпты при работе с gemini касались выбора типов визуализаций, их стилизации и эффективного представления результатов.

Стилизация графиков

Для создания профессионального и гармоничного представления данных я разработала единую стилизацию всех визуализаций:

  1. Применила единообразное форматирование заголовков, осей и подписей.
  2. Добавила числовые значения на ключевые элементы графиков.
  3. Использовала сетку для улучшения восприятия данных.
  4. Сохранила единую структуру и оформление для всех визуализаций.

Эти принципы обеспечили целостность и профессиональный вид всех графиков, что облегчает восприятие и анализ представленной информации.

Итоговые графики и их интерпретация

Исходный размер 3552x1751

График «Количество дорам по годам (с 2000 года)» иллюстрирует динамику выпуска дорам во времени. По оси X отложены годы, по оси Y — количество проектов. Видно устойчивое увеличение числа дорам в последние годы. Вывод: индустрия дорам активно растёт и развивается.

Исходный размер 2952x1450

График «Распределение рейтингов дорам» показывает, как распределены пользовательские оценки. Большинство значений сосредоточено в диапазоне выше среднего. Экстремально низкие и высокие рейтинги встречаются редко. Вывод: в целом дорамы получают стабильно положительные оценки.

Исходный размер 2952x1750

График «Топ-10 жанров по количеству дорам» показывает наиболее часто встречающиеся жанры. Лидирующие позиции занимают драма и романтика. Остальные жанры представлены значительно реже. Вывод: индустрия ориентирована на эмоционально насыщенные сюжеты.

Исходный размер 2952x1750

График «Жанры с наивысшим средним рейтингом» сравнивает жанры по качеству на основе оценок зрителей. Некоторые жанры с меньшим количеством проектов имеют более высокий средний рейтинг. Это говорит о высокой удовлетворённости целевой аудитории. Вывод: популярность жанра не всегда равна его качеству.

Исходный размер 2952x1450

График «Распределение числа голосов» иллюстрирует популярность дорам среди зрителей. Основная масса проектов имеет небольшое количество голосов. Лишь немногие дорамы собирают очень большую аудиторию. Вывод: высокая популярность характерна для ограниченного числа хитов.

Исходный размер 2953x1752

График «Рейтинг и число голосов» иллюстрирует связь между популярностью и оценкой. Явной линейной зависимости не наблюдается. Высокое число голосов не гарантирует высокий рейтинг. Вывод: массовость не всегда означает высокое качество.

Исходный размер 2952x1750

График «Распределение дорам по возрастным рейтингам» показывает, для какой аудитории чаще всего выпускаются проекты. Большинство дорам ориентировано на широкую аудиторию. Контент с жёсткими ограничениями встречается реже. Вывод: создатели стремятся охватить максимально широкий круг зрителей.

Исходный размер 2953x1750

График «Распределение рейтингов по возрастным рейтингам» сравнивает оценки между возрастными группами. Распределения рейтингов во всех категориях схожи. Существенных различий между ними не наблюдается. Вывод: возрастной рейтинг слабо влияет на итоговую оценку дорамы.

Основные выводы

Проведенный анализ выявил несколько ключевых закономерностей в мире медиа индустрии дорам:

— Наблюдается устойчивый рост количества выпускаемых дорам по годам, что указывает на активное развитие индустрии и повышение интереса со стороны аудитории. — Большинство дорам получает рейтинги выше среднего, однако высокая популярность, выраженная числом голосов, не всегда сопровождается высокими оценками зрителей. — Жанры драма и романтика доминируют по количеству проектов, при этом некоторые менее распространённые жанры демонстрируют более высокие средние рейтинги. — Возрастной рейтинг дорам слабо влияет на пользовательские оценки, так как распределения рейтингов между категориями во многом схожи. — Анализ связи рейтинга и числа голосов показал отсутствие сильной корреляции, что подчёркивает важность качества контента, а не только его массовости.

Полученные выводы могут быть использованы аналитиками и продюсерами для прогнозирования зрительского интереса, выбора приоритетных жанров и оптимизации стратегии выпуска контента.

Описание применения генеративной модели

В ходе работы над проектом была использована генеративная модель gemini от google. Эта модель применялась для следующих целей:

  1. Оптимизация кода — помощь в структурировании и отладке python-кода для анализа данных.
  2. Выбор методов визуализации — рекомендации по типам графиков, наиболее подходящим для конкретных задач.
  3. Стилизация графиков — советы по созданию цветовой схемы и оформлению визуализаций.
  4. Интерпретация результатов — помощь в формулировке выводов на основе полученных данных.

ссылка на модель

Использование gemini значительно ускорило процесс разработки, позволив сосредоточиться на аналитических аспектах проекта и представлении результатов в наиболее наглядной и информативной форме.

Исходный размер 842x387
Телевизионные тренды в цифрах: аналитический взгляд на индустрию дорам
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше