RateYourMusic — это ресурс, на котором за последний год я провёл огромное количество времени, изучая различные аспекты развития музыкальной культуры человечества. Я искренне считаю его одним из самых ценных интернет-проектов всех времён.
Здесь сосредоточена крупнейшая база музыкальных релизов всех жанров, эпох и народов, а также данные о фильмах, анимации и с недавних пор — компьютерных играх. (Данное исследование фокусируется исключительно на музыкальной и звуковой культуре.)
RateYourMusiспредставляет собой уникальный проект по анализу музыкальных предпочтений. Сайт предлагает: Систему фильтров с беспрецедентной гибкостью: Тип релиза (альбом, EP, сингл и др.) Страна происхождения Год или десятилетие выпуска Жанр и поджанры
Система пользовательских оценок: От 0.5 до 5 звёзд
Комбинация с фильтрами позволяет находить скрытые жемчужины — релизы, высоко оценённые узкими музыкальными сообществами, но малоизвестные широкой аудитории.
В рамках данного проекта я решил пойти еще дальше возможностей сайта и проверить, смогу ли с помощью программирования и навыков анализа данных, полученных на курсе, обнаружить закономерности и статистику, недоступные в стандартном интерфейсе RYM.
Часть 1: Источник данных
К счастью для исследования, на платформе я обнаружил датасет «Top 5000 Albums по версии RateYourMusic» — идеальный материал для анализа.
Характеристики датасета: 5000 лучших альбомов всех времён Официальные данные RYM Структурированный CSV формат Готов к анализу с помощью Pandas
Этот датасет стал отправной точкой для исследования эволюции музыкальных предпочтений, жанровых трендов и статистических закономерностей, которые невозможно увидеть просто просматривая сайт.
Импорт данных и настройка среды.
Для визуализации данных я решил использовать эстетику, которая отражает мои личные интересы и одновременно подчёркивает техничность анализа данных.
Вдохновение пришло из двух источников:
ФИЛЬМ «MATRIX» — цифровая реальность, неоновый зелёный код, техничная эстетика компьютерных систем SERIAL EXPERIMENTS LAIN — экспериментальное аниме 90-х с психоделическими цветами и киберпанковской атмосферой.
Проверил корректность устанвоки данных.
В первом блоке решил выяснить в какие времена года были более 'удачными' и плодовитыми в рамках нашего исследвоания.
В итоге было принято решение сделать 2 графика: 5000 и 100 альбомов. По рузультатам обоих опытов, осень оказалась победителем в двух номинациях :)
Далеe мне стало интересно определить «самаю музыкальную» декаду по количеству релизов за 10 лет.
В особенности меня интересовала сортировка по жанрам, так что я решил узнать 'лучший жанр' по средней оценке.
Далее у нас рейтинг «самой отзывчивой аудитории»: топ‑10 жанров по количеству отзывов. Для честности посчитаои суммарные отзывы по жанру (если жанров несколько в строке — отзыв идёт в каждый из них)
В завершении, решили проанализировать какое ощущение от албома «трогает» больше всего. Оси — это descriptors (ощущения/характеристики), а значение по оси — «отклик аудитории» = rating_count + review_count (суммарно по релизам, где встречается этот descriptor).
Вывод
В результате этого исследования в первую очередь хочется сказать, что работа над ним стала для меня одной из самых необычных и по‑настоящему «живых» практик за всё время обучения на текущий момент. Было ощущение, что появляется некая «суперспособность», недоступная при обычном пользовании сайтом: особенно после долгого периода привычного взаимодействия с RYM стало казаться, будто получилось заглянуть «под текстуру» знакомой реальности и увидеть скрытые закономерности, которые раньше просто не считывались.
Что касается используемых ресурсов, по сути он был один — Perplexity, но с разными моделями. Сначала я пробовал корректировать код с помощью Claude Sonnet 4.5 и Sonar, однако их подсказки редко оказывались действительно полезными. Зато GPT‑5.2 уверенно справлялся с задачами и помогал доводить решения до рабочего и аккуратного вида.
Спасибо за внимание.



