
Для анализа был использован датасет «The Ultimate Korean Drama Dataset (1969–2025)» с Kaggle. Автор датасета — Zeynep Esennur. Он объединяет данные из IMDb, MyDramaList и Wikipedia, что делает его наиболее полным и структурированным источником для изучения индустрии корейских дорам.
Датасет содержит более 5000 дорам и включает: названия, рейтинги, возрастные ограничения, описания, длительность серий, даты выхода, жанры, режиссёров, актёрский состав.
Вводная часть
Почему эти данные интересны?
Корейские дорамы — глобальный культурный продукт, формирующий новые тренды в индустрии развлечений, моде, социальных отношениях, представлениях о романтических сценариях и гендерных ролях, а еще я просто люблю их смотреть. Я решила изучить подробнее индустрию с помощью Python, так как такие огромные объёмы данных трудно анализировать без него.
Я задалась некоторыми вопросами перед изучением темы: какие жанры популярнее, какие жанры имеют более высокий рейтинг, кто самые известные актёры/режиссёры, влияет ли длительность серии на оценку, есть ли новые закономерности. Ответы на эти вопросы помогли бы мне в будущем быстрее выбирать дораму, которую я буду смотреть следующей.
Какие графики используются и почему
Я использовала несколько типов визуализаций, так как каждый график раскрывает отдельный аспект данных и вместе даёт целостную картину индустрии. Типы графиков в моей работе: линейные (динамика числа дорам, динамика рейтинга), столбчатые диаграммы (жанры, актёры, режиссёры), сложенные графики (доли жанров по годам), scatter-plot (оценка vs длительность серии), heatmap (корреляции, рейтинг жанров по годам), круговая диаграмма (возрастные рейтинги), облако слов (из названий дорам).
Этапы работы
Я сделала: замену пропущенных значений, приведение типов данных (год выхода, длительность серий), разбиение жанров на списки, создание новых переменных: количество жанров, длина синопсиса, числовой возрастной рейтинг.
Это позволило анализировать данные не только дескриптивно, но и искать связи между признаками.

Загрузка данных
Первичная очистка
Создание новых признаков
Пример обработки для визуализаций
Топ жанров
Топ актёров
Топ режиссёров
Кластеризация данных
Использование нейросетей
В ходе выполнения проекта я активно использовала ChatGPT как инструмент для аналитической и визуальной поддержки на нескольких этапах работы. Нейросеть не заменяла анализ данных, но помогала ускорять процесс, структурировать логику исследования и создавать оформительские элементы.
Объяснения статистических методов: некоторые этапы анализа требовали формального описания статистики. Я использовала ChatGPT, чтобы получить корректные краткие определения и перевести статистические методы в понятный язык презентации.
«Объясни простым языком, что показывает корреляционная матрица, и напиши аналитический комментарий к ней».
Обработка ошибок в коде и подсказки по Python: при работе с Pandas возникали ошибки (невозможность рассчитать среднее из-за строковых значений, проблема с группировкой жанров, невозможность построить wordcloud.
«Помоги исправить ошибку TypeError: Could not convert string to numeric при групповом расчёте среднего».
Создание обложки проекта в стиле корейских дорам: с помощью ChatGPT (DALL-E) я создала художественную обложку, основанную на моих референсах («Vincenzo», «My Name», «S-Line»), но выполненную в собственной цветовой гамме.
«Сгенерируй вертикальный постер 1750×2480 в стиле корейских дорам, без текста, в палитре 3C8C3A / 7DA641 / 0D0000 / D93232. Используй драматическое освещение, позы как на примере…»
Стилизация графиков
Для оформления визуализаций и обложки проекта я использовала палитру из четырёх основных цветов: насыщенно-зелёного, светлого оливкового, глубокого чёрного и драматического красного. Такая палитра была выбрана не случайно — она отражает стилистические и эмоциональные особенности корейских дорам, а также совпадает с эстетикой моих любимых сериалов.
Цветовая палитра
Современные южнокорейские постеры — например, «My Name», «Vincenzo», «S-Line» — активно используют контрастные, глубокие цвета и комбинацию чёрного с яркими акцентами (обычно красными или зелёными). Это создаёт атмосферу напряжения, драмы, романтики или конфликта — того, что часто лежит в основе сюжетов дорам.
Обложки дорам: «My Name», «Vincenzo», «S-Line»
Код для стилизации данных
Статистические методы
Я использовала: описательную статистику, корреляционный анализ (heatmap), кластеризацию KMeans, временные ряды (динамика количества дорам), распределения (пирог по возрастному рейтингу), сравнения групп (средние рейтинги жанров), анализ зависимостей (scatter «длительность vs рейтинг»).
Итоговые графики
График № 1
Круговая диаграмма распределения дорам по возрастному рейтингу
Код для диаграммы «Распределение дорам по возрастному рейтингу»
График показывает, на какую аудиторию ориентирована индустрия дорам. Наибольшая доля приходится на TV-14 и TV-MA, что означает фокус на подростках и взрослых зрителях. Такой перекос говорит о тренде на более сложные сюжеты, морально неоднозначные ситуации, элементы триллера, криминальной драмы и романтические линии, рассчитанные на зрелого зрителя.
Контента для детей (TV-G, TV-Y7) значительно меньше, что отражает специфику рынка: дорамы позиционируются как эмоционально насыщенные истории, затрагивающие темы отношений, взросления, травм, успеха и личностного роста.
График № 2
График «Количество дорам по годам топ-5 жанров»
Код для графика «Количество дорам по годам»
График демонстрирует: стремительный рост после 2005 года — этап глобализации корейской культуры, пик производства — 2018–2021 годы. После 2022 года наблюдается снижение — вероятно, последствия пандемии и изменений в расписаниях телеканалов.
График № 3
Здесь видно, что айдол-шоу и реалити занимают первые места. Они имеют стабильно высокие оценки (9.0+), так как у них большой фанатский сегмент, который активно голосует и поддерживает проекты. Поэтому я решила создать еще один график, который исключает из списка контент айдолов и отображает именно дорамы-сериалы.
1. График «Топ-20 дорам по рейтингу» с шоу-реалити айдолов. 2. График «Топ-20 дорам по рейтингу» только с дорамами
Код для графика «Топ-20 дорам по рейтингу», включая все шоу айдолов
После очистки данных становится очевидно, что настоящие корейские драмы демонстрируют устойчиво высокое качество и занимают уверенные позиции в рейтинге. Топ перестаёт быть фанатским и превращается в реальный рейтинг сильнейших драматических сериалов 2000–2025 годов. На первое место выходят полноценные драматические сериалы, лидируют такие работы, как «When Life Gives You Tangerines», «Reply 1988», «My Mister»» — признанные критикой сильные сериалы с устойчивой репутацией. Топ стал гораздо более разнообразным по тематике: семейные и человеческие драмы, исторические проекты, сверхъестественные или подростковые сюжеты, психологические и социальные истории.


Здесь я исключала из списка шоу-реалити айдолов, чтобы оставить для анализа «Топ-20 по рейтингу» только дорамы
Код для «Топ-20 дорам по рейтингу» без шоу-реалити
График № 4
График «Средний рейтинг по жанрам (топ-10)»
Код для графика «Средний рейтинг по жанрам (топ-10)»
Здесь видно интересное явление: жанры с наивысшим рейтингом — Reality-TV, Documentary, Game-Show, Biography. Это происходит из-за того, что: 1. эти жанры малочисленные, и в них выходят проекты высокого качества. 2. у них меньшая вариативность, поэтому средняя оценка держится высокой. 3. они менее массовые, их часто смотрит целевая аудитория с высоким вовлечением.
А массовые жанры (Drama, Romance, Comedy) имеют большой разброс по качеству, поэтому средняя оценка у них ниже.
График № 5
График «Топ-10 жанров по количеству дорам»
Код для графика «Топ-10 жанров по количеству дорам»
Диаграмма подтверждает, что индустрия в первую очередь производит: Drama, Romance, Comedy. Их сочетание — «romance drama» — является наиболее прибыльной комбинацией для локального рынка и международной аудитории. Большинство успешных дорам объединяют элементы всех трёх жанров.
График № 6
График «Средний рейтинг дорам по годам»
Код для графика «Средний рейтинг дорам по годам»
Анализ на длинной временной дистанции показывает: В 1990-х — сильные колебания (нестабильное производство). После 2005 года — стабилизация индустрии и повышение качества. В 2010–2025 средний рейтинг держится на уровне 7.1–7.4, почти без резких скачков. Это означает, что индустрия стала более профессиональной: стандарты качества выравниваются, а провалы встречаются реже.
График № 7
Корреляционная матрица позволяет понять, как разные характеристики дорам связаны между собой. Значения от −0.3 до +0.3 считаются слабыми корреляциями, поэтому большинство зависимостей здесь слабые, что типично для культурных данных.
График «Корреляционная матрица новых признаков (только дорамы)»
1. Рейтинг. Все связи со значением менее 0.2, то есть рейтинг практически не зависит ни от длительности, ни от количества жанров, ни от года. Это говорит о том, что качество дорамы почти не определяется структурными параметрами. Не важно: сколько жанров она сочетает, длинный ли у неё синопсис, какой возрастной рейтинг и тд. Оценки формируются скорее творческими и сюжетными факторами.
2. Продолжительность серии.
Есть умеренная положительная связь с: votes (0.17) — более длинные эпизоды получают немного больше голосов. age_rating_num (0.37) — чем старше возрастной рейтинг, тем длиннее серии. То есть: более взрослые сериалы («16+», «18+») действительно чаще имеют более длительные серии, т.к в них сложнее темы, больше драматургии.
3. Год выхода.
Связи: сильно коррелирует с age_rating_num (0.69): чем новее дорама, тем чаще у неё более высокий возрастной рейтинг. Слабая корреляция с votes (0.35): новые дорамы более активно оценивают.
Поэтому: в последние годы появляется больше взрослого контента: тематика стала серьёзнее, социальнее, жестче. Новые проекты получают больше оценок — это связано с ростом популярности корейских сериалов в мире и доступностью международных платформ.
4. Длина синопсиса. Самая яркая связь (и единственная сильная отрицательная корреляция): startYear (−0.44) — чем новее дорама, тем короче её синопсис.
Это происходит, потому что платформы (Netflix, TVN, Coupang) часто пишут минималистичные описания, в отличие от старых телесериалов на KBS/MBC, где синопсис был длинным и подробным. Это отражает изменение маркетинговых практик, а не качество контента.
5. Наличие главного героя
Корреляции почти нулевые, этот структурный элемент никак не влияет ни на рейтинг, ни на количество голосов, ни на возрастное ограничение.
Это логично: «второй главный герой» — троп, который может быть и в романтике, и в триллере, и в фантастике, и он сам по себе ничего не определяет.
6. Количество голосов
Наиболее заметные корреляции: age_rating_num (0.40) — взрослые дорамы привлекают больше зрителей, startYear (0.35) — новые дорамы получают больше голосов, runtimeMinutes (0.17) — длинные серии смотрят активнее.
То есть: новые и более «взрослые» сериалы получают больше внимания — это согласуется с трендом последних лет, когда корейские студии начали ориентироваться на глобальную аудиторию Netflix.


Код для графика «Корреляционная матрица новый признаков»
Если короче: рейтинги дорам практически не зависят от формальных параметров — длительности, жанров, года выхода или наличия второго главного героя. Оценка зрителей формируется художественным качеством.
Современные дорамы имеют более высокий возрастной рейтинг, короче синопсис и больше голосов. Возрастной рейтинг — ключевая техническая переменная, связанная и с длительностью серий, и с годом выхода, и с количеством голосов.
График № 8
Облако слов из названий дорам
Код для Облака слов в названиях дорам
Наиболее частотные слова в названиях дорам: Love, Life, Secret, Man, Family, House, Day. Это отражает ориентацию драм на: романтические сюжеты, семейную повестку, личностные драмы, повседневность.
График № 9
График «Топ-10 режиссеров по количеству дорам»
Код для графика «Топ-10 режиссёров по количеству дорам»
Лидируют те режиссеры, кто создаёт TV-Shows и reality-контент. Это объясняется тем, что у них много коротких проектов, которые выходят регулярно и набирают высокие оценки от фанатов.
График № 10
График «Топ-10 актёров по количеству дорам»
Код для графика «Топ-10 актёров по количеству дорам»
Среди актёров-лидеров: Song Seung-heon, Jang Dong-gun, Lee Dong-wook. Это актеры 2–3 поколения (40–55 лет), с долгой карьерой, которые снимались и в старых дорамах 2000-х, и в современных. Это говорит о важности «длинной карьеры» для попадания в топ, а не о мгновенной популярности молодых звёзд.
Выводы исследования
Индустрия корейских дорам активно развивалась последние два десятилетия и достигла максимального производства в 2018–2021 годах. Больше всего контента создаётся в жанрах Drama, Romance и Comedy, однако самые высокие рейтинги получают не они, а документальные и реалити-проекты айдолов, которые отличаются меньшим объёмом и более стабильным качеством. Средний рейтинг дорам держится примерно на уровне 7.3, что говорит о достаточно ровном качестве индустрии.
Жанры хорошо группируются по общей динамике, популярности и типу аудитории: одни активно растут, другие остаются нишевыми. Анализ названий показывает, что дорамы чаще всего обращаются к темам любви, семьи и личных переживаний.
Также видно, что производство дорам сосредоточено вокруг ограниченного числа режиссёров и актёров, которые формируют основные тренды индустрии.