Original size 888x1184

Анализ данных рейтинга фильмов IMDB

PROTECT STATUS: not protected
9

ВЫБОР ДАННЫХ

Для проведения анализа мною были выбраны данные о фильмах, где указаны названия, рейтинг, жанр и прочие привычные нам сведения из кинематографа.Представленная таблица заинтересовала меня по некоторой причине: На данный период обучения у меня присутствует история VFX, на этой истории мы смотрим различные фрагменты фильмов, поэтому интерес к такому виду искусства у меня значительно вырос.

Мне показалось интересным проанализировать топ-1000 фильмов, отсортировав их по ключевым значениям.

АНАЛИЗ ДАННЫХ

Выбранный датасет я нашла на платформе kaggle.com

Использованные графики:

1. Столбчатая диаграмма 2. Диаграмма рассеяния

Для начала мы скачаем все необходимые библиотеки и проверим, правильно ли считалась таблица с данными.

(код скачивания библиотек в лонгриде не указан, но прописан в блокноте в кликабельном блоке выше)

big
Original size 846x254
big
Original size 2649x535

Составим график распределяющий данные по продолжительности фильма:

Original size 1513x254
Original size 571x435

Столбчатая диаграмма

Далее я прописала часть кода, проверяющую наличие зависимости метарейтинга от длительности фильма.

Как можно заметить на графике, четкая зависимость не прослеживается, но большее скопление совпадений находится в пределах 90 по оси Y и 120 по оси Х.

Original size 1386x208
Original size 571x432

Диаграмма рассеяния

Проверим так же зависимость рейтинга от года выпуска фильма.

Данный анализ обещает быть информативным так как, судя по опыту, новые фильмы зачастую получают рейтинг выше, чем старые.

Напишем код, проверяющий взаимосвязь выбранных данных:

Original size 1191x212
Original size 580x432

Ниже я привела код, распределяющий все фильмы по году выпуска:

Original size 1058x256

На данном графике можно заметить то, что практически все фильмы в подборке были выпущены уже после 2020 года.

Original size 571x435

И последний расчет сведений с помощью кода в моей подборке строит график, показывающий общее распределение рейтинга по всем фильмам в датасете.

Original size 1162x213

На последнем графике мы видим то, что преимущественное большинство фильмов получило оценку в промежутке от 7 до 8 баллов по 10-балльной шкале.

Original size 562x435

ИТОГИ

Подводя итоги, можно сделать вывод о том, что большая часть фильмов выпущенных после 2020 года получила высокий рейтинг (судя по графикам).

Данная информация может помочь потенциальному зрителю выбрать фильм из подборки для последующего просмотра исходя из рейтинга + года выпуска.


доп. сведения:

Обложка для проекта была сделана с помощью ИИ генератора изображений (Leonardo.ai)

Анализ данных рейтинга фильмов IMDB
9