
ВЫБОР ДАННЫХ
Для проведения анализа мною были выбраны данные о фильмах, где указаны названия, рейтинг, жанр и прочие привычные нам сведения из кинематографа.Представленная таблица заинтересовала меня по некоторой причине: На данный период обучения у меня присутствует история VFX, на этой истории мы смотрим различные фрагменты фильмов, поэтому интерес к такому виду искусства у меня значительно вырос.
Мне показалось интересным проанализировать топ-1000 фильмов, отсортировав их по ключевым значениям.
АНАЛИЗ ДАННЫХ
Выбранный датасет я нашла на платформе kaggle.com
Использованные графики:
1. Столбчатая диаграмма 2. Диаграмма рассеяния
Для начала мы скачаем все необходимые библиотеки и проверим, правильно ли считалась таблица с данными.
(код скачивания библиотек в лонгриде не указан, но прописан в блокноте в кликабельном блоке выше)


Составим график распределяющий данные по продолжительности фильма:
Столбчатая диаграмма
Далее я прописала часть кода, проверяющую наличие зависимости метарейтинга от длительности фильма.
Как можно заметить на графике, четкая зависимость не прослеживается, но большее скопление совпадений находится в пределах 90 по оси Y и 120 по оси Х.
Диаграмма рассеяния
Проверим так же зависимость рейтинга от года выпуска фильма.
Данный анализ обещает быть информативным так как, судя по опыту, новые фильмы зачастую получают рейтинг выше, чем старые.
Напишем код, проверяющий взаимосвязь выбранных данных:
Ниже я привела код, распределяющий все фильмы по году выпуска:
На данном графике можно заметить то, что практически все фильмы в подборке были выпущены уже после 2020 года.
И последний расчет сведений с помощью кода в моей подборке строит график, показывающий общее распределение рейтинга по всем фильмам в датасете.
На последнем графике мы видим то, что преимущественное большинство фильмов получило оценку в промежутке от 7 до 8 баллов по 10-балльной шкале.
ИТОГИ
Подводя итоги, можно сделать вывод о том, что большая часть фильмов выпущенных после 2020 года получила высокий рейтинг (судя по графикам).
Данная информация может помочь потенциальному зрителю выбрать фильм из подборки для последующего просмотра исходя из рейтинга + года выпуска.
доп. сведения:
Обложка для проекта была сделана с помощью ИИ генератора изображений (Leonardo.ai)