Original size 1536x2304

Анализ данных топ-250 фильмов IMDB

PROTECT STATUS: not protected
12

Концепция

Я выбрала данные именно с сайта IMDB, так как часто захожу туда сама, чтобы увидеть оценку критиков и аудитории, понять стоит ли смотреть какой-то фильм или нет и просто почитать отзывы разных людей. Мне стала интересна статистика по самым высоко оцененным фильмам на данном сайте, поэтому я нашла базу данных на сайте kaggle.com

EXISTING_LINK_0_1761380823511_0×0ev2sql

Этапы работы

  1. Выбор базы данных
  2. Загрузка данных из CSV файла
  3. Обработка данных и выделение нужных колонок
  4. Анализ данных
  5. Визуализация данных с помощью различных типов графиков

Виды графиков

- Точечная диаграмма - Столбчатая диаграмма - Круговая диаграмма - Линейная диаграмма

Для оформления графиков, я использовала встроенную палитру PiYG / PiYG_r с сайта practicalpythonfordatascience.com, которая включает в себя цвета: - #cf4291 - #eeadd5 - #fce6f2 - #ecf6db - #b0dc7d - #62a32d

big
Original size 1471x366

Итоговые графики

Топ жанров по популярности

Original size 1674x284
Original size 617x455

Продолжительность фильмов по жанру

Original size 1670x337
Original size 850x748

Топ возрастных ограничений на фильмах

Original size 1671x124
Original size 842x825

Рейтинг фильмов по жанрам

Original size 1674x287
Original size 617x455

Рейтинг топ-10 фильмов на IMDB

Original size 1669x187
Original size 885x455

Описание применения генеративной модели

Для чистки данных и помощи написания кода (чтобы разобраться, как работают те или иные команды и чтобы проверить правильность написания кода) я использовала несколько чатов GPT: - chat-gpt.ing - chat-gpt.org - чат-бот в телеграмме

Также для создания обложки проекта я использовала сайт ideogram. - prompt: 3 minimalistic pedestals. on the first one there is an oscar, on the second one there is a clapperboard. on the third one there is a lens of a camera. color palette is shades of green and pink, 3d render, cinematic - картинка

Анализ данных топ-250 фильмов IMDB
12