Original size 1860x2625

Анализ данных о туризме

PROTECT STATUS: not protected
6
big
Original size 1024x514

Promt: Create a minimalist navigation-style world map illustration featuring flying airplanes. The map background should be clean and simple, with subtle thin outlines of continents or countries in neutral colors (light gray or soft blue). Airplanes are represented by sleek, simple icons or geometric shapes in white or light gray. Each airplane is connected to its flight path by a smooth curved line in bright yellow, symbolizing the route

Путешествия — это неотъемлемая часть жизни, которая обогащает нас новыми впечатлениями

Мне было интересно изучить, какие страны привлекают наибольшее количество туристов. Для финального проекта по данному курсу я выбрала датасет о самых посещаемых странах мира, содержащий данные о количестве туристов, типу туризма и других ключевых аспектах. Этот анализ поможет лучше понять глобальные тенденции в туризме и выявить причины, делающие одни направления более привлекательными, чем другие

Загрузка данных

Для визуализации данных я использовала следующие столбцы из датасета:

Country — страна Category — тип туризма Visitors — количество туристов Rating — рейтинг страны

big
Original size 883x250

Датасет был найден на платформе Kaggle,

Оформление

Original size 1920x668

Визуальное оформление проекта отражает дух путешествий: теплые желтые и оранжевые тона создают ощущение солнца и приключений

Для визуализации я использовала столбчатые, круговые диаграммы, облако тегов и диаграмму рассеяния, которые позволили провести полноценный анализ данных

Визуализация данных

В моих данных не было пропусков, поэтому я сразу же приступила к визуализации

Первым делом я построила диаграмму, которая отражает топ стран, которые наиболее часто встречаются в выбранном мной датасете.

Можно видеть, что самым популярным направлением в этих данных является Египет

0

Круговая диаграмма, построенная по столбцам category и country, позволила быстро оценить распределение различных категорий путешествий среди стран в датасете. Визуализация показала, что доли всех категорий оказались почти одинаковыми, что указывает на равномерное распределение интересов путешественников по разным направлениям и типам отдыха. Такой результат говорит о том, что ни одна категория не доминирует, и туристические предпочтения достаточно разнообразны. Это важно для дальнейшего анализа: например, маркетинговые стратегии могут быть ориентированы сразу на несколько категорий, а не только на одну ведущую

0

Облако тегов с цветовой кодировкой по столбцам category и country дополнило анализ датасета о путешествиях следующим образом:

В отличие от круговой диаграммы, которая показывает лишь пропорции категорий и стран в целом, облако тегов визуализирует частотность каждого значения через размер слов, что помогает быстро выявить наиболее часто встречающиеся категории и страны

0

Построенная диаграмма рассеяния, показывающая зависимость числа туристов (Visitors) от рейтинга страны (Rating), позволила выявить важные взаимосвязи в данных о путешествиях. Анализ графика показал, что с ростом рейтинга страны, как правило, увеличивается и количество туристов, что подтверждает логику — более высокие рейтинги отражают лучшую туристическую инфраструктуру, привлекательность и качество сервиса, что привлекает больше посетителей

0

Построив линейную диаграмму, можно наглядно увидеть рейтинг стран. Из него становится ясно, что самым высоким рейтингом среди туристов обладает Бразилия. Китай, наоборот, в данной выборке отличается достаточно низким рейтингом, что составляет оценку в значение ниже 3

0

Вывод

Визуализация — это не просто способ показать данные, а мощный инструмент для их понимания и интерпретации

Визуализация данных с помощью Python, представленная на основе нескольких графиков и диаграмм, позволила получить глубокое и многогранное понимание исследуемого датасета о путешествиях. Круговая диаграмма, показывающая распределение категорий путешествий и стран, продемонстрировала почти равные доли всех категорий, что указывает на разнообразие туристических интересов и отсутствие явного доминирования одной категории. Это помогло увидеть общую структуру данных и равномерность предпочтений. Облако тегов с цветовой кодировкой дополнило анализ, визуально выделяя наиболее частые категории и страны, а также показывая связь между ними через цвет. Такой подход сделал данные более наглядными и позволил быстро идентифицировать ключевые направления и популярные категории для каждой страны. Диаграмма рассеяния, иллюстрирующая зависимость числа туристов от рейтинга страны, выявила положительную корреляцию между этими показателями, при этом показала и исключения, что говорит о влиянии дополнительных факторов на туристический поток. Это позволило оценить эффективность рейтингов и выявить области для дальнейшего изучения.

Таким образом Python как инструмент визуализации данных играет ключевую роль в анализе благодаря своей гибкости, богатству библиотек (Matplotlib, Seaborn др.) и интеграции с аналитическими инструментами. Он позволяет быстро создавать графики, что облегчает понимание сложных взаимосвязей

Нейросети

Использовала Ideogram Al для генерации обложки и баннера проекта.

Использовала ChatGpt и DeepSeek для корректировки и улучшения кода, также для помощи в формулировании выводов по графикам

Анализ данных о туризме
6