Original size 1140x1600

Cancer regression

PROTECT STATUS: not protected

Введение

Меня всегда интересовала медицина и биология.

Но особое внимание я обращала на такое заболевание, как Рак. Поэтому я взяла датасет, связанный с данной тематикой.

В данном случае, речь идёт о линейной регрессии рака.

Описание датасета от его автора (перевод с английского)

Учебное пособие по модели линейной регрессии рака

Аннотированный пример линейной регрессии с использованием открытых данных с порталов открытого правительства резюме Пошаговое руководство по линейной регрессии

Этот пример построен с использованием Python. Он охватывает:

- Как автор получал и импортировал данные - Подготовка данных - Исследовательский анализ - Выбор модели - Диагностика модели

(Обратите внимание, что это первая попытка прохождения, и ее следует рассматривать как базовую модель для сравнения с будущими итерациями.)

Работа над созданием графиков/диаграмм

Датасет я нашла на данном ресурсе: https://data.world/datasets/open-data

big
Original size 2879x1635

Далее я преобразовала файл csv в ссылку на датасет с помощью сайта: https://github.com

Original size 2879x1633

Затем я вписала данную ссылку в Google Collab и уже там приступила к работе с кодом.

Там мне предложили несколько варианта графиков, код которых я стала переделывать с помощью чата GPT.

Графики

Мой код и получившиеся диаграммы выглядят данным образом:

Для визуального и информационного упрощения я сократила все диаграммы до топ-10.

И теперь они выглядят так:

Итоговые графики

Цветовая палитра создана на сайте: https://coolors.co

Original size 1600x1200

Модифицированные под единый стиль (за счёт единой палитры и пары шрифтов) диаграммы:

Original size 1500x1500
Original size 1500x1500
Original size 1500x1500

В заключении

Подобные датасеты достаточно важны для медицины. Они могут поспособствовать дополнительному анализу данного заболевания, что имеет возможность помочь в её изучении и дальнейшем способе лечения.

Ссылки