Исходный размер 1140x1600

Анализ демографии при помощи Pandas

Введение

Для анализа данных была выбрана ожидаемая продолжительность жизни при рождении, начиная с 2020 по 2035 года.

Данные были найдены на сайте «hubofdata.ru»

Была выбрана именно эта тема, поскольку продолжительность жизни является постоянно варьирующимся числом. Из-за этого интересно узнать: сколько проживет нынешнее поколение по прогнозам.

Виды графиков

Линейный график использован для визуализации изменений ожидаемой продолжительности жизни по годам. Это легкий способ показать изменения по времени, что особенно важно для временных данных.

big
Исходный размер 1200x600

Гистограмма построена для анализа различий между мужчинами и женщинами. Это позволяет увидеть величину этих различий.

big
Исходный размер 1200x600

Диаграмма рассеяния использована для анализа корреляции между сценариями. В нашем случае низкий против высокого, чтобы исследовать различия между ними.

Исходный размер 1439x800

Комбинированный график добавлен для сравнения средней продолжительности жизни между мужчинами, женщинами и обоими полами в одном сценарии. Такой подход упрощает сравнение категорий.

Исходный размер 1200x600

Эти виды графиков обеспечивают баланс между простотой восприятия данных и их глубиной анализа. Линейные графики хорошо показывают тренды, а гистограммы и диаграммы рассеяния предоставляют дополнительное понимание различий и взаимосвязей.

Написание кода и стилизация

Для начала я подключил все нужные библиотеки и подсоединил таблицу к коду в Visual Studio.

Исходный размер 567x163

После этого была произведена очистка данных, переименовывание столбцов, а также выделение нужных для создания графиков.

Также было создано сравнение при помощи разницы между столбцами с данными.

Исходный размер 702x266

Сильного упора в стилизацию не происходило. Я постарался оставить данные чистыми и понятными.

Исходный размер 806x231

Единственное, где были изменения это график рассеяния. Была выбрана другая палитра для создания градиента, который позволяет наглядно видеть изменения.

Исходный размер 644x256

Использование нейросетей и файлы

Для создания данной работы была использована нейросеть Kandinsky, для создания обложки.

Исходный размер 445x612

Файлы:

https://drive.google.com/file/d/1aC_iOjXFX8WKA_PU1ZiPIpr_r1ocQ04b/view?usp=sharing

Внутри архива находится файл Python и таблица, по которой велся анализ.

Анализ демографии при помощи Pandas
Проект создан 29.01.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше