Вводная часть:
Какие данные вы выбрали и где вы их нашли?
Я выбрал данные о ценах на 5 основных продуктов питания (хлеб, молоко, яйца, мясо, овощи) за период с января 2020 по март 2024 года. Данные в формате CSV были собраны из открытых статистических источников
Почему вам было интересно проанализировать именно эти данные?
Тема инфляции и роста цен — одна из самых актуальных для каждого человека. Эти данные показывают реальную динамику стоимости жизни за последние годы, что имеет практическую ценность для понимания экономической ситуации
Какой вид графиков вы решили сделать и почему?
Я создал 5 видов графиков:
- Линейный график — для отображения динамики цен во времени
- Столбчатая диаграмма — для сравнения средних годовых цен
- Столбчатая диаграмма с процентами — для наглядного показа роста цен
- Тепловая карта — для визуализации корреляции между ценами
- Box plot — для анализа распределения и выбросов цен
Этапы работы
1. Загрузка данных
Загрузка CSV-файла с помощью библиотеки Pandas. Проверка доступности файла и создание резервного набора данных на случай его отсутствия

Загрузка данных
2. Предобработка данных
Преобразование дат в правильный формат, создание столбца с годом для группировки, расчёт средних значений по годам и процентного роста цен
Предобработка данных
3. Настройка стиля
Создание собственной цветовой палитры и установка единого стиля оформления для всех визуализаций
Настройка стиля
4. График 1: Динамика цен
Построение линейного графика, показывающего изменение цен на все продукты за весь период
График динамики цен
График динамики цен
5. График 2: Средние цены по годам
Создание группированной столбчатой диаграммы для сравнения средних годовых цен
График средних цен
График средних цен
6. График 3: Процент роста цен
Визуализация процентного роста цен за 4 года в виде столбчатой диаграммы
График роста цен
График роста цен
7. График 4: Корреляция цен
Построение тепловой карты корреляций между ценами на разные продукты
График корреляции
График корреляции
8. График 5: Распределение цен
Создание box plot для анализа распределения, медиан и выбросов цен в 2024 году
График распределения
График распределения
9. Сохранение результатов
Сохранение графиков в формате PNG и статистических данных в CSV файл для дальнейшего использования
Сохранение результатов
Ключевые выводы
- Цены на все продукты выросли более чем на 100%за период 2020–2024 гг.
- Наибольший рост наблюдался у молока (+115.9%) и овощей (+114.7%)
- Сильная корреляция между ценами на хлеб и молоко (0.97) указывает на взаимосвязанность рынков
- 2022 год стал переломным — именно тогда начался наиболее интенсивный рост цен
- Распределение цен в 2024 году показывает наличие сезонных колебаний
Статистические методы
В проекте использованы следующие статистические методы:
- Описательная статистика: среднее значение, стандартное отклонение, минимум, максимум, квартили
- Процентный анализ: расчёт роста в процентах
- Корреляционный анализ: матрица корреляций Пирсона
- Анализ распределения: box plot с медианой и интерквартильным размахом
- Временной анализ: изучение динамики изменения показателей
Ссылки на материалы
Все файлы проекта доступны в Google Drive: https://drive.google.com/drive/folders/1pyIF0pfNTkx3zIx3ZCcZKr7BDUHsL_dk?usp=drive_link
В папке находятся: — Блокнот с полным кодом (.ipynb файл) — Исходный датасет (food_prices.csv) — 5 итоговых графиков (PNG формата) — Файл с расчётными статистиками (summary_statistics.csv)
Описание применения генеративной модели
В проекте использовался ChatGPT (GPT-4) для помощи в следующих задачах:
- Оптимизация кода: помощь в написании эффективного кода для визуализаций
- Подбор цветовой палитры создание гармоничной цветовой схемы для графиков
- Решение технических проблем: помощь с обработкой ошибок и настройкой библиотек
- Структурирование кода: разделение на логические блоки с комментариями
Модель GPT-4 Ссылка: https://chat.openai.com Использование: Все аналитические выводы и интерпретации данных выполнены самостоятельно, нейросеть использовалась только как инструмент для ускорения разработки.



