«This isn’t working.»
— Gabe Newell

План проекта:
- Вводная часть
- Загрузка данных
- Анализ данных
- Графики
- Итоги
Вводная часть
games.csv:
Содержит информацию об играх: название, дата выпуска, рейтинг, цена, поддержка платформ (Windows, Mac, Linux), а также дополнительные данные, такие как поддержка Steam Deck.
recommendations.csv:
Содержит отзывы пользователей: рекомендуют ли они игру, количество часов, проведённых в игре, и другую метаинформацию.
users.csv:
Содержит данные о пользователях: количество купленных продуктов и количество оставленных отзывов.
Эти данные представляют собой богатый источник информации о поведении пользователей Steam, популярности игр и трендах в игровой индустрии.

Почему мне было интересно проанализировать именно эти данные?
Актуальность:Steam — одна из крупнейших платформ для распространения компьютерных игр, и её данные отражают современные тренды в игровой индустрии.
Разнообразие данных:
Датасет включает информацию о играх, пользователях и их взаимодействии с платформой, что позволяет провести многогранный анализ.
Практическая ценность:
Анализ этих данных может быть полезен для разработчиков игр, маркетологов и самих пользователей. Например:
Какие игры наиболее популярны и почему?
Как цена влияет на рейтинг игры?
Личный интерес:
Я сама являюсь пользователем Steam, и мне было интересно узнать, как устроена платформа изнутри, какие игры чаще всего рекомендуют и как пользователи взаимодействуют с играми.
Шаг 1: Загрузка данных
Устанавливаем нужныe библиотеки и подгружаем данные
Предобработка данных: привели даты к формату datetime
Данные загружены, приступаем к следующему шагу!
Шаг 2: Анализ данных
Анализ по пунктам: Распределение игр по годам выпуска, Распределение игр по рейтингам, Соотношение рекомендаций, Средние цены на игры по годам, Топ 10 самых популярных игр по кол-ву отзывов
Таким образом я сразу собрала материалы для графиков и перепроверила данные на ошибки, если они возникнут. Большой плюс формата .ipynb в том, что можно разделить работу по маленьким кусочкам и не натыкаться на неизвестные ошибки!
Шаг 3: Графики
Распределение игр по годам выпуска:
Распределение игр по годам выпуска — это важный аспект анализа данных Steam, который позволяет понять, как менялась активность разработчиков и издателей игр с течением времени.
Количество выпущенных игр увеличивается с каждым годом, это может свидетельствовать о росте популярности платформы Steam и увеличении числа разработчиков, публикующих свои игры.
Распределение игр по рейтингам
Распределение игр по рейтингам — это ключевой показатель, который позволяет оценить общее качество игр на платформе Steam, а также понять предпочтения пользователей.
Позитивный; Очень позитивный; Смешанный; В основном позитивный; В основном негативный; В подавляющем большинстве позитивный; Отрицательный; Очень негативный; В подавляющем большинстве негативный
Большинство игр имеют рейтинг «Very Positive», это говорит о высоком качестве контента на платформе. Однако значительная часть игр имеет рейтинг «Mixed», это может указывать на: — Несоответствие ожиданиям пользователей.
— Проблемы с качеством (например, баги, плохая оптимизация).
— Недостаточную поддержку со стороны разработчиков.
Соотношение рекомендаций
Соотношение рекомендаций — это важный показатель, который отражает, насколько пользователи довольны играми и готовы рекомендовать их другим. Этот анализ помогает понять общее удовлетворение пользователей и выявить потенциальные проблемы или успехи в играх.
Подавляющее большинство игр на площадке имеют высокий процент рекомендаций, это говорит о высоком уровне удовлетворённости пользователей.
Средние цены на игры по годам
Изменение средних цен на игры по годам — это важный показатель, который позволяет понять динамику ценовой политики на платформе Steam. Этот анализ помогает выявить тренды, связанные с экономическими факторами, изменениями в игровой индустрии и поведением пользователей.
Увеличение средних цен на игры ближе к 2024 году отражает общие тренды в игровой индустрии, такие как рост стоимости разработки, инфляция и увеличение спроса. Этот тренд имеет как положительные (увеличение доходов разработчиков), так и отрицательные (снижение доступности для пользователей) последствия.
Топ-10 самых популярных игр по количеству отзывов
Количество отзывов — это важный показатель популярности игры на платформе Steam. Оно отражает, насколько активно пользователи взаимодействуют с игрой: оставляют отзывы, делятся мнениями и рекомендациями.
В топ-10 входят игры разных жанров: шутеры (Team Fortress 2, CS: GO, Paladins), RPG (The Witcher 3, Fallout 4, Dark Souls III), survival (Rust) и даже приложения (Wallpaper Engine). Это показывает разнообразие интересов пользователей Steam.
Ещё нельзя не учесть тот факт, что многие игры из топ-10 (Team Fortress 2, CS: GO, Paladins, Dota 2) распространяются бесплатно, что делает их доступными для широкой аудитории.
Зависимость цены от рейтинга игр
Зависимость цены от рейтинга игр — это важный аспект анализа, который позволяет понять, как цена влияет на восприятие игры пользователями и наоборот.
Пользователи более снисходительны к дешёвым или бесплатным играм, но более критичны к дорогим играм. Если дорогая игра не оправдывает ожиданий, это может привести к низким рейтингам.
Каковы итоги?

Анализ данных Steam показал, что успех игр на платформе зависит от множества факторов, включая качество контента, цену, рейтинги и рекомендации пользователей.
Понимание этих факторов помогает разработчикам создавать более качественные игры, пользователям — выбирать подходящий контент, а платформе Steam — улучшать свои сервисы и поддерживать сообщество. Этот анализ также подчёркивает важность обратной связи от пользователей и постоянного улучшения качества игр для поддержания интереса и удовлетворённости аудитории.
Используемые материалы для проекта
- Директория проекта
- DeepSeek — помощь в усвоении библиотек Python и устранении ошибок кода
- Adobe Color — редакция и подбор цвета
- Carbon — стильная подача кода
- Kaggle — огромная база Датасетов для анализа
- Dataset — используемый в проекте
- LeonardoAI — для генерации изображений




