Original size 864x1152

Объекты культурного наследия народов России

PROTECT STATUS: not protected
14

Вступление

Для проекта по инфографике в Python мне захотелось сделать что-то связанное со статистикой в культурной сфере. Я воспользовалась порталом открытых данных Министерства культуры РФ для поиска материалов. Моё внимание привлёк датасет «Сведения из Единого государственного реестра объектов культурного наследия (памятников истории и культуры) народов Российской Федерации». В нём насчитывается более 65 000 объектов культурного наследия.

В таком широком диапазоне табличных данных легко «‎заблудиться»‎, их крайне сложно анализировать вручную, поэтому использование Python становится настоящим спасением в этом случае. Сотни тысяч значений могут принять вполне понятный и презентабельный внешний вид посредством визуализации в виде графиков.

Я решила сделать наиболее показательные и простые графики, которые дают первичное представление о наполнении этого датасета. Я не ставила перед собой никаких первоочерёдных задач, мне просто было интересно проанализировать и каким-то образом сгруппировать данные, чтобы создать инфографику на их основе, которая бы выражала общую картину по объектам культурного наследия, некоторые закономерности и пропорциональные соотношения.

Основная часть

big
Original size 1920x534

Мудборд

big
Original size 1535x534

Цветовая палитра

Original size 1920x534

График #1 — Круговая диаграмма

0

Первый график, который я решила построить — это круговая диаграмма, отражающая соотношение культурных объектов по регионам России. Как оказалось, больше всего памятников находится в Тверской области (10%).

В редактировании кода для поддержания стилистического единства во всех графиках мне помогала нейросеть deepseek. Она подсказала мне, как сократить количество отображаемых регионов и их процентных соотношений (чтобы диаграмма не выглядела переполненной), как перекрасить график в мою цветовую палитру и как заменить необходимый мне шрифт.

График #2 — Облако слов

0

Далее мне захотелось узнать, объекты какого типа преобладают в датасете. Для этого мне понадобилось проанализировать колонку 'Объект'. В итоге оказалось, что самые часто встречаемые слова (большинстве случаев они непосредственно отображают тип памятника) в названиях объектов — это 'курганная группа', 'дом жилой'/ 'жилой дом', ' братская могила', 'селище', 'поселение', 'стоянка', 'памятник' и т. д.

С помощью нейросети я смогла покрасить слова в необходимый мне набор цветов и применить нужный шрифт.

Original size 1920x927

Я попросила deepseek дать мне рекомендации по построению облака слов. Нейросеть предложила сделать фильтрацию на так называемые стоп-слова: служебные предлоги, союзы, римские цифры и т. д.

Я самостоятельно составила необходимый мне список стоп-слов, чтобы диаграмма несла как можно больше полезной информации об объектах. Список расширялся в мере очищения облака от ненужных слов, операция пополнения списка была проделана около 10 раз.

График #3 — Гистограмма

0

Так как объекты типа 'дом' оказались одними из самых часто встречаемых в датасете, мне захотелось посмотреть их распределение по регионам. Для этого я решила построить гистограмму. Больше всего домов-памятников, ожидаемо, оказалось в Санкт-Петербурге (1079). За ним следует Костромская область (761), а замыкает тройку лидеров уже упомянутая ранее Тверская область (561).

Чтобы узнать точное количество домой в каждом из регионов, я дописала в этой же ячейке следующие команды для формирования таблицы и её импорта в виде csv файла, который затем отфильтровала в Excel (мне всё ещё удобнее пользоваться инструментами сортировки там, чем в среде Python).

Original size 1920x1080

График #4 — Тепловая карта

0

Теперь посмотрим на статусы объектов, которые указаны в датасете. Моё внимание привлекли две колонки: 'Принадлежность к Юнеско' и 'Особо ценный объект'. Первая означает вхождение памятника в Список Всемирного наследия ЮНЕСКО, вторая — в Государственный свод особо ценных объектов культурного наследия народов Российской Федерации.

Оказалось, что всего лишь 13 памятников, из списка с более чем 65 0000 наименований, одновременно входят в обе категории.

357 входят только в Список Всемирного наследия ЮНЕСКО, а 62 только в Государственный свод особо ценных объектов культурного наследия народов Российской Федерации.

Подавляющее число памятников (65103) не имеет особого статуса.

Я вновь обратилась к deepseek, чтобы она помогла выбрать наиболее функциональный тип диаграммы для визуализации подобной корреляции. Нейросеть предложила построить тепловую карту (с помощью незнакомой мне до этого библиотеки 'seaborn'), которую я затем кастомизировала под свой стиль. Я также спросила, как пользоваться градиентами, для этого мне порекомендовали воспользоваться функцией 'LinearSegmentedColormap' из библиотеки 'matplotlib.colors'.

Описание применения генеративной модели

В ходе работы над исследованием я пользовалась нейросетью deepseek. Подробно посмотреть используемые мною промпты можно в этом документе.

Изображения для обложки создала нейросеть recraft.ai. Используемый промпт:

Create a realistic photo, more like scenery, but also with the aesthetic elements of theatre decorations. Photo must include objects of cultural heritage of the peoples of Russia (architectual construsctions, like churches, houses and etc) locating together like in the terrarium. The surroundings may look like typical russian forest or field. Do not include images of people (tourists) on the photo.

Список литературы

[1] Официальный сайт Минкультуры России / Открытые данные / Данные / Сведения из Единого государственного реестра объектов культурного наследия (памятников истории и культуры) народов Российской Федерации

URL: https://opendata.mkrf.ru/opendata/7705851331-egrkn

Дата обращения: 23.03.2025

Объекты культурного наследия народов России
14
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more