Графики и жизнь: гуманизация данных

Ищу ответы в точных данных. На сайт всё приходит с опозданием, чаще обновляю паблики: Ютуб + (Телеграм = ВК = ФБДзен) + Твиттер с репостами. А вот самый удобный в мире сайт со статистикой российских регионов.

Миллион в Краснодаре и реформа АТД

Население Краснодара достигло отметки миллион человек, — сообщили СМИ. Это очень важное событие, хоть никакого миллиона Краснодар, конечно, не достиг.

Города и городские округа

Миллиона достиг «городской округ Краснодар». В него входит город Краснодар, и еще 29 населенных пунктов — хутора, поселки и станицы.

Численность населения Краснодара

Если бы к каждому городу просто прилагались поселения-спутники, то можно было бы считать «настоящими городами» городские округа, и работать с ними.

Но множества 1112 российских городов и 590 городских округов пересекаются причудливо.

Города и городские округа в России

≈Половина городских округов состоит из одного-единственного города. Это самый простой случай.

Но в каждом десятом городском округе городов вообще нет. Например, в Красноуфимском городском округе самый крупный населенный пункт — поселок городского типа Натальинский. Но живет там 6% от общей численности населения округа, а столица округа — город Красноуфимск. Который образует отдельный городской округ. И как это посчитать по городским округам?

Городской округ и город Красноуфимск

В остальные городские округа входит минимум один город + другие населенные пункты, в том числе, несколько городов.

Разница в населении может быть большой. В Махачкале, например, живет 596 тысяч человек, в «городском округе город Махачкала» — 726. 4,7 миллиона человек живет в городских округах вне «столицы».

Короче, если считать, что в Краснодаре миллион жителей — то надо пересчитывать и количество городов в России, и население в них. Сказал «А» — говори «Б». Сказать «Б» невозможно, потому что административно-территориальное деление (АТД) для этого не приспособлено.

Городское и сельское население здесь ни при чем. В городах может быть сельское население, в селах — городское.
Как считается население — лучше даже не начинать. Лучше данных все равно нет.
Сделал таблицу «население городского округа / население „столицы“» по бюллетеню «Численность населения РФ по муниципальным образованиям», на 1 января 2018 года.

Реформа АТД

Реальная важность новости вот в чем.

Структура городов и городских округов — это только верхний слой шизофрении. Есть город воинской славы Кронштадт в составе города федерального значения Санкт-Петербурга. Есть города в составе городских поселений, городские поселения без городов, поселки городского типа, рабочие поселки и просто населенные пункты, без типа. ≈160 тысяч населенных пунктов. По одному на тысячу россиян. Это слишком много, это растрата дефицитных управленческих ресурсов.

О миллионе объявил мэр Краснодара. То есть существующее АТД не удобно даже региональной исполнительной власти. То же самое в Москве. В мэрии самого крупного города Европы не знают, какие реальные границы агломерации. И никто не знает, потому что нет определений, нет адекватных управленческих единиц.

Население Москвы (город, агломерация, метрополия)

Существующее АТД не отражает ни экономических, ни политических, ни культурных реалий. Кто чем управляет, кто куда платит деньги, кто кого выбирает; показатели на бумаге и реальное положение дел — всё это в каждом регионе и каждом городе решают каждый раз заново. Рано или поздно АТД придется реформировать.

В нашем прекрасном будущем главный атрибут элементарной частицы АТД — самостоятельность. Собственные источники доходов, полномочия и ответственность в рамках этих возможностей. Выбирает носителей власти местное население, это дешевый и надежный контроль эффективности власти. В США выделяют пять масштабов статистических единиц, в Европе — три. Нам надо думать в этом ключе. Но сейчас границы и население реальных агломераций у нас считают энтузиасты, а не ученые.

Аргументировать реформу можно хоть чем: «избавиться от чиновников-дармоедов», «сэкономить деньги», «повысить эффективность управления», «демократизация местного самоуправления», «выстроить вертикаль власти», «к 2024 научиться проводить более-менее честные выборы». Существующее АТД не удобно никому.

Политизация

Мэр Краснодара, по сути, сказал: «Мне похуй на пгт Натальинск. Краснодар мне удобно считать городским округом. Миллион на день рожденья города — бывает же, повезло».

Непонятно, зачем жертвовать репутацией региональной статистики ради ничего (нет закона, по которому городам-миллионникам было бы что-то положено). Зачем создавать конфликт между региональным Росстатом и федеральным? Зачем продвигать в головы 1112 мэров российских городов идею, что можно брать и считать как тебе нравится? Никаких идей федерального масштаба за этим не может стоять, это личная инициатива местных властей.

И это симптом быстрой политизации страны. Каждую неделю какой-нибудь достаточно важный чиновник (из топ-10000) выступает с личной инициативой. Белоусов, Золотов, губернаторские выборы — это только за сентябрь.

Медиа-освещение

СМИ, которые без комментария перепечатали новость про миллион в Краснодаре, — позор. Какое трепетное отношение к тому, что какие-то чуваки в пиджаках вручают друг другу филькины грамоты. Какое непонимание демографии — базы всех общественных наук. Какое непонимание АТД — основы государственной системы РФ. Позор.

Краснодар — НЕ МИЛЛИОННИК.

Мэр Краснодара позирует с грамотой Краснодару — Екатеринодару с неофициальным логотипом Екатеринбурга.

И да. Краснодар — один из самых быстро растущих городов России, наверняка достигнет миллиона в ближайшие годы, и это прекрасно.

Рост крупных российских городов 1989, 2002, 2010, 2017
24 сентября   cities   done   line chart   russia   venn diagramm

Как Россия использует землю?

Оленьи пастбища занимают почти 20% России. Если бы олени обрели независимость, оленья страна была бы в мире седьмой по площади. С другой стороны, все российские города можно было бы втиснуть на архипелаг Новая земля.

Не думаю, что из этого надо делать какие-то выводы, кроме того, как неочевидно иногда устроен мир, и в какой удивительной стране нам повезло жить.

Статистика землепользования России How Russia Uses Its Land

О данных

Деление земель — по целевому назначению. Например, «Город»  — это вся территория городского населенного пункта. Внутри города есть леса, воды, дороги и даже, возможно, оленьи пастбища, но вся эта земля по целевому назначению — «Город».

Есть как бы «перпендикулярное» деление земли по фактическому использованию: жилая застройка, дороги, овраги, болота, помойки и так далее, но на таком масштабе оно мало что меняет.

Оленьи пастбища относятся к категории фактического использования, поэтому они распределены между лесным фондом, с/х и заповедниками. Вообще-то еще 0,6% России — это оленьи пастбища на землях иного целевого назначения, но их я решил просто не отображать.

«Не распределено» — это «Земли запаса», то есть те, которым никакая категория не присвоена. Использовать землю без присвоения категории нельзя. То есть до этих земель еще просто не дошли ни у кого руки.

«Заповедники» — «Земли особо охраняемых территорий и объектов».

Источники

Идею спер с Блумберга — это прекрасный материал на американских данных.

Данные: «Сведения о наличии и распределении земель в Российской Федерации на 01.01.2018», «Структура посевных площадей по видам сельскохозяйственных культур».

2018   done   economics   geography   land   maps   russia

Рейтинг стран по всему

Во время ЧМ сделал график — итоговые места всех команд на всех ЧМ. А то сложно вспоминать, как там оно было раньше. На картинке Бразилия и Германия, а на http://fifa.gizh.ru все подписано и можно сравнивать любые команды между собой. Там же куча других соревнований, национальных (спасибо Алексею за данные!) и клубных.

Есть куда улучшать. Хотелось бы добавить Лигу Чемпионов и низшие дивизионы, но самое главное сейчас, что веб-дизайн там прям очень плохой. Собрать это в приличный сервис я пока не умею, если хотите — давайте вместе доделаем.

Работу постил на Реддите — неплохо приняли. А в английской Википедии один чувак делает такое. За ним гоняются фанаты разных футбольных клубов, чтоб и у них такое было.

Tottenham FC history

Ну и любой страновой рейтинг теперь делается за время копирования данных в шаблон. Вот, например рейтинг Doing Business.

Человеческие единицы измерения

Истории мы запоминаем лучше, чем цифры. Чтобы превратить цифры в историю, надо использовать Человеческие Единицы Измерения.

Некоторые примеры должны показаться чересчур драматичными или нелепыми. Это нормально, так это и работает. На одной стороне спектра — сухие цифры, на другой — манипуляция. Какой оттенок выбрать, приходится решать каждый раз заново, в зависимости от контекста и цифр, чувства прекрасного, инфантильности своей и воображаемой аудитории. Но то, что конторские служащие сейчас тотально закрасили всё в хаки — решительно неправильно.

2018   meta

Демографический параллелепипед

Придумал новый вид графиков — демографический параллелепипед! (Это прямоугольник, ну так и демографический треугольник — не пирамида).

Демография России 1897—2036

На английский «демографический параллелепипед» переводится как chorotable. Потому что это, на самом деле, просто экселевская таблица с условным форматированием.

Вообще, дополнительное цветовое кодирование значений следует использовать во всех публикуемых таблицах. Обычно в таблице интересует среднее и отклонения от него. И зачем читать цифры, если на глаз это различается в долю секунды?

2018   demography   done   excel   russia   static   table

Экономическая география России. Карта

Плиточная карта России

Суть плиточной карты в том, что все регионы на ней занимают одинаковую площадь. При этом географические контуры страны и соседство регионов между собой более-менее сохраняются, поэтому регионы находятся на более-менее привычном месте. Это как с 3D-изображениями: нужно немного изменить оптику, и все встает на свои места.

Плиточная карта России. Цветом закодированы федеральные округа (с СПб — ошибка).

У автора никогда не получалось рассмотреть 3D-изображения, но с картой проще — все регионы подписаны.

Плиточная карта удобна, когда нам хочется сравнить показатели регионов между собой, и при этом площадь регионов нас не интересует. Если на секунду задуматься, то во всех социально-экономическо-политических картах площадь регионов нас вообще не интересует. Вообще. Зачем площадь, ау? Мы же не количество гектар сравниваем.

Если задуматься на вторую секунду, то нас обычно интересует, как живут люди в стране, а не показатели в административно-территориальных границах. На этот случай есть карты, анаморфированные по населению!

Плитки лучше выполняют задачу сравнения показателей между регионами, потому что в них нет ничего лишнего. На плитках можно размещать цифры и микрографики, это добавляет дополнительное измерение. В общем, традиционные псевдогеографические карты мы используем только в силу старомодной привычки — но когда-то же это должно прекратиться!

Карта экономической географии регионов России

Берем валовый региональный продукт российских регионов, это сумма всех произведенных товаров на этой территории. (Вот, если что, подробный пост про методы подсчета разных валовых продуктов).

ВРП в официальной статистике разбит на 16 разделов. Так как мы сейчас выступаем в роли простого гражданина, которому просто интересно, что происходит в разных регионах любимой Родины, группируем 16 разделов в семь стопок побольше (например, складываем вместе сельское и рыбное хозяйство). Находим, какая отрасль занимает в ВРП больший процент, кодируем ее цветом, наносим на плиточную карту.

Карта экономических регионов России

Можно разглядеть явные экономические регионы: добыча полезных ископаемых на Севере и Северо-востоке. Промышленные центр и Урал. Дотационные регионы Юга и Дальнего Востока. Москва, Питер и Новосибирск — центры современной экономики. В услуги входит вся экономика, не связанная с физическим производством и перемещением предметов, от финансов и архитектуры до разработки ПО и науки.

Если это вам кажется более-менее очевидным, то встречайте продвинутую версию карты.

Экономическая география регионов России. Карта

Каждая плитка здесь разбита на четыре квадрата. Каждый квадрат значит отклонение отрасли от среднероссийского уровня примерно на +5%.

Например, Калужская область имеет очень сильную специализацию на промышленности — она целиком желтая. Тульская, Рязанская и Владимирская области в значительной степени дотационные — хотя промышленность там также развита сильно. Среди всех ресурсных регионов активное строительство идет на Ямале (видимо, новые месторождения).

Скашивать глаза здесь придется посильнее, но это того стоит. По крайней мере, автор разглядывал ее дольше, чем делал.

Титры

Плиточную карту России сделал Иван Дианов. По ссылке Иван рассказывает о процессе создания и приводит примеры других стран, а здесь можно посмотреть на другие варианты российской плиточной карты. Векторную карту России сделал Дмитрий Скляров.

Шаблоны плиточной карты (Russia tiled map)

  1. Скетч и Эксель.
  2. Чуть обновленная Надей Андриановой версия AI и PDF, на которой базировался я.
  3. Версия в Табло с микрографиками, которую сделал Роман Бунин.
  4. Версия на R Юрия Тукачева.
  5. Excel | Александр Ильин.
  6. NodeBox | Денис Запорожан
  7. Python | Роман Власов. Вот, например, реализация того же дата-сета. Интерактивная!
ВРП российских регионов. Интерактивная карта
2018   done   economics   maps   regions   russia   tilemap

Фейковые карты и плотность населения России

Москва — башня Саурона, а Россия — мертвая ледяная пустыня. Такое впечатление остается от этой картинки.

НЕ карта плотности населения России

Но если встретите её когда-нибудь ещё раз, знайте: Чемоданчик Всевластья, может быть, и в Москве, но карта эта — абсолютно фейковая.

Во-первых, на картах, где пики иллюстрируют плотность населения (пиковые карты?), не бывает плоских мест. Люди живут везде.

Во-вторых, очень важен выбор точки обзора. Можно представить, какой был бы эффект, если б камеру поставить на высочайшую вершину. Или если углубить перспективу на те ⅔ территории Китая, которые на эту карту не влезли (в правом верхнем углу указано, что камера сейчас смотрит на территорию западнее линии линии Хэйхэ—Тэнчун).

Плотность населения Китая

То есть даже технически правильные карты могут сильно искажать реальность. Что уж говорить про те, которые изначально никакого физического смысла в себе не несут.

НЕ карта плотности населения России

Видите абсолютно плоскую территорию? Этого не может быть. И действительно: автор карты зачем-то выложил черновую версию карты. На настоящей есть ещё и отрицательные значения.

НЕ карта плотности населения России НЕ карта плотности населения России НЕ карта плотности населения России НЕ карта плотности населения России НЕ карта плотности населения России

Это как если бы бухгалтер сдал в налоговую только доходы организации, забыв про расходы. Полная ерунда.

И можно ужаснуться: если нулевые значения кажутся ледяной пустыней, то как тогда воспринимать отрицательные значения? Ответ — никак.

С чего мы вообще решили, что это плотность населения? Ни одного заголовка, ни легенды, ни подписи нам еще не встретилось. Так какой параметр изображен на этой карте? Слово автору:

... заведомо откажемся от общедоступных статистических данных, памятуя как «накручиваются» счётчики в такой статистике.

...возьмём транспортный каркас — сеть основных дорог и магистралей, как наиболее консервативный и объективный показатель уровня экономической деятельности. Условно примем, что наибольшей концентрации транспортной сети соответствует наибольшее количество экономической активности. Соответственно, области с наибольшей активностью преобразуются в положительные высотные отметки, и наоборот, меньшая активность — в отметки с отрицательными значениями. Иными словами, холмы и горы — положительная активность, низины и впадины — отрицательная. Наложим теперь всё это на карту России. ...

Матрица ландшафта. — С. 21—22. Курсив мой.

Конспект: это производная переменная, рассчитанная непонятно как на основании непонятно чего ¯\_(ツ)_/¯

Хорошие карты плотности населения России

Вот по муниципальным районам.

Плотность населения России по муниципальным районам

Вот хорошая, под необычным углом (есть более новая и более интерактивная версия)

Плотность населения России и Европы

Выводы

С фейковыми картами — как с фейковыми новостями: нельзя доверять анонимным источникам. Должны быть заголовок, легенда, источник данных, желательно — автор с именем и фамилией. Всё как в приличных СМИ. Нет источника — значит, это сплетни.

PS. Я использовал это изображение для иллюстрации плотности населения России в видео «Россия — не большая» — извините. Кудрин тоже попался.

2018   density   maps   review   russia

Демографические (половозрастные) пирамиды по всем переписям

Пять месяцев назад я опубликовал видео «История России в демографических пирамидах», и только сейчас понял, что сами пирамиды не выложил. Выкладываю (это листабельная галерея)

Демографическая (половозрастная) пирамида России 2017 Демографическая (половозрастная) пирамида России по переписи 2010 Демографическая (половозрастная) пирамида России по переписи 2002 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по переписи 1989 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по переписи 1979 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по переписи 1970 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по переписи 1959 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по переписи 1939 Демографическая (половозрастная) пирамида России (СССР, РСФСР) по  переписи 1926 Демографическая (половозрастная) пирамида России по первой переписи 1897

И ведь нельзя было просто взять и заскриншотить. Как минимум, нужно добавить заголовки и источники. Пригодится сетка для разглядывания. Не забыть выложить собранные данные всех переписей в xls.

Пока делал, думал про форматы предоставления информации. Вот листалка картинок, карусель. Можно изучать всё в удобном для себя темпе (в отличие от гифок и видео), переход между изображениями интуитивный (в отличие от любого интерактивного решения), и ничего лишнего. В видео было удобно показать, как получается эхо демографических спадов, и как вообще история пережевывает поколения. Сейчас бы я, пожалуй, сконцентрировался на подписях к ключевым событиям, типа, вот пила Чурова, вот революция, вот эхо.

Но это ведь все равно не решит главную проблему. Все равно раз в год, когда публикуют свежую статистику по демографии, интернет взрывается от новости, что Россия вымирает, или наоборот, встрепенулась. Блин, ну как будто сейчас не видно, как все будет в ближайшие 20 лет.

Предлагаю для такого термин old news, по аналогии с fake news.

Городская система России и закон Ципфа

Есть способ компактно описать городскую систему любой страны, на базе распределения городов по численности населения.

http://zipf.gizh.ru — здесь база данных городов 100 стран мира (российские — с 1897-го года) с интерактивными графиками.

А вот видео, как этот странный график работает.

2018   cities   done   interactive   line chart   russia   video

Gender gap в России

Интересно, отличаются ли зарплаты женщин и мужчин в России?

Зарплаты женщин и мужчин по должностям и профессиям в России

Отличаются. Инсайты:

  1. Мужчина со средней квалификацией получает больше, чем женщина с высшей квалификацией.
  2. Выполняя ту же работу, что и мужчина, женщины получают меньше зарплату — это наблюдается по всем категориям профессий. Только на не очень квалифицированных работах в аграрном секторе у женщин зарплата чуть-чуть выше.
  3. У женщин хуже складывается карьера: среди специалистов высокой и средней квалификации женщин почти три четверти, а среди руководителей — меньше половины. Значит, они реже идут на повышение.
  4. Среди должностей с низкими зарплатами женщин также намного больше.

UPD. Я думал, что gender gap в России вообще толком не изучают — но нашлась отличная статья! С графиками!

2018   done   dot plot chart   jobs   pie chart   russia   salary   static   table
Ранее Ctrl + ↓