Здесь каталог наименее плохих работ. Новые появляются сначала в пабликах: Ютуб + (Телеграм = ВК = ФБДзен). До сайта когда-нибудь дойдут руки, наверное

Позднее Ctrl + ↑

Gender gap в России

Интересно, отличаются ли зарплаты женщин и мужчин в России?

Зарплаты женщин и мужчин по должностям и профессиям в России

Отличаются. Инсайты:

  1. Мужчина со средней квалификацией получает больше, чем женщина с высшей квалификацией.
  2. Выполняя ту же работу, что и мужчина, женщины получают меньше зарплату — это наблюдается по всем категориям профессий. Только на не очень квалифицированных работах в аграрном секторе у женщин зарплата чуть-чуть выше.
  3. У женщин хуже складывается карьера: среди специалистов высокой и средней квалификации женщин почти три четверти, а среди руководителей — меньше половины. Значит, они реже идут на повышение.
  4. Среди должностей с низкими зарплатами женщин также намного больше.

UPD. Я думал, что gender gap в России вообще толком не изучают — но нашлась отличная статья! С графиками!

2018   done   dot plot chart   jobs   pie chart   russia   salary   static   table

Самые частотные слова русского и английского языков

Можно ли по частоте слов в русском и английском языке сделать какие-то выводы относительно языка и культуры?

Частотность слов в русском и английском языках (самые частые существительные, прилагательные и глаголы)

Различия в глаголах носят скорее грамматический характер. Прилагательные отражают только то, что у нас не особо распространена расовая проблематика. А вот существительные — это интересно. Английский список явно намного практичнее. Может быть, дело в подборе корпуса текстов — ну, значит, в английском практичные тексты более распространены, это примерно то же самое.

2018   done   language   static   table

Семейное положение россиян

Сколько осталось незамужних девушек моего возраста в России женатых, холостых, разведенных и вдовых по возрастным группам?

Количество незамужних, разведенных и холостых мужчин и женщин по возрастам в России Количество незамужних, разведенных и холостых мужчин и женщин по возрастам. Кавказ Количество незамужних, разведенных и холостых мужчин и женщин по возрастам. Московская область Количество незамужних, разведенных и холостых мужчин и женщин по возрастам. Москва

Брачную демографическую пирамиду с делением на децили я первый и единственный раз увидел в книжке 1898-го года, после чего почувствовал неудержимое стремление перерисовать по нашим данным — уж очень богатый на инсайты график.

Старая инфографика. Демографическая (половозрастная) пирамида

Любопытно сравнить, как делают брачные пирамиды сейчас. Выглядит свежо, но без сетки децилей — пустышка.

Брачная демографическая пирамида

И поучительный вывод, чтобы не забыть: если хочется сравнить разные регионы, то лучше сделать специальный график со сравнением, а не пытаться найти десять отличий в нескольких , почти идентичных картинках.

Статистика регионов России в картах

Сделали удобную справочник статистики регионов России в картах. Все ключевые социально-политическо-экономические показатели на одной понятной странице. Инджой!

Особенно люблю карту дотаций на человека в месяц и рост количества чиновников. В программе также зарплаты, демографический состав, условия жизни и ещё куча всего. Об обновлениях буду писать в пабликах: ВК, ФБ, Твиттер, Телеграм, Дзен.

2018   done   interactive   maps   russia

Гуманизация данных

Неделю назад известный дата-дизайнер Джорджия Лупи опубликовала манифест «Data Humanism».

Она пишет, что картиночки с циферками уже стали привычной частью медиа, хоть самой идее, что графическое изображение данных может иметь ценность для широкой аудитории, всего пара десятилетий. Спасибо интернету и другим технологиям, которые позволили обществу так быстро освоить новый язык коммуникации.

Теперь начинается вторая стадия дата-революции. Становится ясно, что визуализация данных — это не только способ сделать сложность съедобной. В мире больших данных и переизбытка информации это вообще единственный способ не сойти с ума. Рисовать данными, думать данными — и вдохнуть в данные нормальную человеческую жизнь.

Вот и я о том же! Интересно, сколько шагов было от названия «Графики и жизнь» до названия «Data Humanism».

2018   meta

Average Elo Rating of major European football leagues

Спарсил базу http://clubelo.com. Узнал, что такое JOIN и SELECT, подсчитал средний Эло высших дивизионов на выбранные даты. Хотелось сделать horserace chart топ-клубов, но не смог. Визуальные материалы получились такие.

Video

Interactive Chart

Статистика проката российского кино (2004—2017)

Услышал новость, что самым кассовым российским фильмом недавно стал мультик «Последний богатырь». А с учётом инфляции? Что вообще происходит с российским кино?

С помощью ParseHub собрал данные из «Бюллетеня кинопрокатчика».

С помощью «Статбюро» выровнял кассовые сборы по инфляции. Понял, что цифры получаются неточные, билеты ведь не единоразово продаются. И вообще, количество проданных билетов точнее показывает, на какой фильм люди больше ходили.

Интересней всего — что изменилось за прошедшие с 2004-го года 13 лет. Без промышленного анализа или, на худой конец, визуализации, действительно непонятно что. Картинку сделал просто в новом (прекрасном) Экселе. Стала понятней сезонность, но что происходит с кино — по-прежнему не ясно.

Параллельно прочитал детальнейший доклад Фонда кино «Российская киноиндустрия — 2016. Цифры и мнения». Стал понятен масштаб вопросов и то, что имеющихся данных для объяснения общей картины сильно недостаточно.

Дорисовал на график подписи, на этом пока всё. По количеству зрителей «Последний богатырь» — второй, «Девятая рота» — пятая, а первое место — у «Иронии судьбы-2».

Таблицу с данными выложил в папочку, если что-то из неё сделаете путное — пришлите посмотреть, интересно!

2017   cinema   column chart   done   excel   histogram   russia   static

Карта России с регионами, пропорциональными населению

Что это?

Для изображения социально-экономической статистики России я использую карту с площадью регионов, пропорциональной населению. Новые карты я публикую ВКонтакте и в Фейсбуке под хэштегом #картапролюдей. Вот любимые (2018-01-05):

Медианная зарплата в прожиточных минимумах по регионам. Карта-анаморфоза Валовый региональный продукт на душу населения по регионам. Карта-анаморфоза Коэффициент Джини (показатель неравенства доходов) по регионам. Карта-анаморфоза Динамика бедности по регионам. Карта-анаморфоза Рейтинг роста зарплат по регионам. Карта-анаморфоза Рейтинг изменения качества жизни по регионам. Карта-анаморфоза

Это приспособленная для повседневного использования анаморфоза Дмитрия Скугаревского. По ссылке — интерактивная версия и описание картографического алгоритма.

Почему?

Россия в силу своей своеобразной географии плохо получается на обычных картах. Плохо — значит, что картинка не адекватна реальности. Сравним две карты на одном наборе данных.

Это фрагмент карты «РИА Новости».

Это карта, анаморфированная по населению.

Сколько людей получают зарплаты выше 100 тысяч. Анаморфированная карта.

Первая карта говорит: на Севере — зарабатывают. Вторая карта говорит: ага, пара человек.

Зарплаты зарабатывают люди, а не гектары. И мы делаем карту про людей, а не про административно-территориальные границы.

Классическая карта подходит для социально-экономической статистики в одном случае: если вы имеете дело с регионами как статистическими единицами. Допустим, вы чиновник, которому нужно, чтобы не больше, чем в 10 регионах смертность была больше 20 у.е., а сколько там людей живет — дело другого департамента.

Планы и сотрудничество

  1. Я считаю, что карта, анаморфированная по населению, даёт верное представление о России, и что большая ошибка, что её не используют начиная со школьных атласов, и что это необходимо исправить.
  2. Когда одно из крупных медиа начнет использовать анаморфированную по населению карту — тогда я буду считать проект законченным.
  3. Следует сделать очень много карт. Если есть наборы данных — присылайте.
  4. Следует перерисовать карту, сейчас она довольно небрежная.
  5. Следует улучшить макет карты: подписи, географические объекты, верстка.
  6. Следует сделать интерфейс, с помощью которого любой пользователь мог бы создать карту на основе своего набора данных.
  7. Однажды кто-нибудь сделает аналогичный глобальный проект, возможно, на основе таких или таких карт.

История версий

Версия 1.2

Карта процент жителей, имеющих доступ в интернет
  1. Шрифт поменял на более узкий и более читаемый.
  2. Подписал все регионы
  3. В этот момент проект свернул в интерактивные, но не анаморфированные, карты. Потом от него отпочковалась еще плиточная карта — ну, к анаморфам вернемся попозже.

Версия 1.0.

  1. Отрисована и настроена для быстрого креатива карта Дмитрия Скугаревского.
  2. Цветовую схему взял у ColorBrewer. Отказался от градиента, чтобы нейтральным цветом отображалось более-менее медианное значение, светофорными красным и зелёным — отклонения.
  3. Цвета распределены по принципу equal intervals area. В общем случае — пять интервалов. В случае больших выбросов отдельных регионов добавляется шестой (синий), объединяющий экстремальные значения.
  4. Ладожское озеро перенес на границу между ЛО и Карелией.
  5. Добавил границы автономных округов (НАО, ХМАО, ЯНАО).
  6. Добавил избранные моря.
2017   done   maps   review   ria novosti   russia

Россия — не большая

Меня давно мучает мысль, что Россия кажется нам намного больше (и важнее), чем она есть на самом деле. И скопилось миллион разных карт. Подумал, ну, поэкспериментирую с их анимацией. И таблиц заодно. Первый ролик, показалось, был скучноватым, во втором безумия, пожалуй, многовато.

Источники

  1. Тема разных проекций раскрыта в миллионе разных видосов. Есть классные сайты: главный сайт антимеркаторовского движения, каталоги проекций раз и два.
  2. Источники карт почти не сохранялись, потому что обычно непонятно кто автор. Что осталось: великолепный tilegram российских регионов, ночные фотки Земли с сайта НАСЫ.
  3. Статистика по EEZ — ссылка уже битая, не знаю куда переехало.
  4. Статистика орошаемых земель — при фактчекинге нагуглил, что есть и другие цифры, но не стал сопоставлять, как что считается. Принципиально это картину бы не изменило, думаю.
  5. Статистика мясо- и рыбопроизводства: раз, два.

Процесс

  1. Туториал по склейке карт. Это вообще лучший, похоже, обучающий ресурс по Афтер Эффектсу. Общий принцип — что если нужно работать с огромным детализованным изображением, то нужно просто склеить нужные фрагменты, типа так
  1. Совершенно необходимый плагин для работы с anchor points, непонятно как без него вообще раньше жил.
2017   done   geography   maps   russia   video
Ранее Ctrl + ↓