Это каталог работ. Новые штуки появляются сначала в пабликах: Ютуб + (Телеграм = ВК = ФБДзен). До сайта когда-нибудь дойдут руки, наверное

Позднее Ctrl + ↑

История России в демографических пирамидах (1897 — 2036)

Мне не хватает содержательных видео в Ютубе. Мне кажется перспективным сочетание анимации, инфографики и обычного нарратива. Мне теперь сложно объясняться словами, всё мыслится теперь видосами. Короче, первая проба — про демографию.

Источники данных

Переписи 1897 — 2010. Пришлось кое-что собирать руками, например, суммировать перепись 1897-го года по губерниям. Можно было заморочиться с подсчетом населения в границах РФ, но не. Итоговую таблицу выложил, ссылка будет.

2017.

2026 — 2036. Здесь есть прогноз на каждый год, но было не так сильно нужно. Потому что непонятно, как из такой страницы собрать данные.

Сколько рожают женщины, в зависимости от возраста.

Прогноз по смертности.

Выложил итоговую таблицу с использованными данными.

UPD. Данные, которые тоже надо было использовать

Обзорный пост, который дает сразу несколько направлений движения.

«Демографическая модернизация России» — монументальный труд по современной демографии

Коэффициенты рождаемости в России и по миру

The Human Mortality Database

Здесь разбор фактологии нашего ролика от настоящего демографа. Я думал, будет больше ошибок :)

Источники остального

Fallen: павшие во Второй мировой войне — это вообще величайшее видео на свете. В нём нравится огромный пакет данных, программирование данных на веб (многие говорят, что данные хотелось бы в удобном для себя темпе изучать), мощный посыл, который становится очевиден только благодаря данным, не говоря уж просто про исполнение. Хотелось бы однажды сделать что-то такое. Но при этом мистер Хэллоран полтора года ничего не выпускал, а когда выпустил — получилось как-то вторично.

Статья «Эволюция рождаемости за полвека»

Исследование РБК: как власти впустую потратили 1 трлн рублей на материнский капитал

Коллекция старых документов. Здесь есть полиграфия со всех переписей, но она в конечном счете не вошла в видео.

Мормоны заморачиваются насчет генеалогии. Здесь нашел сканы переписных листов 1897-го года. Прям целой Тобольской губернией — фантастика. .

Процесс

Пирамиды делал в Афтер Эффектсе. Помог вот этот туториал. Каждая пирамида состоит из двух композиций. В одной 101 столбик мужчин, в другой 101 столбик женщин. Масштаб столбиков смотрит в файл. В файле переменные. Значения переменных из Экселя. Композиции я обводил кривыми и анимировал кривые. Это абсолютно конский способ, не делайте так никогда. Если уж устраивает такой результат, то проще было бы нарисовать графики в том же Экселе или Табле, а потом обвести кривыми. Ну, зато научился брать данные из файла.

Как, видимо, НАДО было сделать: каждому столбику задавать ряд значений 1897 — 2036 в зависимости от времени T1 — T12. Время вешается на слайдер-контрол. Неочевидно только, как этим потом управлять, например, скоростью анимации. Непонятно. Если знаете как — пожалуйста, подскажите.

Можно было бы собрать данные не по переписям раз в 10 лет, а по каждому году (но только с 1950), и тогда получится намного более крутая анимация. Еще можно было бы сделать видео хоть про каждую страну мира, только подавай данные, но, что удивительно, не нашел источников! У нас вообще не так все плохо с открытостью данных.

В любом случае, пора уже выпускать, поэтому всё так как есть. В целом, смысл даже не конкретно в этом видео, а в том, что делать не тупые видео — очень кайфово и, вероятно, будет востребовано. Если интересно поработать вместе — пишите.

Конкурс видео «Тинькофф-банка»

Мне нравится «Тинькофф-журнал», поэтому очень хотелось поучаствовать в конкурсе. Пытался выделить из большого ранее задуманного материала про классы российского общества то, что можно успеть сделать до дедлайна. Занял 31-е место из 101-го участника.

Неплохо:

  • Краткость.

Плохо:

  • Не иметь тезиса (вступление, основная часть, выводы). Просто дать какие-то данные — это непонятно. Как будто пассивно-агрессивно тыкаешь какими-то таблицами людям в лицо.
  • Данные пришлось чересчур упростить.

Надеюсь выпустить толковое видео про работы и зарплаты, это вообще очень удивительная тема.

2017   done   economics   tinkoff bank   video

Статистика книгоиздания (Российская империя, СССР, Россия)

Российская книжная палата публикует ежегодную статистику книгоиздания в виде таблицы, которая вставлена в Ворд, который лежит в папке, которая заархивирована, и ссылка на архив лежит на сайте. Но это не главное.

Например, нашёл, ты данные за 2016-й год, а много это? Мало? Непонятно.

Источники

  1. 1901 — Баренбаум И. История книги, 1984. Ссылки на первоисточник нет;
  2. 1908—1913 — Дойникова Л. П. Книги, печать и периодика в Российской Империи. Первоисточник — первые «Книжные летописи»;
  3. 1940—1990 — РКП;
  4. С 1992 — Госстат, на основе данных РКП.

Сводная таблица

Комментарии

  1. Непонятно, как лучше изображать дырки в данных;
  2. Сравниваются разные территории, разное население, разные языки;
  3. Сейчас РКП собирает точно не 100%-корректную статистику. Они основываются на обязательных экземплярах, а все больше издательств их в Палату не отправляет;
  4. И чтобы не забыть: данные были с разной размерностью (миллионы, тысячи, штуки). Вот не следует округлять данные без лишней надобности.

«Школа злословия»: время выхода в эфир

Люблю программу «Школа злословия». Но вот этот текст из Википедии вообще не понимаю.

Данные

Переписываю данные руками в таблицу. Чувствую себя идиотом, но другого решения не вижу.

Пока переписываю, вижу что время выхода в эфир иногда указывается как «в 0:55/1:00». Ну, запишем среднее на глазок, — подумал я. Ближе к концу появляются монстры типа «0:55/1:00/1:30/1:35/1:50/1:55/2:30». Что это значит? Полез в программу телепередач, проверил последние 14 выпусков (на сайте НТВ есть архив телепрограммы). Выяснилось, что правда. Сегодня эфир в 2.30, а на прошлой неделе был в час ночи. Данные из телепрограммы запишем в таблицу для очистки совести, но в целом учитывать не будем, потому что может сложиться впечатление, что прыгать время эфира стало только в конце жизненного пути программы, а это нифига не факт. Но ведь в Википедии время эфиров уже изначально указано с разной точностью? Эх, полный фейл. Будем считать, что для наших целей (понять, как именно программа уплывала в ночной эфир) это не сильно важно.

Вики пишет, что снят был 431 выпуск, у меня количество выпусков получилось на 20% больше. Ну, учел перерывы между сезонами, осталось 485. Добрый человек сделал машиночитаемый список, в какой программе какой гость был, пытаемся соединить таблицы. Остается много смутных мест. Пытаюсь прояснить ситуацию по косвенным уликам (блоги, новости, программы телепередач). Потратил час на выяснение, грубо говоря, выходил ли выпуск передачи 2 июня 2003 года и кто там был. Понял, что в интернете просто нет достоверных данных, а ошибки копируются и еще больше путают. Помогли бы архивы телеканалов, конечно, но добывать их — уже чересчур.

Итоговую таблицу с данными выложил, может кому-то понадобится.

Картинка

Время: если программа переехала с 23:50 на 01:10, как это показать на одной оси? Формат данных задаем как [HH] :MM:SS (в двух квадратных скобках), считаем абсолютное количество часов. «01:10» превращается в «25:10». Уродски, но понятно.

Дни недели: за 12 лет существования программа ездила по сетке от вечера среды до поздней ночи понедельника. Если брать 15-минутные интервалы, в промежутке получится больше 500 делений. Ничего не видно. Может, выбрать только значимые промежутки? Сделать отклонение от прайм-тайма? Думаю, достаточно было бы раскрасить дни недели разными цветами, но как это сделать в Опен.Офисе, непонятно.

И что в итоге? Имеем время начало эфира и длительность, получаем время конца эфира. Отображаем начало и конец биржевой свечкой. Что-нибудь подписать в Фотошопе? Попробуем. Ну и, в принципе, всё, тупик.

Итого

Данные не слишком корректны. На графике плохо видно динамику сползания в ночной эфир из-за масштаба. Плоховато видны сезоны и длительность программы. Совсем не видны дни недели.

Ставим себе трояк за старание, публикуем, потому что отрицательный результат — это тоже результат.

2016   candlestick   done   static   tv

Рейтинг доброты стран

Опубликован рейтинг «какая страна делает больше всех добра» — это заинтересовало. Мне вообще очень интересны разные интегральные показатели. Вообще, взять бы один показатель и им ВСЁ измерить.

Саймон Анхольт выбрал семь основных мировых проблем: наука, культура, безопасность, международное сотрудничество, экология, социальное неравенство, здоровье населения. Внутри каждой проблемы нашел измеримые параметры, посчитал, сколько в них вкладывают государства, относительно своего ВВП, и вот (сравнительную таблицу сделал я в «Инфограмме»):

В оригинале есть расшифровка итогового места по 35 параметрам.

Методология

Рейтинг считался два раза, и, видимо, по разной методологии. В 2014-м году Кения заняла неожиданное 24-е место. Вьетнам занимал предпоследнее, 124-е место, в 2016-м — 98-е из 163. То же с Азербайджаном. Но методология описана одна. Так делать нельзя, конечно.

Семь рубрик, внутри каждой пять параметров. Например, критерий «Какая страна больше всего вкладывает в мировой научный прогресс» складывается из пяти частей:

  • сколько в стране иностранных студентов;
  • сколько экспортируемых научных журналов;
  • сколько статей в международных рецензируемых журналах;
  • сколько международных патентов;
  • сколько Нобелевских лауретов (страна происхождения считается).

Поделили на ВВП. Отранжировали. Высчитали среднее место каждой страны — вот итоговая позиция по рубрике «Наука, технологии и знания». И так 7 рубрик.

Проблема, как обычно, в измеряемых параметрах. В рубрике «Мир во всем мире» считается количество миротворческих войск за рубежом, в рубрике «Культура» — количество безвизовых стран и территорий, ну и дальше не менее спорно. В каждой рубрике ровно пять пунктов, а это явно не тот случай, когда нужно стремиться к симметричности. Получается, что рождаемость (чем выше рождаемость — тем ниже позиция, перенаселение все-таки) и изменение площади лесопосадок за последние 20 лет вносят одинаковый вклад в показатель доброты страны. Шизофрения.

Автор рейтинга Саймон Анхольт — политический консультант, специалист по маркетингу территорий. Мотивация создания — ему не хватало интегрального показателя привлекательности страны, показателя, который бы хотели повышать его заказчики, небогатые и бедные страны. Вместе с корпорацией GFK он делает закрытые рейтинги национальных брендов, а рейтинг доброты, видимо, — демо-версия, пригодная для выступления на ТЕДе.

Короче, в итоге оказалось, что в рейтинге, на самом деле, сравнивается вклад государств в общее дело спасения человечества. Реализация хромает, но концепция заставляет освежить взгляд на задачи государства в целом.

Хорошо

Придумывать интегральные показатели.

Думать о роли государства в современном мире и всеобщем благе человечества.

Брать не пригодившийся для работы материал и распространять его бесплатно. Это и реклама, и практика.

Придавать идеям съедобный вид. Рейтинг «Какая страна добрее всех» — ну, красота! По-русски, к тому же, кажется, что это рейтинг «Какая страна ЛУЧШЕ всех». 2 миллиона просмотров на ТЕДе.

Плохо

Брать случайные наборы цифр.

Публиковать два явно разных рейтинга и одно описание методологии.

Путаться в том, что хотелось посчитать, и что в итоге посчиталось. Назвать бы рейтинг «Вовлеченность в дела ООН» (все показатели от статбюро ООН) — и никаких проблем.

Внутри опубликованной таблицы есть расшифровка параметров, а их значений нет. Сортировок, сравнения рейтингов по годам тоже нет.

Непонятно

Приемлемо ли брать несколько рангов и высчитывать среднюю занятую в них позицию? В одном рейтинге я занял 2-е место, во втором — 12-е. В каких случаях и по какой модели считать, что в среднем я занял, грубо говоря, 7-е место? А если занял 2-е из 120 и 15-е из 141?

Если сравнить экономические рейтинги и интегральные, типа рейтинг индекса развития человека, счастья, качества жизни и т. д. — найдутся ли страны, где культурное, социальное или прочее развитие идут быстрее экономического?

2016   done   global   interactive   rating   review

Hey

Привет! Я без картинок ничего не понимаю, поэтому здесь буду пытаться понять интересные мне предметы, а в твиттере — собирать ссылки на то, как это делают крутые ребята.

2016