3 заметки с тегом

column chart

 528   2018   area chart   business   cars   column chart   done   russia   scatter chart   treemap

Статистика проката российского кино (2004—2017)

Услышал новость, что самым кассовым российским фильмом недавно стал мультик «Последний богатырь». А с учётом инфляции? Что вообще происходит с российским кино?

С помощью ParseHub собрал данные из «Бюллетеня кинопрокатчика».

С помощью «Статбюро» выровнял кассовые сборы по инфляции. Понял, что цифры получаются неточные, билеты ведь не единоразово продаются. И вообще, количество проданных билетов точнее показывает, на какой фильм люди больше ходили.

Интересней всего — что изменилось за прошедшие с 2004-го года 13 лет. Без промышленного анализа или, на худой конец, визуализации, действительно непонятно что. Картинку сделал просто в новом (прекрасном) Экселе. Стала понятней сезонность, но что происходит с кино — по-прежнему не ясно.

Параллельно прочитал детальнейший доклад Фонда кино «Российская киноиндустрия — 2016. Цифры и мнения». Стал понятен масштаб вопросов и то, что имеющихся данных для объяснения общей картины сильно недостаточно.

Дорисовал на график подписи, на этом пока всё. По количеству зрителей «Последний богатырь» — второй, «Девятая рота» — пятая, а первое место — у «Иронии судьбы-2».

Таблицу с данными выложил в папочку, если что-то из неё сделаете путное — пришлите посмотреть, интересно!

 668   2017   cinema   column chart   done   excel   histogram   russia   static

Статистика книгоиздания (Российская империя, СССР, Россия)

Российская книжная палата публикует ежегодную статистику книгоиздания в виде таблицы, которая вставлена в Ворд, который лежит в папке, которая заархивирована, и ссылка на архив лежит на сайте. Но это не главное.

Например, нашёл, ты данные за 2016-й год, а много это? Мало? Непонятно.

Источники

  1. 1901 — Баренбаум И. История книги, 1984. Ссылки на первоисточник нет;
  2. 1908—1913 — Дойникова Л. П. Книги, печать и периодика в Российской Империи. Первоисточник — первые «Книжные летописи»;
  3. 1940—1990 — РКП;
  4. С 1992 — Госстат, на основе данных РКП.

Сводная таблица

Комментарии

  1. Непонятно, как лучше изображать дырки в данных;
  2. Сравниваются разные территории, разное население, разные языки;
  3. Сейчас РКП собирает точно не 100%-корректную статистику. Они основываются на обязательных экземплярах, а все больше издательств их в Палату не отправляет;
  4. И чтобы не забыть: данные были с разной размерностью (миллионы, тысячи, штуки). Вот не следует округлять данные без лишней надобности.
 714   2017   business   column chart   done   history   interactive   publishing   scatter chart