Книгопечатание в России: статистика и прогнозы
Статистика выпуска книжной продукции
Прогнозирование выпуска книжной продукции
От редакции
Материал для этой публикации готовился в октябре 2008 года. Тогда практически все руководители типографий, общаясь между собой, уже начали говорить о кризисе. Однако речь еще не шла о 20-процентной загрузке оборудования и переходе на трехдневную рабочую неделю
(ситуация января 2009 года). Однако в статье все осталось неизменным. Статистика прошлых лет от сегодняшних поворотов судьбы не зависит. Математические приемы как были математическими, так и остаются ими. А вот полученные результаты прогноза любопытно сравнить с реальностью и задуматься над возможностью моделирования библейского сна фараона о семи коровах. Хотя бы на примере книгопечатания.
Статистика выпуска книжной продукции
Официальную статистику выпуска книг в Российской Федерации ведет Российская книжная палата (РКП), куда по закону должно поступать всё, что напечатано в типографиях страны, а также за ее пределами, если в роли заказчиков печатной продукции выступают российские резиденты. Статистический учет специалисты РКП ведут по выпускным данным, сопровождающим печатное издание. Как отмечается в преамбуле ежегодного справочника «Печать в Российской Федерации в 2007 году», степень полноты и достоверности данных, обобщающих результаты издательской деятельности в стране, соответствует объему поступления обязательных экземпляров в Российскую книжную палату для библиографической регистрации, статистического учета и архивного хранения1. В переводе на житейский язык это означает, что в РКП присылают не все издания, а в выпускных данных поступивших изданий написано то, что нужно издателю, и это отнюдь не всегда правда.
Несмотря на все эти оговорки, статистика РКП является единственным и достаточно надежным источником сведений о российском книгопечатном деле. Согласно данным РКП, выпуск книжной продукции в России в 1940-2007 годах характеризуется цифрами, приведенными в графах 2-4 и строках 1-14 табл. 1. Значения среднего тиража и среднего объема (графы 5 и 6) — расчетные.
Временной отрезок с 1940-го по 2007 год охватывает разные периоды жизни страны, так или иначе сказавшиеся на отечественном книгопечатном деле. Анализ причин взлетов и падений книжного производства в это время не входит в задачу настоящей работы. Можно лишь отметить, что в социалистической плановой экономике в роли факторов, определявших объемы и структуру книжного выпуска, выступали ограничения идеологического и ресурсного характера. В наши дни главный фактор, регулирующий этот сектор экономики, — выгода, которую получают от производства книг книготорговцы, издатели и полиграфисты. Идеологические и ресурсные мотивы отсутствуют.
Таблица 1. Выпуск книг и брошюр в 1940-2007 годах
|
Годы |
Число книг и брошюр, ед. |
Общий тираж, тыс. экз. |
Печатные листы-оттиски, млн
|
Средний тираж, тыс. экз. |
Средний объем, |
1 |
2 |
3 |
4 |
5 |
6 |
|
1 |
1940 |
32 545 |
353 505 |
2151,7 |
10,9 |
6,10 |
2 |
1950 |
28 486 |
646 798 |
5472,0 |
22,7 |
8,50 |
3 |
1960 |
48 940 |
990 228 |
9983,2 |
20,2 |
10,10 |
4 |
1970 |
50 040 |
10 05 785 |
10 780,0 |
20,1 |
10,70 |
5 |
1980 |
49 563 |
1 393 226,5 |
15 047,4 |
28,1 |
10,80 |
6 |
1990 |
47 733 |
421 496,4 |
6427,4 |
8,8 |
15,20 |
7 |
2000 |
59 543 |
471 192,4 |
6906,1 |
7,9 |
14,70 |
8 |
2001 |
70 332 |
542 335,9 |
7661,4 |
7,7 |
14,10 |
9 |
2002 |
69 749 |
591 338,4 |
8785,4 |
8,5 |
14,90 |
10 |
2003 |
80 971 |
702 307,4 |
10 240,8 |
8,7 |
14,60 |
11 |
2004 |
89 066 |
685 881,3 |
9610,6 |
7,7 |
14,00 |
12 |
2005 |
95 498 |
669 401,8 |
8811,5 |
7,0 |
13,20 |
13 |
2006 |
102 268 |
633 524,1 |
8379,8 |
6,2 |
13,20 |
14 |
2007 |
108 791 |
665 682,7 |
9050,0 |
6,1 |
13,60 |
15 |
2008 |
109 447 |
678 253,0 |
9356,2 |
6,2 |
13,79 |
16 |
2009 |
108 953 |
724 228,2 |
10 317,5 |
6,6 |
14,25 |
17 |
2010 |
108 897 |
771 571,4 |
11 245,8 |
7,1 |
14,58 |
18 |
2011 |
111 080 |
799 794,1 |
11 768,8 |
7,2 |
14,71 |
19 |
2008 |
109 447 |
656 806,7 |
8752,0 |
6,0 |
13,3 |
20 |
2009 |
108 953 |
722 058,3 |
9811,2 |
6,6 |
13,6 |
21 |
2010 |
108 897 |
792 621,3 |
10 912,0 |
7,3 |
13,8 |
22 |
2011 |
111 080 |
834 741,8 |
11 441,5 |
7,5 |
13,7 |
Страна, выйдя из разрухи 90-х годов ХХ века, обнаружила себя практически в той же ситуации, в какой была после Великой Отечественной войны (речь идет о книжном деле): общий тираж книг и брошюр в 2000 году в полтора раза меньше, чем в 1950-м, общий листаж лишь на 26% больше уровня того же послевоенного года. Минувшие восемь лет (2000-2007 годы) тоже не были годами поступательного развития. До 2003 года наблюдался рост и общего тиража, и общего листажа, потом наступил спад, и только в 2007 году снижение этих показателей сменилось небольшим ростом, но надолго ли — вопрос, который волнует тех, кто непосредственно связан с книгопечатанием.
Прогнозирование выпуска книжной продукции
Прогнозы — дело столь же необходимое, сколь и неблагодарное. Когда прогнозы сбываются, то вроде бы так и должно быть, когда не сбываются — автор прогнозов рискует своей репутацией.
Среди массы методов прогнозирования множество относится к категории интуитивных, то есть построенных на соображениях, формализация которых или очень сложна, или совсем невозможна. Но есть и чисто математические методы, где интуиция используется только для оценки результатов, полученных математическим путем. В число таких методов входит экстраполяционное прогнозирование, сущность которого заключается в том, что тенденции, выявленные в базовом периоде времени, переносятся на прогнозируемый период и производится формальный математический расчет значений изучаемых показателей. В принципе для применения экстраполяционного прогнозирования требуется выполнение двух условий: первое — тенденция базового периода должна быть статистически существенной; второе — временной горизонт прогнозирования не может превышать половину базового периода.
Тенденция базового периода выявляется с помощью функций, аппроксимирующих фактическую траекторию изменений изучаемого показателя. О том, насколько аппроксимирующая функция близка к фактической траектории, судят по величине коэффициента детерминации B, который рассчитывается по формуле2:
где yr, ysr, yf — соответственно расчетное, среднее арифметическое и фактическое значения изучаемого показателя по годам базового периода. Квадраты отклонений расчетных и фактических значений от средней арифметической величины суммируются по всем годам базового периода. Коэффициент детерминации изменяется в пределах от 0 до 1. Чем ближе его значение к единице, тем явственнее проступает временная тенденция (тренд). Если речь идет о временном ряде одного показателя, существенность коэффициента детерминации проверяют с помощью выражения:
где t — статистика, имеющая t-распределение Стьюдента, B — коэффициент детерминации, n — число наблюдений (число лет в базовом периоде). Для того чтобы удостовериться в том, что вычисленный коэффициент детерминации действительно характеризует ту или иную степень близости аппроксимирующей функции к реальной динамике изучаемого показателя, полученное значение t-статистики сравнивают с табулированной величиной распределения Стьюдента при степенях свободы f = n-2. Если t > tтабл, то вычисленный коэффициент детерминации признается существенным3, то есть этой оценке можно доверять. В противном случае о качестве аппроксимации ничего определенного сказать нельзя.
Таблица 2. Аппроксимация кривых темпов роста показателей выпуска книжной продукции
Прогностические модели на базе аппроксимирующих функций |
|||||||||
Показатель |
Уравнение линейной зависимости |
Коэффи-циент детер-минации |
t-кри |
Уравнение степенной зависимости |
Коэфф |
t -крит |
Уравнение параболической зависимости |
Коэффи-циент детер-минации |
t-кри |
Число книг и брошюр, ед. |
y = 14,719x + |
0,985 |
20,054 |
y = 118,36 x 0,2895 |
0,935 |
9,275 |
y = 0,0607x2 + 14,173x + + 111,75 |
0,985 |
20,124 |
Общий тираж, тыс. экз. |
y = 5,7417x + |
0,550 |
2,707 |
y = 116,13 x 0,1726 |
0,782 |
4,635 |
y = –2,2435x2 + 25,933x + + 87,648 |
0,886 |
6,815 |
Печатные листы-оттиски, млн |
y = 3,3476x + + + 119,99 |
0,251 |
1,418 |
y = 113,56 x 0,1257 |
0,504 |
2,469 |
y = –2,2524x2 + 23,619x + + 86,2 |
0,706 |
3,795 |
Средний тираж, тыс. экз. |
y = –1,4048x + + 98,671 |
0,594 |
2,960 |
y = 98,398 x –0,1166 |
0,378 |
1,910 |
y = –1,1226x2 + 6,6369x + + 83,711 |
0,843 |
5,667 |
Средний объем, печ. л.-отт. |
y = –1,4048x + + 98,671 |
0,614 |
3,092 |
y = 98,344 x –0,0482 |
0,505 |
2,475 |
y = –0,0738x2 – 0,7405x + + 97,564 |
0,621 |
3,137 |
Прогностическая модель на базе степенной функции и гармонической компоненты |
|||||||||
Показатель |
Уравнение зависимости |
Коэффициент детерминации |
t-критерий Стьюдента |
||||||
Число книг и брошюр, ед. |
y = 118,36 x 0,2895 – (10,290cosα + (–2,244)sinα) |
0,9874 |
21,709 |
||||||
Общий тираж, тыс. экз. |
y = 116,13 x 0,1726 – ((–11,427)cosα + (–0,977)sinα) |
0,9332 |
9,153 |
||||||
Печатные листы-оттиски, млн |
y = 113,56 x 0,1257 – ((–14,346)cosα + 0,845sinα) |
0,8664 |
6,237 |
||||||
Средний тираж, тыс. экз. |
y = (98,398 x –0,1166) – ((–11,503)cosα +(–0,149)sinα) |
0,9375 |
9,488 |
||||||
Средний объем, печ. л.-отт. |
y = (98,344 x –0,0482) – ((–23 685)cosα + 1,106sinα) |
0,9968 |
43,024 |
Подтверждение существенности коэффициента детерминации является необходимым условием для использования аппроксимирующей функции в целях экстраполяционного прогнозирования. Но условие это недостаточно, потому что доказательство существенности коэффициента детерминации не означает тесной связи между изучаемым показателем и фактором времени (при этом следует понимать, что время, конечно, не является причиной изменений изучаемого показателя).
Очевидно, что бессмысленно прогнозировать что-либо во времени, если показатель и время слабо связаны между собой. Качественную оценку тесноты связи дают значения индекса корреляции, которые рассчитываются как корень квадратный из величины коэффициента детерминации. Канонических правил на этот счет не существует, но если R = B0,5 больше 0,9, то тесноту связи можно считать очень высокой, при 0,9 > R > 0,7 — высокой, при 0,7 > R > 0,5 — умеренной, при 0,5 > R > 0,3 — слабой, при 0,3 > R > 0,1 — очень слабой. Если R < 0,1, то связь показателя с фактором времени отсутствует. На наш взгляд, прогнозирование возможно тогда, когда коэффициент детерминации при описании фактической динамики аппроксимирующей функцией не меньше 0,5.
Важным для экстраполяционного прогнозирования является вопрос о длительности базового периода. Чем длиннее базовый период, тем лучше, но только в том случае, если на его протяжении не происходили события, резко менявшие условия существования прогнозируемого объекта. Российская история такой возможности не предоставляет. Поэтому в настоящей работе в качестве базового периода приняты годы с 2000-го по 2007-й, когда природные, техногенные и общественные катаклизмы обошли Россию стороной. Поскольку наш базовый период длился восемь лет, то корректное прогнозирование возможно не более чем на четыре года вперед, то есть на 2008-2011 годы.
Абсолютные натуральные показатели выпуска продукции (см. табл. 1) имеют разномасштабные измерители. По этой причине объектами для прогнозирования избраны темпы роста показателей по отношению к базе, за которую приняты значения показателей 1990 года, который стал рубежным между двумя моделями государственного устройства России. Динамика темпов роста в базовом периоде показана на рис. 1. Различный вид кривых динамики предполагает разные варианты выбора аппроксимирующих функций для использования в последующем прогнозировании.
Рис. 1. Темпы роста выпуска книжной продукции
В табл. 2 представлены аппроксимирующие функции (линейная, степенная, параболическая) и соответствующие им значения коэффициентов детерминации, которые, в свою очередь, проверялись на существенность.
Граничное значение t-статистики при уровне значимости в 0,05 для временного ряда из восьми наблюдений равно 2,36. Проверку на существенность выдержали все коэффициенты детерминации, за исключением двух случаев: при использовании линейной функции для описания динамики выпуска продукции, измеренного в печатных листах-оттисках, и при применении степенной функции для описания динамики среднего тиража изданий (в табл. 2 подчеркнуты).
При анализе формул, описывающих вычисленные зависимости, следует помнить, что в случае линейной функции положительный (отрицательный) коэффициент при аргументе свидетельствует о росте (уменьшении) функции с ростом аргумента. В случае степенной функции то же самое можно сказать, глядя на знак показателя степени. Когда в роли аппроксимирующей функции применяется параболическая зависимость, то следует учитывать наличие экстремума (максимума или минимума), после прохождения которого с ростом аргумента функция соответственно уменьшается или увеличивается.
В отличие от линейной и параболической функций, степенная функция при положительном значении коэффициента-мультипликатора и любых значениях показателя степени не заходит в отрицательную область, и это выгодно отличает ее от двух названных зависимостей. На рис. 2 показаны результаты прогнозирования по параболической (именно по ней достигаются максимальные значения коэффициентов детерминации) и степенной (наиболее умеренной из трех примененных функций) функциям.
а
б
в
г
д
Рис. 2. Прогноз выпуска книжкой продукции: а — количество названий; б — общий тираж; в — общий листаж; г — средний тираж; д — средний объем
Беглого взгляда на графики достаточно, чтобы понять, что прогноз по параболической функции не поддается логической интерпретации: как бы ни складывались дела в отечественном книгоиздании, трудно представить себе, что за четыре года оно сократится наполовину по общему тиражу и общему листажу, а средний тираж низведется чуть ли не до единичных экземпляров. Степенная функция, уступая параболической по точности аппроксимации, более соответствует представлениям об инерционности происходящих процессов. В то же время отклонения расчетных значений изучаемых показателей от их величин в базовом периоде выглядят весьма значительными (рис. 3), чтобы задуматься о поиске уточненной прогностической модели.
Такая модель может быть представлена в общем виде следующим образом4:
где yr — интегрированное расчетное значение показателя; первое слагаемое — значение показателя, вычисленное по трендовой функции; второе слагаемое — ожидаемое отклонение от тренда в k-й период времени, tk — фактор времени; ek — вероятностная ошибка.
Рис. 3. Динамика отклонений от тренда (степенная функция)
Обратившись еще раз к рис. 3, можно отметить, что кривые отклонений фактических значений изучаемых показателей от вычисленных по степенной функции по внешнему виду напоминают фрагменты синусоиды. Для формирования уточненной прогностической модели в этом случае может быть привлечена гармоническая составляющая, и тогда прогностическая модель примет следующий общий вид:
где СxB — аппроксимирующая степенная функция, (Acosα + Bsinα), — гармоническая компонента, построенная на отклонениях фактических значений от расчетных по аппроксимирующей функции. Ее параметры отыскиваются с помощью преобразований Фурье5. Результаты прогноза по уточненной модели приведены в строках 15-18 табл. 1 (выделены светлым курсивом).
Графическое представление уточненных прогностических моделей по каждому из рассматриваемых показателей выпуска книжной продукции показано на рис. 4, где можно наглядно наблюдать их приближение к фактической динамике базового периода. Во второй половине табл. 2 приведены уравнения зависимостей, коэффициенты детерминации и значения t-статистики для каждой из них, подтвердившие существенность коэффициентов детерминации, которые, в свою очередь, свидетельствуют об очень тесной связи изучаемых показателей с фактором времени. Следует еще раз повторить, что фактор времени не является причиной изменений показателей, но в нем в неявном виде интегрированы реальные факторы, вызвавшие эти изменения.
а
б
в
г
Рис. 4. Прогноз выпуска книжной продукции: а — количество названий; б — общий тираж; в — общий листаж; г — средний тираж и средний объем
Такие абсолютные показатели книжного выпуска, как количество названий, общий тираж и общий объем, не зависят друг от друга, тогда как значения среднего тиража и среднего объема одного экземпляра определяются расчетным путем, исходя из значений абсолютных показателей. В то же время и тот и другой показатели обладают во времени большей устойчивостью, чем абсолютные показатели, что следует из меньших по модулю значений коэффициентов при аргументе в уравнениях линейной зависимости и значений степени в уравнениях степенной зависимости (см. табл. 1). Это дает повод воспользоваться прогнозом именно данных показателей как базовых, присоединив к ним в качестве базового показатель количества названий книг в силу однозначности его динамики, для вычисления значений общего тиража и общего листажа книжных изданий. Результаты этого прогноза показаны в табл. 1 (строки 19-22, выделенные полужирным курсивом). В целом прогноз, выполненный таким способом, более пессимистический, чем предыдущий вариант, но разница между ними находится в пределах от –6,5 до 4,5%, что вполне допустимо для среднесрочных прогнозов.
Если представленные прогнозы сбудутся, то можно считать такую динамику для российского книгопечатания благом. Если же не сбудутся, то смотрите коллаж в начале статьи.
1Печать в Российской Федерации в 2007 году. М.: Российская книжная палата, 2008. С. 4.
2Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа: Рук. для спец./ Пер. с нем. и предисл. В.М. Ивановой. М.: Финансы и статистика, 1983. С. 102.
3Там же. С. 201-202.
4Юзбашев М.М., Манелля А.И. Статистический анализ тенденций и колеблемости. М.: Финансы и статистика, 1983. С. 147.
5См., напр.: Вайну Я.Я.-Ф. Корреляция рядов динамики. 1977. С. 25-34.