Цифры против ЦИКа

ФОТО: ПАВЕЛ СМЕРТИН
       4/5 своего голоса избиратель отдает той или иной партии, а 1/5 — государству в виде налога, считает статистик Светлана Локоткова.

       7 декабря в России было проведено множество экспериментов по выявлению политической позиции граждан страны, обладающих правом голоса. Один из них проводил российский ЦИК: эксперимент назывался "Выборы в Государственную думу". Остальные проводились различными социологическими службами (РОМИР, ФОМ). Их эксперименты назывались exit polls. Сравнение данных первого и остальных экспериментов выявляет некоторые весьма интересные расхождения: они касаются результатов по КПРФ, "Яблоку", СПС и "против всех".
       Меньше всего данные ЦИКа расходятся с данными ФОМа. Последние и рассмотрим подробнее, тем более что начиная с 1996 года, когда ФОМ стал базовой социологической организацией предвыборного штаба Ельцина, основной заказчик и потребитель результатов исследований фонда — администрация президента. Все это время ФОМу приходилось обеспечивать обратную связь руководства страны с населением, а эта почетная обязанность налагает определенную ответственность. ФОМ, к слову, тратит огромные деньги не только на инфраструктуру и отлаживание технологии проведения опросов, но и на исследования о том, как правильно эти опросы проводить. Кроме того, в эксперименте ФОМа опрошено 120 тыс. человек — это гораздо больше, чем того требуют как статистические, так и социологические критерии достоверности. К примеру, на прошлых президентских выборах США в 2000 году, чтобы не ошибиться, хватило 13 тыс. опрошенных. А не так давно — на выборах губернатора Шварценеггера — служба Edison Media Research / Mitofsky Int. ограничилась всего 4214 опытами и угадала результат абсолютно точно.
       Итак, 7 декабря с 8.00 до 19.30 по местному времени на выходе с 12 тыс. избирательных участков в 674 населенных пунктах 75 субъектов федерации фонд "Общественное мнение" провел 120 тыс. опытов — по 100 человек на каждом участке. Каждому подопытному избирателю он задавал вопрос, за какую партию тот только что проголосовал.
       
       Чтобы не впасть в безответственные рассуждения на глазок, вспомним, что еще в начале XX века английский химик Уильям Д. Госсет работал на пивоваренном заводе Гиннесса и по условиям контракта не имел права открыто публиковать свои исследования. Поэтому он придумал себе псевдоним Student, которым и подписывал работы по статистике. Сейчас ученые самых разных специальностей — биологи, медики, социологи, физики,— когда хотят убедиться в достоверности своих экспериментов, используют коэффициент (или распределение) Стьюдента. Этот коэффициент позволяет определить допустимые границы ошибки эксперимента. В данном случае по результатам ФОМа с его помощью можно установить, в каком интервале значений находится с заданной вероятностью реальное распределение голосов избирателей, отданных за ту или иную партию.
       
       Интервал, в котором с вероятностью гамма может находиться погрешность, называется гамма-доверительным интервалом. Модуль гамма-доверительного интервала для некоей оцениваемой величины С (в данном случае это процент реально проголосовавших за ту или иную партию) рассчитывается по формуле, где n — объем выборки (в данном случае 120 тыс. опрошенных), Скрыш — эмпирическое значение C (в данном случае результаты exit polls), t (n; гамма) — значение распределения Стьюдента с параметрами n и гамма. Обычно значения коэффициента Стьюдента математики находят в таблицах, куда другие математики уже внесли тщательно выверенные результаты. Причем уже при n больше 40 разница в значениях столь несущественна, что принято считать n=бесконечности.
       Продемонстрируем расчет на примере СПС.
       Рассчитаем 0,999-доверительный интервал, то есть промежуток, в котором с вероятностью 99,9% находится истинное значение доли избирателей, проголосовавших за СПС. Скрыш(СПС), то есть опытное значение ФОМа для этой партии, равняется 4,7%. Гамма=0,999, n=120 000 (объем выборки). Табличное значение коэффициента Стьюдента, соответствующее уровню доверия (1+гамма)/2 и объему выборки n=бесконечности, равно 3,291. Подставив эти значения в формулу, получим: 0,201%.
       То есть с вероятностью 99,9% истинная доля избирателей, отдавших свои голоса за СПС, находится в промежутке от 4,499% до 4,901%.
       А теперь посмотрим на оценку ЦИКа для этой партии. Она равна 4,0%, то есть меньше значения ФОМа на 0,7 процентных пункта, или почти на 17,5%. Это означает, что данные ЦИКа для СПС находятся почти в 3,5 раза дальше границы, за которую они с вероятностью 99,9% по законам статистики выходить не должны.

       
       На графике представлены отклонения данных ЦИКа от данных ФОМа, нормированные на допустимый размер ошибки эксперимента для каждой партии. Значения, которые не выходят за пределы (-1;1), статистика позволяет считать достоверными на уровне 99,9%.
       Любому здравомыслящему человеку понятно, что наибольшего расхождения между данными ФОМа и ЦИКа можно ожидать для партий-карликов. Ведь ошибка ФОМа, допустим, на тысячу голосов исказит результаты каких-нибудь конституционных демократов на целый процент, а результаты "Единой России" — всего на 0,005%. Между тем сравнение данных ЦИКа и ФОМа показывает, что существенное расхождение в значениях достигнуто не столько на малых, сколько на средних величинах.
       Из графика 1 очень четко видно следующее. 11 позиций из бюллетеней находятся там, где им и положено быть с вероятностью 99,9%. 12 позиций вышли за эти границы, то есть приняли значения, которые у них могли появиться с вероятностью 0,01%. При этом в 2/3 случаев цифры ЦИКа завышены, а в 1/3 — занижены.
       Завышение результатов ЦИКа относительно ФОМа вполне объяснимо. Социологи утверждают, что по их опыту проведения разного рода исследований и замеров малые значения всегда искажаются сильнее и всегда в одну сторону. Связано это с тем, что представители немногочисленных групп могут просто не попасть в выборку.
       Гораздо интереснее выглядит нижняя часть графика. Сюда попали совсем не малые величины — от 4% до 12,7%, что уже странно. Невероятным образом оказались занижены позиции вполне солидных кандидатов — СПС, "Яблока", КПРФ и "против всех". Причем в абсолютных цифрах искажения по партиям подозрительно схожи: СПС — 372 тыс. человек, "Яблоко" — 414 тыс., КПРФ — 318 тыс. Совокупный размер этих странных искажений более 1,1 млн, то есть превышает 2% от числа всех граждан, пришедших на избирательные участки (если верить заявлению ЦИКа о том, что в выборах приняло участие 49% из 108,4 млн избирателей).
       Чтобы понять, насколько это удивительно, представьте себе, что человек в темной комнате должен найти любые шесть предметов. И вот он натыкается на шкаф, стол и пианино, не находит телевизор, портфель и телефонный аппарат, зато нашаривает зубочистку, ручку и канцелярскую скрепку. Того, кто подумает, что у испытуемого был с собой фонарик, вряд ли можно счесть чересчур подозрительным.
       Нарушение математических законов налицо, и никаким уровнем ошибки этого объяснить нельзя. Объяснить это можно только чьей-то волей: либо ЦИК занизил истинные результаты по указанным четырем позициям, либо ФОМ их завысил, либо избиратели упорно лгали ФОМу (например, проголосовав за Партию жизни, говорили, что отдали голос "Яблоку").
       Все эти версии можно считать одинаково правдоподобными, если бы не одно "но": результаты, объявленные ЦИКом, оказались ниже именно по тем позициям, которые не числятся среди фаворитов Кремля. Впрочем с точки зрения математики это не ответ на вопрос, и парадокс остается неразрешенным. А это значит, что нужно вводить новый набор аксиом и строить новую математическую модель выборов. Выглядеть она может так.
       1. Техническая ошибка любых российских выборов в абсолютном выражении может достигать 1,2 млн бюллетеней для всех, вместе взятых, партий-кандидатов.
       2. Относительная ошибка может достигать 20% по каждой партии или блоку.
       Приняв эти аксиомы, на следующие выборы мы пойдем четко понимая: каждый избиратель страны имеет право на 0,8 своего голоса. Поэтому через четыре года для преодоления семипроцентного барьера партии придется заручиться поддержкой как минимум 8,75% избирателей, которые к тому же не поленятся посетить в день выборов избирательные участки. Оставшимися 0,2 голоса может по своему усмотрению распоряжаться государство. Этот тариф должен быть закреплен законодательно и называться, например, выборный НДС.
       
Как сильно ЦИК отклонился от истины (график)

"Яблоко" могло преодолеть пятипроцентный барьер
       

Наименование избирательного объединения (блока) Exit poll ФОМ Размер допустимой ошибки Интервал допустимых значений ЦИК
1 Союз правых сил 4,70% 0,201% 4,499-4,901 4,00%
2 Российская партия пенсионеров и Партия социальной справедливости 3,30% 0,170% 3,13-3,47 3,18%
3 "Яблоко" 5,10% 0,209% 4,891-5,309 4,32%
4 Аграрная партия России 3,50% 0,175% 3,325-3,675 3,78%
5 "Родина" 9,20% 0,275% 8,925-9,475 9,10%
6 ЛДПР 11,60% 0,304% 11,296-11,904 11,60%
7 "Единая Россия" 36,90% 0,458% 36,442-37,358 37,10%
8 КПРФ 13,30% 0,323% 12,977-13,623 12,70%
9 Против всех федеральных списков кандидатов 0,061 0,227% 5,873-6,327 4,80%
 
 
       
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...