Пояснення: моделі прогнозування виборів у США та те, що могло статися не так у 2016 та 2020 роках
Незважаючи на те, що голоси все ще підраховуються, а дані все ще перебираються, американські аналітики почали міркувати про всю галузь прогнозування виборів, яка передбачала набагато більшу перемогу для обраного президента Джо Байдена, ніж те, що ми бачили минулого тижня.

Майже на наступний день після виборів у США соціологи та прогнозисти охоче визнали, що їхні моделі та опитування, здається, знову помилилися.
Незважаючи на те, що голоси все ще підраховуються, а дані все ще перебираються, американські аналітики почали міркувати про всю галузь прогнозування виборів, яка передбачала набагато більшу перемогу для обраного президента Джо Байдена, ніж те, що ми бачили минулого тижня.
Як американські статистики створюють свої моделі прогнозування виборів?
Моделі поєднують два типи чисел. По-перше, це основні принципи — фактори, які формують вибір виборців. Наприклад, як статус економіки впливає на шанси на посаді, або той факт, що партія виграла тричі поспіль лише один раз за останні 70 років.
Ендрю Гельман і Мерлін Хайдеманнс з Колумбійського університету, які створили модель агрегування опитувань для журналу Economist, написали: Як і більшість прогнозів, наша модель… застосовує минулі моделі поведінки виборців до нових обставин… «Як часто попередні кандидати на подібних посадах продовжували працювати перемогти?» Якщо ці історичні стосунки руйнуються, наш прогноз не спрацює.
Потім дослідники переглядають опитування (відповіді з репрезентативних вибірок). Модель усереднює опитування, зважує кожне відповідно до розмірів вибірки, а потім виправляє будь-які упередження. Нейт Сільвер, носій у спільноті прогнозування виборів і редактор відомого видання FiveThirtyEight, особливо відрізняє себе від опитуваного, заявляючи, що робота його організації полягає в тому, щоб зрозуміти, наскільки неправильними можуть бути опитування для створення імовірнісних прогнозів.
Остаточна модель поєднує основні показники із середніми опитуваннями. Маючи ці два типи інформації, дослідники проводять симуляції велику кількість разів, щоб визначити, скільки разів кандидат отримує понад 270 голосів виборців. У 1000 симуляцій, якщо Байден виграє 500 разів, він має 50-відсотковий шанс на перемогу. З наближенням дня виборів дослідники надають опитуванням більшу вагу над основними.
Також у Поясненні | Чому новообраний президент США Джо Байден навряд чи має на увазі Кашмір
Що сталося у 2016 році?
Математичні оракули американських виборів впевнено пророкували перемогу Гілларі Клінтон. Шановні провідні геодезисти дали Клінтон перевагу до чотирьох пунктів. У підсумку вона лідирує з 2,1 відсоткового пункту на голосуванні. FiveThirtyEight зіткнувся з жахом перед прогнозом, що Гілларі Клінтон має 70% шансів перемогти в Білому домі. Сільвер сказав, що люди виривають результати голосування з контексту.
The Economist писав: малоймовірний тріумф пана Трампа в 2016 році змусив багатьох кількісних прогнозистів на виборах виглядати безглуздо. Сем Ван, професор Прінстонського університету, пообіцяв з'їсти жука, якщо Трамп, який, за його словами, мав лише 1% шансів на перемогу в листопаді 2016 року, навіть наблизиться до перемоги. (Він вибрав цвіркуна.) Натисніть, щоб підписатися на Express Explained у Telegram
Посмертні дослідження таких установ, як Асоціація дослідження громадської думки, прийшли до висновку, що опитування мали занижену вагу для виборців без вищої освіти. The New York Times показала, що відсутність ваг за статусом освіти неправильно розрахувала підтримку Трампа на чотири пункти, що відповідає помилці. Багато в чому це була проста недооцінка того, скільки виборців були білими і не мали вищу освіту. Іншою помилкою стало те, що ті, хто запізнився, проголосували за Трампа більше, ніж передбачалося, і загальна явка виборців Трампа перевищила очікування.
Стверджуючи, що виправили помилки, статистики заявили, що винесли уроки з 2016 року.
Що сталося в 2020 році?
Немає сумнівів, що опитування пропущені (знову). Але ми не дізнаємося на скільки, поки не будуть підраховані всі голоси (включаючи оцінку відхилених бюлетенів). Тоді ми переоцінимо. Але я думаю, що справедливо зараз сказати, що в багатьох аспектах, включаючи політичні опитування, Трамп є sui generis, написав у Твіттері директор опитування в Монмуті Патрік Мюррей на наступний день після виборів.
Опитування показали, що Байден лідирував щонайменше на вісім процентних пунктів в останній відрізок передвиборчого сезону. Швидше за все, він виграє чотири-п’ять процентних пунктів. Навіть власні приватні опитування обох кампаній недооцінили кандидатів від республіканців.
На державному рівні прогнози виявилися ще більш хибними. RealClearPolitics і FiveThirtyEight перевищили прогнози для Байдена в кожному штаті, крім Арізони. Флорида, зокрема, була далеко від цілі; з майже чотирма балами, Трамп перевищив стан, який опитування в середньому передбачали для Байдена, на три бали. У New York Times і Washington Post Байдена відриває на 17 і 11 очок у Вісконсині. Поки що різниця в один відсотковий пункт. Перегони в Конгресі були ще гіршими, демократи були осліплені їхніми втратами.
Опитування (особливо на районному рівні) рідко вводили нас в оману, і на розпакування знадобиться багато часу, написав у Твіттері редактор Cook Political Report Дейв Вассерман на наступний день після виборів.
Читайте також | Хочете попереднього перегляду президента Байдена? Подивіться на хід кампанії
Що пішло не так?
Поки що рано говорити, але теорії почали просочуватися. Одна з теорій Зейнеп Туфекчі полягає в тому, що не вистачає даних минулого часу, щоб точно створити фундаментальні дані, оскільки фактори на виборах щоразу змінюються так істотно.
Інші потенційні відповіді можуть лежати в остаточних даних про явку. Нейт Кон з New York Times каже, що або 2020 рік створив новий набір проблем, або проблеми 2016 року, можливо, ніколи не були вирішені. Він схиляється до першого, головним чином тому, що оцінка освіти не змінила прогнози. Опитування показали, що білі виборці без вищої освіти повинні були голосувати за Байдена вищими показниками, ніж Клінтон, але остаточні результати показали, що вони не змінилися, як передбачалося. Ще одна помилка була в підрахунках старших виборців, яким прогнозували, що проголосують за Байдена на 23 бали більше, ніж за Трампа. Але насправді люди похилого віку не голосували за Байдена за вищими ставками.
Кон підкреслює, що це не помилки в оцінці розміру груп, а більше їх ставлення. Це пов’язано із заявами правого крила мовчазної більшості, яка голосує за Трампа, але приховує свої політичні переконання. Після невдач 2016 року опитування втратили довіру, і, можливо, менше прихильників Трампа були готові відповісти на запитання опитування.
Одним з очевидних потенційних факторів у цифрах була пандемія. Опитування до початку пандемії (з жовтня 2019 року по березень 2020 року) були більш точними, ніж на наближанні виборів. Одна з теорій припускає, що демократи, швидше за все, були замкнені в цей час і частіше відповідали на опитування, ніж республіканці. Відповіді за цей час збільшилися, і гарячі точки почали демонструвати більше підтримки Байдена. Іншими словами, це не була посилена підтримка Байдена; це було збільшенням ймовірності того, що прихильник Байдена відповість.
Це стосується проблем по суті чи презентації?
Деякі політичні дослідники кажуть, що проблема полягає в представленні чисел масовій аудиторії, а не проблема цифр. Наприклад, якщо Байдену дається 65% перемоги на виборах, це означає, що у нього є майже один з трьох шансів програти. Однак більшість виборців, які чують 65-відсотковий шанс, уявляють собі велику ймовірність.
Претенденти стверджують, що політичні оракули створили таку велику кількість помилок і застережень, що вони можуть сказати, що вони мали рацію, незалежно від результату, роблячи їх фактично марними. Сілвер різко дорікнув розповіді про те, що опитування були неправильними, написавши, що його організація правильно передбачила, що Байден зможе пережити звичайну або навіть трохи більшу помилку опитування і все одно виграти. Виборцям та ЗМІ необхідно перевірити свої очікування щодо опитувань — не обов’язково тому, що щось змінилося, а тому, що ці очікування вимагали нереального рівня точності — і водночас протистояти бажанню «викинути всі опитування» ... Якщо ви хочете впевненості щодо виборів. результатів, опитування не дадуть вам цього — принаймні, не в більшості випадків.
Як реагують установи та люди?
Хоча аналітики вважають за краще викладати свої аргументи в заперечення один одному, загальна рефлексія в усіх напрямках виглядає відносно цілісною: зменшіть одержимість опитуваннями.
Багато в чому американська демократія залежить від здатності зрозуміти, що думають наші співгромадяни. Це стало більш складним завданням, оскільки американці розбираються в ідеологічні бульбашки… Опитування громадської думки було одним із останніх способів зрозуміти, у що насправді вірять інші американці. Якщо опитування не спрацюють, то ми летимо всліпу, пише Девід Грем з Atlantic.
Деякі проблематизували всю саму гру чисел, а не лише ваги 2016 проти 2020. Сільвер прославився в прогнозуванні бейсбольних ігор, але на відміну від бейсболу... ця гра не завжди має передбачуваний набір правил, яких дотримуються всі гравці. У сигналі набагато більше шуму, який може заважати роботі алгоритму, сказав редактор Slate Politics Джошуа Кітінг.
Ми повинні взяти гроші, які витрачаємо на опитування, і ми повинні покластися на організацію на місцях. Як я розумію, Трамп мав людей на місці протягом року у Флориді. Мені б хотілося, щоб ми менше покладалися на опитування, тому що воно стає все менш досконалим, щоб отримати те, чого ми хочемо, сказала конгресвумен Праміла Джаяпал на вебінарі наступного дня після виборів.
Не пропустіть Пояснення | Чому американці не погоджуються щодо надання державності Пуерто-Ріко та Вашингтону, округ Колумбія
Новинарні організації так само більше інвестують в аналіз тенденцій в Інтернеті та висвітлення місцевих новин, щоб виправити помилки опитування.
Туфекчі сказав: Замість того, щоб оновлювати сторінку, щоб оновити прогнози, люди повинні були зробити єдине, що насправді впливає на результат: голосувати, жертвувати та організовувати. Як ми з’ясували, все інше в межах похибки.
Поділіться Зі Своїми Друзями: