Quell’errore aprì la strada a metodi di rilevazione più scientifici, come quelli sperimentati da George Gallup, basati su una logica semplice: “Se si riesce a creare un campione veramente casuale dalla popolazione più ampia che si sta studiando – in cui ogni persona ha la stessa probabilità di essere inclusa nel sondaggio – allora si possono ottenere risultati sorprendentemente accurati da un numero ragionevolmente piccolo di persone. Quando questi presupposti sono corretti e il sondaggio si basa su un campione veramente casuale, ai sondaggisti bastano circa mille persone per produrre un risultato con un margine di errore di più o meno tre punti percentuali, cioè abbastanza affidabile”.

Per anni si è cercato di capire i motivi di quell’enorme scostamento statistico. “Analisi più recenti”, ha raccontato Brian Klaas sull’Atlantic , “hanno dimostrato che, per ragioni non chiare, i sostenitori di Landon erano molto più propensi di quelli di Roosevelt a rispedire indietro le schede, e questo inficiava completamente l’attendibilità del sondaggio”.

All’inizio del novecento, prima delle elezioni presidenziali la rivista Literary Digest inviava ai lettori schede elettorali campione, chiedendogli di mandarle indietro compilate. Era uno dei primi sondaggi condotti su scala nazionale, rudimentale ma apparentemente efficace. Con questo metodo la rivista riuscì a prevedere il vincitore di cinque elezioni presidenziali, dal 1916 al 1932. Ma nel 1936 , quando si sfidavano il presidente Franklin D. Roosevelt e il repubblicano Alf Landon, qualcosa andò storto . Il Digest inviò dieci milioni di schede elettorali ricevendone indietro 2,4 milioni, un tasso di risposta molto alto. Sulla base di quelle schede, il giornale predisse che Roosevelt avrebbe preso solo il 41 per cento dei voti, una batosta epocale. Il presidente vinse invece con il 61 per cento dei consensi, conquistando tutti gli stati tranne due, in una delle elezioni meno incerte della storia statunitense.

Oltre alle questioni pratiche su come raggiungere gli elettori, c’è il problema di come le persone tendono a rispondere a domande sulle loro posizioni politiche. Negli anni gli esperti hanno coniato l’espressione social-desirability bias, cioè la tendenza degli intervistati a mentire ai sondaggisti sul loro probabile comportamento di voto. Negli Stati Uniti è un tema più delicato che altrove, perché il fattore razziale ha un peso importante, spiega Klaas: “Se una campagna elettorale contrapponeva un candidato di minoranza a un candidato bianco, alcuni intervistati bianchi potevano mentire e dire che avrebbero votato per il candidato di minoranza per evitare di essere percepiti come razzisti”.

“All’inizio i sondaggisti selezionavano persone a caso dall’elenco telefonico, ma questo metodo è diventato problematico quando alcune persone hanno cominciato a togliere i loro numeri dall’elenco: questi elettori condividevano alcune caratteristiche demografiche, quindi la loro assenza alterava i campioni”. Per un po’ il problema è stato risolto quando i cellulari hanno preso il posto dei telefoni fissi, ma oggi che gli smartphone consentono di identificare le chiamate indesiderate gli elettori che rispondono sono sempre meno. Cosa ancora più importante, “la maggior parte degli americani trascorre gran parte del proprio tempo online, ma non esistono metodi affidabili per ottenere un campione veramente casuale di utenti di internet”.

I sondaggisti aggirano questi problemi facendo di volta in volta degli aggiustamenti. Un esempio: se un campione di sondaggi ha il 56 per cento di donne, ma il sondaggista ritiene che l’elettorato finale sarà composto per il 52 per cento da donne, potrebbe dare un po’ più di peso agli intervistati di sesso maschile nei risultati. In questo modo si dovrebbero poter ridurre gli effetti distorsivi ed elaborare un campione che sia il più rappresentativo possibile. Alcuni analisti sono più bravi di altri a farlo (per questo non tutti i sondaggi sono considerati affidabili allo stesso modo) ma le loro correzioni, per quanto ragionevoli, sono pur sempre basate su interpretazioni soggettive su come potrebbe essere composto l’elettorato il giorno del voto.

Tornando all’esempio fatto in precedenza: se alla fine le donne andassero a votare più di quanto previsto, la correzione sarebbe sbagliata e il sondaggio meno affidabile. In altri casi gli istituti di sondaggi fanno aggiustamenti tenendo a mente gli “errori” delle elezioni precedenti. Visto che nel 2016 e nel 2020 il consenso di Trump è stato superiore a quello registrato nei sondaggi, in vista del voto di domani gli istituti hanno introdotto delle novità che dovrebbero aggirare il problema; per esempio chiedono agli elettori se hanno votato nel 2020 e per chi, e poi costruiscono il campione di conseguenza. Ma rispetto a quattro anni fa l’elettorato è cambiato, e non sempre le persone ricordano se hanno votato e per chi.