美轮美换|美国大选中的民调是如何炼成的?

06.05.2016  16:02
来源:腾讯国际新闻

文/腾讯国际新闻海外观察员、“选·美”成员 纪东杰

本文系腾讯国际新闻独家约稿,未经授权,不得转载。

民调在美国大选中非常重要

在如今的美国大选中,民调扮演着非常重要的角色:媒体在做,民调公司在做,智库在做,参选人团队在做,而且他们还都要隔三差五地反复做。甚至直到投票那天,还会有各种机构堵在各投票点的出口,调查已经投完票的人,并据此来抢先一步预测结果。

如果将竞选人看作待售商品,竞选团队看作厂商,选民看作消费者,其他竞选人看作竞争品牌,那么民调就是在商品从设计到生产、包装和销售的整个过程中所进行的市场调查。

难以避免的民调误差

美国民众投票

民调的作用可以简单分为两类。首先,一次独立的民调结果,可以反映竞选人当前的民众支持程度,从而有助于制定战略——如果一个参选人支持率只有1%却坚持不退,那么他的战略很可能只是占据平台对某项议题发声,而并非做着入主白宫的春秋大梦。第二,连续多次的民调结果,则可以从结果的变化来评估竞选人在对应时间中的表现,从而有助于推敲战术——例如某个故事加了多少分,某个丑闻影响有多坏,下次要不要表现得更强硬等等。

早在1824年7月,宾州的《宾夕法尼亚人报》就在读者中进行了据称是首次的“无党派偏见的”模拟大选投票。结果显示,安德鲁•杰克逊(Andrew Jackson)335票,约翰•昆西•亚当斯(John Quincy Adams)159票,亨利•克莱(Henry Clay)19票,威廉•克劳福德(William Crawford)9票。不久,北卡罗来纳州的《罗利星报》也在调查中得到了差不多的结果。这两次调查都与三个月后的总统大选最终结果一致。不过杰克逊那届并没有当上总统,这是后话。

1824年大选中这两次民调的准确性之高为媒体发掘了一个新闻金矿;4年后的总统大选中,很多州的报纸都开始刊登自家的民调结果,以及选情预测分析等。不过实践发现,民调结果也并不总是准确的,影响因素之多常常令调查机构顾此失彼,一不小心就会酿成大错。在1936年大选中,《文学文摘》(The Literary Digest)就遭遇了一次滑铁卢,被钉在统计学系统性偏差经典案例的耻辱柱上。

文学文摘》当年邮寄出1000万份问卷,回收到230万份,数据不可谓不大。经过分析后,他们预测共和党候选人阿尔夫•兰登(Alfred Landon)会战胜罗斯福(Franklin Roosevelt)当选总统。结果却是罗斯福获得了压倒性的胜利——在48个州中胜出46个,普选票也拿到了60%多。尽管《文学文摘》此前准确预测过5次总统选举结果,但这次的惨败使他们不久就宣告破产了。

后来分析发现,《文学文摘》是按照电话号码本选出的这1000万调查对象,但在当年的美国,能装得起电话的往往都是较富裕阶层、持保守立场的共和党选民,而支持罗斯福的广大工人群体基本被排除在调查范围之外,由此在样本上造成了显著的系统性偏差。

影响民调结果的诸多因素

民众进行电子投票

那么如何对调查样本进行把控呢?1948年,美国咨询公司盖洛普(Gallup)采取了一种“配额抽样”的方法,希望按照登记选民的性别、种族、年龄结构等的比例关系来“精确”地制作样本。比如在圣路易斯市,他们要求调查员访问13名选民,这13人要符合6人住在郊区、7人住在城里,而且需要是7名男性和6名女性;这7名男性中又要有6名白人和1名黑人,且3人在40岁以下,4人在40岁以上;6名白人中又要求1位房租超过44美元,3位在18到44美元之间,2位不到18美元,如此种种。

要满足这样精细的要求就需要调查人员精心挑选,而使得样本无法通过随机的方式产生。更何况,登记选民的比例并不代表出来投票的人群分布,在瞬息万变的选情面前,这种做法无异于刻舟求剑。在那届大选中,盖洛普预测杜威(Thomas Dewey)会赢得大选,但最后入主白宫的却是杜鲁门(Harry S. Truman)。

其实直到今天,立场偏左的媒体(如 CNN)和立场偏右的媒体(如 FOX)在做民调时,也很有可能因为读者或观众群体阵营的区别而产生偏差,这是各方在统计数据时都需要努力克服的问题。不过,盖洛普在犯错后及时作出调整,时至今日已成为美国最具公信力的民调机构。

后来,民调内容也越来越丰富和细致,而不只是问你会投票给谁那么简单。比如民主党和共和党都有各自历年投票选民资料的数据库,他们可以就某些具体的议题征得选民的意见,从而更精准地把控竞选形势。不过,随着对民调的研究,人们也逐渐发现,问题设计的技巧也很可能会影响调查结果,甚至会左右被调查人的判断;这种民调也被称为“推手民调”(push poll)。

在冷战时期有一项很有意思的民意调查。一份问卷问美国人,是否赞成苏联的记者来美国调查采访,大约三分之二的美国人表示反对;但同一时期另一份问卷上的相同问题,却有四分之三的美国人表示赞成。这是因为在第二份问卷中,这个问题之前还有另一个问题,那就是是否赞成美国记者到苏联去访问;被调查者几乎都表示赞成,然后在对等原则等因素的影响下再看第二个问题时,也就倾向于允许苏联记者来美国了。

利用提问技巧来影响选民的案例在这届大选中也有发生。从共和党的角度来说,他们认为希拉里的实力更强,所以希望桑德斯胜出,于是有一个共和党的智库在内华达州初选前做了一项关于民主党支持率的调查。从问题设置的技巧可以看出,他们想达到为桑德斯背书并抨击希拉里的目的,比如提到桑德斯时,会问“你知不知道很多人批评桑德斯的经济政策,但最近有很多经济学家为他辩护?”之类的问题;而提到希拉里时,则会问“你知不知道 FBI 要就‘邮件门’事件起诉希拉里?”之类的问题。问卷最后问选民是支持桑德斯还是支持希拉里,很难说人们不会受到影响。

除了需要可靠的样本和中性的问题以外,人们后来又发现,哪怕仅仅是采集信息的方式不同,都可能造成结果上的显著差异。

美国皮尤研究中心(Pew Research Center)去年5月的一项调查发现,对于有些可能涉及“政治正确”等因素的争议性话题,在线问卷和人工电话获得的结果就相差不少。比如,当问到你是否认为社会对同性恋群体有严重歧视时,在电话采访中有62%的人认为有严重歧视,但在线网络问卷中这一数据只有48%。类似地,当问到是否认为社会对黑人存在严重歧视时,在接受电话访问的白人群体中,认为存在严重歧视的占50%,但在线问卷的相应结果只有37%。有分析认为,造成这样的结果是因为人们在面对真人打来的电话时,会产生心里负担,往往不愿意表露“政治不正确”的观点。

实际影响民调的因素还远远不止这些,而如何让民调更准确,则成为各路媒体、调查机构及竞选团队煞费苦心努力的方向。更准确的民调结果往往意味着更大的工作量、更高的成本和更长的时间。但资源是有限的,而民意是流动的;作为一项价值和难度都不可谓不大的工作,对民意调查的研究和实践也无疑会继续进行下去。