2016年美国大选早已落下帷幕,结果让人大跌眼镜——特朗普在被民调一致看衰的情况下赢得了竞选。

1

各主流机构的最终预测,图片来自《纽约时报》网站

Five Thirty Eight是最看好特朗普的主流机构,他们认为特朗普的胜率约为29%。PEC的 Sam Wang 立下赌约:如果特朗普能够赢得240张以上的选举人票,他就吃虫子。结果就不多说了,我现在只想问Sam Wang 老师虫子口感怎么样。

2

苦主Sam Wang ,图片来自CNN

外媒对民调结果的讨论很多,可以肯定的是,民意调查系统性地低估了特朗普的支持率。根据 Five Thirty Eight 的测算,50个州里面,有41个州的民调结果都低估了特朗普。

在欢乐的网络时代,与其一味看热闹,不如来了解下民意调查有哪些套路,这次又在哪些地方栽了跟头。

 

民意调查的套路

民意调查是问卷调查的一种。在确立研究目的之后,问卷调查通常要经过准备、实施和分析三个阶段。

套路1:准备阶段

准备阶段有两项重要工作,抽样和问卷设计。抽样的目的是获取总体的代表性样本,问卷设计的目标则是得到准确的测量工具。

套路2:抽样

1.总体

抽样总体是研究者真正感兴趣的对象­­,它决定了调查结论的推论范围。

民调的目的在于了解选情,总体自然是投票者。然而,在选举之前,我们实际没办法准确地知道哪些人会投票,民调机构在调查时会通过一系列的问题甄别出“可能投票者”(likely voter)。

2.抽样框

在民意调查中,直接在总体中抽样是不可能的——没有人能在选举前将所有投票者登记在册。这是就要借助到抽样框。

抽样框应该尽可能覆盖研究总体。一个存在明显偏差的抽样框将导致难以挽回的错误,美国《文学文摘》杂志在1936年的民调就是前车之鉴。

7                    8

罗斯福   兰登
43% 《文学文摘》民调 57%
61% 大选结果 39%

《美国文摘》使用电话簿和车辆登记名单作为抽样框,导致样本偏向了富人,而大多数穷人都支持罗斯福。

近些年来民意调查以电话访问的形式为主,实际抽样框是有电话的家庭和个人。根据美国人口普查局的数据,2000年全美只有2.4%的家庭没有电话接入,抽样框的偏差已经小到几乎可以忽略。同时,随着互联网的普及(根据世界银行数据,2013年美国互联网覆盖率达到84.2%),基于网络的抽样也逐渐得到认可。

3.抽样设计

概率抽样是目前最为广泛的抽样方法,这种方法要求抽样框中的元素有同等概率被选中。

目前流行的抽样方法是随机拨号技术。这种技术有两个好处:一方面抽取规则是完全随机的;另一方面可以联系到没有登记的电话,解决了抽样框的问题。

4

套路3:问卷设计

在民意调查中,了解受访者投票倾向的题目往往出现在问卷的最前面,以避免其他问题对结果产生干扰。

问题的措辞对受访者的影响同样不可忽视,考虑以下两个题目,差别显而易见。

您认为二者之中,谁更具有领导人气质?A.希拉里·克林顿          B.唐纳德·特朗普难道希拉里·克林顿不比唐纳德·特朗普更具备领导人气质吗?A.是    B.不是

套路4:实施阶段

在调查实施阶段,受过良好训练、经验丰富的访谈员对调查的质量有着举足轻重的影响。现场访谈依赖于访谈员的素质,成本也更高,因此已经有公司尝试使用自动应答系统进行调查。

套路5:分析阶段

分析阶段有大量的案头工作,其中最重要的是依据总体人口特征对样本进行加权。即便是通过完全随机方法得到的样本,其构成也不可能和总体完全一致。在收回数据之后,通常需要根据总体特征进行加权处理。

 

套路不对,民调低估了特朗普

理论上讲,调查研究的任何阶段都会产生误差。但调查实施和分析阶段的误差通常可以得到有效控制,大多数人都认为误差大部分来自抽样。

5

图片来自www.qualtrics.com ,作者为 Dave Vannette

无应答误差:“害羞的特朗普支持者”

抽样框覆盖了98%的总体,并且抽样方法完全随机,这种情况下误差几乎不可能来自抽样的疏忽。换句话说,并不是抽样“遗漏”了特朗普的支持者,而是特朗普的支持者有意地“躲过”了民意调查。

大选前,面对惨淡的民调结果,特朗普团队为了鼓舞士气,坚持称民意调查的结果不足为参考,因为民意调查没法收集到“害羞的特朗普支持者”(shy trump supporter)的意见,这种原本受到嘲笑的观点,在事后看来,是诸多解释中最接近事实的。

为什么特朗普的支持者不愿意公开表达自己的观点?这是因为“社会期望效应”,特朗普的支持者迫于社会舆论的压力,不愿意在民调中表达自己的真实想法。一些研究发现,在电脑录音的情况下,特朗普的支持率比现场访问时更高。支持特朗普的女性也更加不愿意在民意调查中谈论她们的投票意向。

处理误差:小的处理误差被选举规则无限放大

为平衡人口大州和小州的矛盾,美国总统大选采取的是“选举人团制度”,简单的说,大选时,各州会将全部选举人票投给选民票最多的候选人,即“赢者通吃”。这点相当于是在数据处理时的加权处理,即使1%的偏差,在最终通过“选举人团制度”加权处理后,这个偏差就会极巨的放大。但一些民调时并没有考虑到制度本身可能带来的结果偏差,最终导致民调结果并没有更真实的反应现实情况。

时间误差

时间引起的误差是很容易被人忽略的。选举不是在真空中进行的,选民的投票选择是随着时间推移而变化的。民意调查只能测量受访者在某一时间点上的态度,对变化则无能为力。

有证据表明,那些临近投票日才做出决定的选民更加青睐特朗普,而不是希拉里。

6
上面的表格来自 CNN 出口民调的结果。似乎那些曾在民调中难以做出选择的民众,大部分最终选择了特朗普。

 

结语

问卷调查看似简单,但要想准确,仅靠简单的电话访谈和问卷填写远远不够,从前期抽样,确定执行渠道,到后期数据处理,不同的项目有不同的特殊情况,而调查中的每个细节对结果都会产生影响,只有在每个阶段对误差进行控制,结果才能更接近真实情况,否则,老司机也难免在阴沟里翻车。

喜欢(146) 评论(0) 分享

Leave a Reply

© 2017 JDC. All Rights Reserved.