你是怎樣“被平均”的?細數統計數據中的那些坑
我們使用統計數據(通常以不合適的方式)來揭示戰爭傷亡人數的增加或減少,提醒公眾注意發病率的變化,測量一種新產品的銷量,判斷某一只股票的賺錢能力,決定下一張牌是A的概率,衡量不同大學的畢業率,記錄不同年齡段的人們性生活的頻率,為很多其他問題提供資源和信息。
統計數據(statistics)就是用數字表達出來的證據。這樣的證據可能看起來非常動人,因為數字讓證據顯得非常有科學性,非常精確,似乎它就代表了“事實”。但是,統計數據能,而且經常會,撒謊!它們并不必然就能證明它們想要證明的一切。
兩種不同的提供數據的方式有可能會產生欺騙性:
小貼士:統計數據可能而且經常騙人。它們并不必然就能證明表面上想要證明的一切。
作為一個會思考和判斷的人,你應該努力辨別出錯誤的統計數據式的論證。在幾個較短的段落中,我們無法向你全面展示人們用“統計數據幫忙撒謊”的所有不同方法。但是,本文我們將為你提供一些基本策略,這樣你就可以用來發現這些騙人的小伎倆。
同時,它還通過展示許多作者錯誤使用統計數字來當證據的最常見的方法,提醒你注意數據論證中存在的缺陷。
關鍵問題:數據有沒有欺騙性?
01 不知來歷和帶有偏見的數據
最近的一個新聞標題:40%的大學生飽受抑郁癥的折磨!
在你情緒低落的時候你該不該過分擔心呢?你又怎么知道自己可以相信這樣的統計數字?
任何統計數字都要求發生在某地的某些事件能被界定并準確識別出來,這常常是一項非常艱巨的任務。因此,要找出欺騙性的數據,第一個策略就是盡量找到足夠多的關于這些數據是如何采集的信息。
我們能不能準確地知道美國到底有多少人在報稅單上做過手腳,多少人有過婚前性行為,多少人開車打手機,或多少人使用違禁藥品?如果你想象一下做這些統計的細枝末節,那么我們懷疑你的答案肯定會是“不太可能”。
為什么?因為要為特定的目的得到精確的數據,你常常會遇到各種各樣的攔路虎和絆腳石,其中包括關鍵詞語的模棱兩可,識別相關人員或事件的種種困難,人們不愿意提供真實的信息,不能報告各種事件,還有觀察事件時存在的種種身體上的障礙等。
因此,統計數據的形式往往只能是基于事實做出的一些估計。這些估計有時候很有用,但它們也可能有欺騙性。記住總要問一問,“作者是怎樣得出這個估計的?”得到的細節越多越好。
不知來歷的統計數字最常見的一個用處就是用大量的數字給別人加深印象或讓別人肅然起敬,這些呈現出來的數字的精確性常常會讓人懷疑。比如說,大量的數字可能被用來提醒公眾注意日漸增長的身體失調或精神失常的發生率,例如癌癥、飲食異?;蛴啄旯缕ОY等。
如果我們能知道這些數據確定的過程是如何得謹慎,我們肯定更會深受這些數據的感染。比如說,一直以來人們都在努力統計大學生抑郁癥發病率的準確數字,但是不知來歷的數據問題已經成為影響統計的一個主要因素,研究報上來的發病率在10%~40%之間。
所以,本部分一開始提到的那份研究如果讓你覺得過度驚慌的話,那你未免顯得有些杯弓蛇影。記?。涸趯@樣的數據做出反應之前,我們先要問一問它們是怎么得來的。
02 令人困惑的平均值
請檢查下面的陳述:
- 快速致富的一個方法就是做一名職業足球隊員,2010年國家足球聯盟球星的平均收入是180萬美元。
- 在大學里取得好成績,學生需要付出的努力越來越少了。根據最近一項調查,大學生每周平均花在學習上的時間是12.8小時,和20年前的大學生相比大概只有他們的一半。
兩個例子當中都使用了“平均”這個詞。但是實際上卻有三種不同的方法來測定平均值,而且在大多數情況下,每種方法都會給出不同的數值。
- 第一種方法是把所有數值相加,然后用總數除以相加的數目。這種方法所得的結果就是平均數(mean)。
- 第二種方法是將所有數值從高到低排列,然后找到位于最中間的數值,這個中間數值就是中位數(median)。有一半的數值在中位數之上,另一半在中位數下面。
- 第三種方法是將所有數值排列好,計算每個不同數值出現的次數或每個不同數值范圍出現的次數,出現頻率最高的數值就叫作眾數(mode),這是第三種平均值。
作者談論的是平均數、中位數還是眾數,將會產生很大的區別。
平均值的種類:
- 平均數:通過把所有數值相加然后用總數除以相加的數目來計算
- 中位數:通過將所有數值從高到低排列然后找到位于最中間的數值來測定
- 眾數:通過計算不同數值出現的次數然后找出出現頻率最高的數值的方法來測定
第一個例子當中取什么平均值最能說明問題?請考慮一下職業化運動當中大牌球星的收入與那些一般球員的收入對比。最大牌的球星,比如說橄欖球明星四分衛,收入比球隊里大部分其他球員要高出很多。
事實上,2010年度薪酬最高的橄欖球運動員歲入超過1 500萬美元,而這遠遠高于平均值。這樣高的收入將會急劇拉高平均數,但是對于中位數或眾數而言則影響不大。
舉例來說,國家橄欖球聯盟的球員2010年度工資平均數是180萬美元,但是其工資中位數卻只有77萬美元。因此,在大部分職業運動當中,平均數工資要比中位數工資或者眾數工資高出很多。所以,如果有人想讓工資水平顯得非常非常高,他就會選擇平均數作為平均值。
現在讓我們來仔細看看第二個例子。如果這里列舉的平均值要么是中位數要么是眾數,我們有可能就高估了平均的學習時間。有些學生很可能花了極多的學習時間,比如一周30或40個小時,這樣就提高了平均數的數值,但是卻不影響中位數或者眾數的數值。學習時間的眾數數值可能遠低于或遠高于中位數,主要取決于多長的學習時間對學生而言最為常見。
當你見到平均值的時候,一定要記得問一下:“是平均數、中位數還是眾數,平均值的含義不同會不會產生什么影響?”要回答這個問題,請想一想平均值的不同含義會給信息的意義帶來怎樣的變化。
不僅判斷一個平均值是平均數、中位數還是眾數非常重要,判定最小數值和最大數值之間的差距,即全距(range)以及每個數值出現的頻率,也就是數值分布,常常也顯得異常重要。
下面我們來看一個例子,在這個例子里知道數值的全距和分布就顯得非常重要。
醫生對20歲的病人說:你所患癌癥的預后不容樂觀?;纪瑯影┌Y的病人存活時間的中位數是10個月。所以剩下來的這幾個月你想做什么就做點什么吧,不必有什么顧慮了。
病人聽到醫生給出這樣的診斷結果,對自己的未來該做出怎樣可怕的展望呢?首先,我們確定知道的是獲得這種診斷的病人有一半不到10個月就去世了,還有一半人存活時間超過了10個月。
但是我們并不知道活下來的那部分人的存活時間的全距和數值分布。也許存活時間超過10個月的病人的數值全距和分布會顯示,有些人、甚至很多人活得遠遠超過了10個月的時間。其中有些人、甚至很多人可能活到80歲以上呢!知道病人存活情況的完整分布可能會改變這個癌癥患者對未來的看法。
一般來說,病人應該考慮國內不同的醫院對于他的疾病的存活率是不是有不同的全距和數值分布。這樣的話,他就應該考慮選擇在那家有最樂觀的數值分布情況的醫院就診。
當我們遇到平均數的時候,記住全距和數值分布的一個總體好處,就是這樣做會提醒你,大多數人或事并不完全符合確切的平均值,與平均數值差異極大的結果也在預料之中。
例如,很多旨在促進我們健康狀況的干預措施,都會展示某些健康手段的平均獲益情況,盡管參與這項研究的許多人獲益極少或基本沒有獲益,有些人甚至還會不同程度地受損。
03 把一件事的結論用來證明另一件事
有些數據確實能證明一件事,而立論者往往宣稱這些數據證明了另一件性質完全不同的事,這時候他們往往在欺騙我們。這些數據壓根兒就證明不了它們用來證明的一切!有兩種策略可以幫你找出這類欺騙。
一個策略就是對立論者提供的數據視而不見,然后問自己:“什么樣的統計數據作證據,在證明他的結論時會有幫助?”然后,將“所需”的數據和給出的數據進行比較。如果兩者之間難以吻合,你可能就發現了一個數據上的欺騙。下面的例子為你提供一個機會來應用這種策略。
如果你乘坐我們這座城市的地鐵,十有八九你的手機會被人偷走。我剛讀到一份統計數字,說小的電子產品占到地鐵系統失竊率的70%。
需要做什么樣的研究才能獲得個好主意,可以知道自己乘地鐵時電子產品被人偷走的可能性到底有多大。你自然想知道乘地鐵被偷的概率,而不是被偷走電子產品的概率。這個數據證明了一件事,即地鐵系統的大部分偷竊行為都是奔著小電子產品去的。但它并沒有證明這類偷竊行為發生的概率有多大。
要回答這個問題,你需要這樣問,在坐地鐵的時候被偷的概率到底是多少?有可能總體的偷竊行為非常少,但是其中大部分都牽涉到小電子產品。從這個例子當中得到的最重要的教訓就是:我們一定要加倍注意統計數據和結論的措辭,看看二者是不是指的同一件事情。如果不是,作者或演說者就很可能是在用數據說謊。
知道什么樣的數據證據應被用來支持一個結論是很難的。因此,另一個策略就是不急于去看作者的結論,而是先仔細檢查作者的數據,然后問自己,“從這些數據我們可以得出什么合適的結論?”然后拿你的結論和作者的結論相比較。請用這個策略來檢驗下面這個例子。
大約半數的美國人欺騙了自己的另一半。研究人員最近在一家購物中心采訪了很多人。在接受采訪的75人當中,有36人坦承他們有朋友曾承認欺騙過自己的約會對象。
你有沒有想到這個例子一開始得出的結論?大約一半人在某個特定地點承認有朋友告訴過自己,他們在和他人約會或交往過程中至少有過一次欺騙行為。你有沒有看出數據所證明的東西和作者的結論之間存在著巨大的差異?如果你看出來了,那你就發現了這位作者是如何利用數據來撒謊和欺騙的。
04 通過省略信息欺騙
統計數據經常因為不完整而欺騙了我們。因此,另一個在數據論證中找到缺陷的非常有用的策略就是問一問:“在判斷數據的影響力之前,還需要什么進一步的信息?”讓我們先看看下面的例子,展示一下這個問題所起的作用。
- 大公司正在將市中心地帶的小鎮氣息破壞殆盡。就在去年,城里的大公司的數目增長了75%。
- 盡管大家都挺害怕,但跳傘運動其實比其他活動比如說駕駛汽車要安全得多。拿某一個月的時間來作比較,這段時間里,洛杉磯有176人死于車禍,而死于跳傘事故的卻只有3人。
- 艾滋病預防項目需要較大的資金增幅。2009年,有54 000人飽受艾滋病的折磨。
第一個例子中,75%這個數字很吸引眼球。但是缺少了一些東西:這個百分比所依據的絕對數值。假如我們知道這種增長是從4家增長到7家,而不是從12家增長到21家,我們還會覺得如此驚訝嗎?
在第二個例子里,我們倒是有數字了,但是卻不知道比率。難道我們不需要知道這些數字對參加這兩種活動的人數的百分比來說有什么意義嗎?不論怎樣,參加跳傘活動的總人數比起駕車的總人數而言簡直是微不足道。
第三個例子展示了我們社會中常見的一個事實,通過聚焦全國范圍內受病痛折磨的總人數,企圖引起公眾對某個社會問題的關注。盡管這顯然是個亟待解決的問題,但當我們將54 000除以美國的大概總人口3億人,我們只得到一個大概0.02%的數值。
當你遇到聽起來讓人動心的數字或者百分比,一定要當心!你可能需要其他信息來判定這些數字到底有多讓人動心!當只有絕對數值擺在眼前的時候,問一問知道百分比是不是有可能幫你做出更好的判斷;當只有百分比出現在眼前的時候,問一問是不是絕對數值會豐富它們的含義。
當你遇到統計數字的時候,一定要記得問一問:“缺少了什么相關信息?”
關于作者:
尼爾·布朗,博林格林州立大學(Bowling Green State University)的杰出經濟學教授。獲有托雷多大學法學博士學位和得克薩斯大學的博士學位。
斯圖爾特·基利,美國伊利諾伊大學心理學博士。現為美國博林格林州立大學心理學教授。