普通人對數據都有敬畏感,特別是來自貌似官方權威的數據,更是能夠給普通人帶來自然的說服力。越是這樣,我們越要提醒大家,有些人會利用普通人過於信賴貌似專業的數據心理,來欺騙大家。
那麽利用不靠譜數據誤導我們的常見手段有哪些呢?
1.濫用平均數製造虛假繁榮
我所在的高校領導曾經在一次報告中說全校老師年薪收入已經達到人均十萬,結果很多老師就嘀咕,我哪裏有十萬年薪?我是被平均了好不好?
說到工資這個事情,大家都已經很清楚了,要分析一個單位大多數人的平均收入,用平均數計算工資是不科學的,用中位數或者眾數相對來說更接近真相。
比如按上表,七個員工平均年薪是(5+5+5+6+8+16+25)萬=70萬/7=10萬
按中位數,應該是6萬。(對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作為中位數。)
按眾數,應該是5萬。(一組數字中出現頻率最高的數字)。
你看,選擇不同的平均工資計算方式,大家的感受會完全不同。
2.用有限取樣數據推導出不客觀的結論
2.15年1月底,國家工商總局公布定向監測結抽檢報告說淘寶正品率僅37.25%,其中:①抽查的淘寶、京東、天貓、1號店等,正品率為58.7%,淘寶最低,僅37.25%;②手機行業正品率僅28.57%,小米手機正品率40%,三星手機正品率0%;③雅戈爾、only、雅詩蘭黛、史丹利等品牌正品率低。
這個抽樣報告引起很多人質疑,原因何在?我們不妨先看看一組抽樣調查數據。
淘寶有假貨是事實,但是用於說明淘寶假貨率高的調查樣本也太少了。如果多買一件三星,恰好是正品,馬上正品率就上升到33%,這顯然不是一個有說服力的調研樣本。所以引起爭議也非常正常。
3.用以偏概全的數據混淆視聽
以偏概全這種事情也經常可以看到,就是拿出一部分數據來論證觀點,故意回避其它數據成分。
比如2015年人保部通過了公務員整體加薪方案,本來加薪是一件可以討論的事情,為了讓公務員也和普通人一樣交社保拿社保保障金退休,是社會的進步。
但是在解釋為什麽要對公務員加薪時,有的專家大談公務員基本工資已經十年沒有變化,不加薪似乎對不起公務員。
但事實是2004年到2014年是考公務員熱的十年,大家之所以參加國考,不就是看中公務員工作穩定還收入高。這個收入絕不僅僅隻包括公務員的基本工資,還應當包括公務員的福利收入,隱形收入(比如有的單位可以優惠購房,對口子女上學),甚至還有灰色收入。
如果隻比較基本工資,這是不公平的。
4.隻選擇對自己有利的數據
很多文章的數據看起來非常有道理,但都有一個特點,那就是選擇性提供對自己觀點有利的數據,隱瞞不支持自己觀點的數據,這樣讓他的文章看起來非常有說服力。
比如一些文章會告訴我們中國13億總人口中還有3000萬人口沒有脫貧,也就是說中國還有3000萬個窮人。但人口隻有3億多的美國也存在3500萬貧困人口,這不是恰好說明了我們國家製度的優越性?
但是這些人卻沒有告訴你美國的貧困人口收入線在2010年規定是單身年收入是10991美元以下,兩口之家年收入在14051美元以下,三口之家年收入在17163美元以下,四口之家年收入在22314美元以下。
我們國家規定的貧困線標準是年純收入1500元人民幣,實際上比聯合國規定的貧困線標準日收入1.25美元以下還低。
所以這樣隻比貧困人數規模和占比,不對比貧困線標準的數據顯然是有問題的。
在房地產行業,類似的遊戲也非常多。比如新聞裏需要說明房價在上漲時,他們會說上季度某地中心城區房屋價格上漲了百分之多少,需要認證房價在調控下趨於穩定時,他們會說上季度某地區房屋價格開始出現滑落。
小心!這裏麵討論的地區是一個彈性區域,大家都在選擇自己需要的數據,而不是針對統一調研半徑的數據進行分析。這樣的數據引用顯然是犯了選擇性提供對自己有利的信息,刻意掩飾對自己不利信息的問題,推導出來的結論也自然不具備可信度。
5.不提供數據的準確定義
和寫文章有些人會自覺不自覺偷換概念一樣,在引用數據時也有人自覺不自覺地偷換概念。
比如現在很多創業公司都希望得到風險投資,你問他的公司為什麽值得投資,他會告訴你他的APP擁有多少萬用戶。比如2014年橫空出世的霸道90後總裁餘佳文說自己的《超級課程表》有1000萬用戶,這個數據就被很多人質疑造假,我想這裏麵最大問題可能是餘佳文沒有定義自己的用戶數是什麽概念。
有的APP運營者的用戶數其實隻是裝機量,比如他可以和中國移動合作,在每部手機上都預裝軟件,但根本沒有用戶去用,這種裝機量算用戶是不合適的。
還有的APP運營者告訴你的用戶數是用戶下載量,不代表活躍用戶數量,有的用戶隻是好奇下載一次就卸載了,這不能算真實用戶。
還有的APP運營者倒是告訴你活躍用戶占比和數量,但什麽叫活躍用戶?這個定義它可不會明確說明,留下模糊操作的空間。
總之,在提供數據時,沒有明確定義自己的數據指標是如何定義和采集的,這樣的數據都大有可疑。
6.用相對值代替絕對值
我在指導大學生做簡曆時,看到這樣一段自我描述:
“在擔任學生會部長期間,部門籌款經費比上一年度翻了一倍。”
看起來非常給力對不對?但是似乎哪裏不太對頭。因為這位朋友說的是相對值,而不是絕對值。如果談絕對值也許真相是去年部門籌款經費是50元,今年是100元,都很糟糕!
這種把戲不僅僅在簡曆裏才有,隻要我們留心,你隨時可以找到類似的案例。
比如在匯報工作業績時,假如某單位2014年3月銷售業績是100萬,2015年3月銷售業績是120萬,2015年2月的業績是60萬。
如果你用同比來說明你的業績,會這樣寫,2015年3月業績與去年同期相比,同比增加了20%。
但如果用環比,也就是2015年相鄰的兩個月比較,那就是2015年3月業績與上個月相比,環比增加了100%。
嗯,你看同樣的業績,換個說法,似乎感覺大不一樣呢。
7.假借權威發布不實數據
網絡上還有一種常見情況,很多數據看起來很官方很權威,但根本就不是做了科學研究得到的數據,而是假借專家,假借權威組織,或假稱是引用權威媒體的數據。
在文章中不但沒有說清楚這些專家是誰,權威媒體名稱也是似是而非,數據來源無法追溯,無法查證,這種情況往往是公然數據造假。
說到這裏,我隨手搜了一條預測2015年房地產價格變動趨勢的網文,文章中提到“對於2015年樓市走勢,多位業內人士都認為,樓市成交量將企穩回升,至於房價漲跌,要看所在城市的庫存以及供需關係的變化。專家表示,2015年樓市總體將呈現止跌反彈的複蘇態勢。”
你看這段話裏麵到處是業內人士,專家還有各種專業術語,企圖暗示你2015年房市會企穩回升,其實想暗示你房價會上漲,你應該抓緊時間買房,你覺得這種文章可信嗎?
那麽一些所謂的主流媒體派記者做各種抽樣檢測來發布結果,這靠譜嗎?——一般而言,對產品質量的試驗檢測是很專業的工作,媒體人不是從事相關專業的,從科學取樣到標準檢測到數據解讀,都需要專業背景,一不留神就變成想當然。還記得2014年羅永浩和王自如優酷對質,說王自如測評不專業的事情嗎?
即使是一些打著權威公正的商業調查,不告訴你調研總量,不告訴你調查範圍,不告訴你對比組數據,隻用權威調查這樣模糊不清的說法進行暗示,這種也不少見。
如果我們要學會獨立思考,就必須建立在真實的數據基礎之上,但是這個世界上太多人出於無知或者私利,總想用錯誤的數據誘導我們做出錯誤的判斷,隻能靠我們自己多長幾個心眼,不要輕易被別人騙了!
互動練習
請列出一係列原始數據,嚐試運用這七大產生誤導數據的手段,對原始數據做出混淆視聽的說明。這種反向運用能夠幫助你日後更加敏銳地去辨別一些虛假數據分析哦!