我認為人人都應該學一些概率知識,它現在是公民必備知識。
現在的世界比過去復雜得多,其中有大量不確定性,是否理解概率,直接決定一個人的開化程度。
1. 隨機:有些事情是無緣無故地發生的
這個思想對我們的世界觀有顛覆的意義。
古人沒有這個思想,認為一切事物都是有因果的,甚至可能都是有目的的。人們曾經認為世界像一個鐘表一樣精確地運行。但真實世界不是鐘表,它充滿不可控的偶然。
更嚴格地說,有些事情的發生,跟他之前發生的任何事情,都可以沒有因果關系。不論我們做什麼都不能讓它一定發生,也不能讓它一定不發生。
一個人考了好大學,人們會說這是他努力的結果;一個人事業成功,人們會說這是他努力工作的結果。可是如果一個人買彩票中了大獎,這又是為什麼呢?
答案是沒有任何原因,這完全是一個隨機事件。總會有人買彩票中獎,而這一期彩票中獎,跟他是不是好人,他在之前各期買過多少彩票,他是否關註中獎號碼的走勢,沒有任何關系。
若一個人總是買彩票,他中獎的概率會比別人大點吧?的確,他一生之中中一次獎的概率比那些只是偶然買一次彩票的人大。但是當他跟上千萬個人一起面對一次開獎的時候,他不具備任何優勢。他之前所有的努力,對他在這次開獎中的運氣沒有任何幫助。一個此前沒有買過任何彩票的人,完全有可能,而且有同樣大的可能,在某一次開獎中把最高獎金拿走。
中獎,既不是他個人努力的結果,也不是“上天”對他有所“垂青”;不中,也不等於任何人與他做對。這就是“隨機”,你沒有任何辦法左右結果。
理解隨機性,我們就知道很多事情發生就發生了,沒有太大可供解讀的意義。我們不能從這件事獲得什麼教訓,不值得較真,甚至不值得采取行動。
再完美的交通工具也不可能百分百安全,我們會因為極小的事故概率不坐飛機嗎?我們只需要確定事故概率比其他旅行方式小就可以了。甚至連這都不需要,只需要確定這個小概率事件我們能夠容忍就可以了。
2. 賭徒謬誤
假如你在賭場玩老虎機,一上來運氣不太好,連輸好幾把。這時候你是否有種強烈的感覺,你很快該贏了?
買股票、期貨、彩票都是一樣。連續好幾把上來就虧損的情況下,是不是覺得下一把掙錢的概率很大?
這完全是一種錯覺。賭博完全是獨立的隨機事件,這意味著下一把的結果和以前所有的結果都沒有任何聯系,已經發生了的事情不會影響將來。
“大數定律”說,如果進行足夠多的抽獎,那麼各種不同結果出現的頻率就會等於他們的概率。
人們常常錯誤地理解為,隨機就意味著均勻。如果過去一段時間內發生的事情不均勻,人們就錯誤的以為未來的事情會盡量往“抹平”的方向走。如果連輸幾把,那麼下一把就應該會贏。
但大數定律的工作機制不是和過去搞平衡,它的真實意思是說如果未來進行非常多次的抽獎,你輸非常多次、贏非常多次,以至於他們此前的一點點差異就會變得微不足道。
有個笑話說一個人乘坐飛機時總帶著一顆炸彈,他認為這樣就不會被恐怖分子炸飛機了,因為一架飛機上有兩顆炸彈的可能性非常小。
戰場上士兵有個說法,如果戰鬥中炸彈在你身邊爆炸,你應該迅速跳進那個彈坑,因為兩顆炸彈不大可能打到同一個地方。
這都是不理解獨立隨機事件導致的。
3. 在沒有規律的地方發現規律
理解了隨機性和獨立隨機事件,我們可以得到一個結論:獨立隨機事件的發生是沒有規律和不可預測的,這是一個非常重要的智慧。
彩票分析師,相信中獎號碼存在走勢,相信其中的規律,所以近期多次出現的組合可能會繼續出現,或者按照這個趨勢可以預測下一個號碼。
但這裏根本沒有規律,是完全隨機的現象,即便存在缺陷,也需要大量的開獎後才能發現,而且缺陷的結果也很簡單,無非是某個特定號碼出現的可能性略大一些,完全談不上什麼復雜規律。
明明沒有規律,這些彩票分析師是怎麼看出規律來的呢?也許他們不是故意騙人,而很可能他們真的相信自己找到了彩票的規律。
發現規律是人的本能。
春天過後是夏天,烏雲壓頂常下雨,大自然中很多事情的確是有規律的。我們的本能工作得如此之好,以至於我們在明明沒有規律的地方也能找出規律來。人腦很擅長理解規律,但是很不擅長理解隨機性。
在沒有規律的地方發現規律是很容易的事情,只要你願意忽略所有不符合你這個規律的數據。而且如果數據夠多,我們可以找到任何我們想要的規律。
有人拿聖經做字符串遊戲,聲稱這是聖經對後世的預言。問題是,這些預言可以完美的解釋已經發生的事情,但在預測未發生的事情時就不好使了。關鍵是聖經中有很多很多字符,如果仔細尋找,尤其是借助計算機的話,總能找到任何想要的東西。
把聖經換成毛選也一樣,你會發現毛選也早就預言了中國後世發生的所有大事。
未來是不可被精確預測的,這個世界也並不像鐘表那樣運行。
4. 小數定律
現在我們知道,數據足夠多的話,人們可以找到任何自己想要的重要規律,只要他不在乎這些規律的嚴格性和自洽性。那麼在數據足夠少的情況下又會如何?
如果數據足夠少,有些規律會自己跳出來,你甚至不相信都不行。人們抱著遊戲或者認真的態度總結了世界杯足球賽的各種“定律”。比如——
“巴西隊的禮物”:只要巴西奪冠,下一屆的冠軍就將是主辦大賽的東道主,除非巴西隊自己將禮物收回。這一定律在2006年被破解。
“1982軸心定律”:世界杯奪冠球隊以1982年世界杯為中心呈對稱分布,這個定律在2006年被破解。
還有一些未被破解的定律,比如——
凡是獲得聯合會杯或美洲杯,就別想在下一屆世界杯奪冠。
中國隊的“王治郅定律”:只要王治郅參加季後賽,八一隊必然得總冠軍,以及“0:2”落後無人翻盤定律。
如果仔細研究這些定律,會發現不易破解的定律其實都有一定的道理。王治郅和八一隊都很強,0:2落後的確很難翻盤,而獲得世界杯冠軍是個非常不容易的事情,更別說同時獲得聯合會杯、美洲杯和世界杯。但不容易不等於不會發生,他們終究會被破解。
那些看似沒有道理的神奇定律(正因為沒道理,所以顯得神奇),則大多數已經被破解。之所以神奇,是因為純屬巧合。世界杯總共才進行了80多年,20多屆。只要數據足夠少,我們總能發現一些沒有破解的規律。
如果數據少,隨機現象可以看上去很不隨機。甚至非常整齊,感覺好像真有規律一樣。
問題的關鍵是,隨機分布不等於均勻分布。要想均勻分布,必須要樣本總數非常大的時候才有效。一旦不均勻,人們就認為其中必有緣故(陰謀論),而事實卻是這可能只是偶然事件。
iPod最早推出“隨機播放”功能的時候,用戶發現有些歌曲會被重復播放,他們據此認為播放根本不隨機。蘋果公司只好放棄真正的隨機算法,用喬布斯本人的話說,就是改進以後的算法使播放“更不隨機以至於讓人感覺更隨機”。
如果統計數據很少,就很容易出現特別不均勻的情況。這個現象被諾獎得主丹尼爾·卡尼曼戲稱為“小數定律”。卡尼曼說,如果我們不理解小數定律,就不能真正理解大數定律。
大數定律是我們從統計數字中推測真相的理論基礎。大數定律說如果統計樣本足夠大,那麼事物出現的頻率就能無限接近他的理論概率——也就是他的“本性”。而小數定律說如果樣本不夠大,那麼他就表現為各種極端情況,而這些情況可以跟他的本性一點關系都沒有。
一個只有二十人的鄉村中學某年突然有兩人考上清華,跟一個有兩千人的中學每年都有兩百人考上清華,完全沒有可比性。
如果統計樣本不夠大,就什麼也說明不了。
正因為如此,我們才不能只憑自己的經驗,哪怕加上家人和朋友的經驗,去對事物做出判斷。我們的經驗非常有限。別看個例,看大規模統計。有的人聽說兩三個負面新聞就敢寫文章把社會批得一文不值,這樣的人非常無知。