從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

1. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

什麼是正態分佈,爲什麼它很重要?

正態分佈是說,在平均值附近觀察到特定數據值的概率最大,並且隨着與平均值的差值的增加而迅速減小。多快取決於一個叫標準差的量。

數學是模式的科學。概率的隨機作用遠非我們直覺理解的那樣。目前關於“隨機”的定義是:

沒有任何可識別的模式。

幾個世紀以來,數學家們一直在研究幾何、代數和分析中的數學模式,他們意識到,即使是隨機性也有它自己的模式。但是,“隨機事件的模式”與“隨機事件沒有模式”的觀點並不衝突,因爲隨機事件的規律是統計意義的。例如,如果你反覆多次擲一個骰子,那麼大約有六分之一的次數擲到1,這是一個清晰的統計模式。但這並不能告訴你下一次投擲時,哪個數字會出現。

直到19世紀,數學家和科學家才意識到統計模式(規律)在偶然事件中的重要性。甚至人類的行爲,如自殺和離婚,也受到數量法則的影響。這似乎與自由意志相牴觸。但今天,這些統計規律構成了醫學試驗、社會政策、保險費用、風險評估和職業規劃的基礎。

這一切都是由賭博學者吉羅拉莫·卡達諾引起的。卡達諾是個“不學無術”的人,他通過下國際象棋和賭博來賺錢。他將自己強大的才智應用於這兩方面。國際象棋並不取決於運氣。然而,在賭博中,運氣似乎是主要的“實力”。卡達諾意識到,即使在賭博中,他也可以發揮出自己的數學才能。他就此主題寫了一本書,名爲《概率遊戲(博弈)之書》,這是第一次系統地討論數學概率的書。

概率遊戲引起了布萊斯·帕斯卡的注意。他和費馬曾就一個與賭博有關的數學問題互相寫信。在此過程中,他們創造了一個新的數學分支:概率論。概率論中的一個核心概念就是我們現在所說的“期望”,這是玩家長期的平均收益。

2. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

  • 帕斯卡與費馬

1713年,當雅各布·伯努利發表了他的《猜想的藝術》時,概率論成爲數學中一個成熟的領域。他從事件概率的“工作定義”開始:

從長遠來看,在任何時候,事件發生的幾率。

這裏用“工作定義”,因爲如果試圖讓它成爲基礎的話,會出現問題。例如,假設有一枚均勻的硬幣,多次拋擲,大多數情況下,得到的是一個看起來隨機的正面和反面的序列。如果持續投擲足夠長的時間,大約有一半的時間會得到正面。然而,很少會恰好有一半的時間是正面朝上,例如,在奇數次投擲中,這是不可能的。我從微積分中得到靈感來修改定義,

但有時極限並不存在。例如,假設正面和反面的順序是

拋擲得到“人頭”朝上的概率等於拋擲次數趨於無窮時,拋擲得到“人頭”朝上的概的極限,我們要證明這個極限存在。

3. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

一次反面,兩次正面,3次反面,6次正面,12次反面,以此類推。3次反面之後,每個階段的數字都翻倍。投擲三次後,正面的比例是2/3,6次後是1/3,12次後是2/3,24次後是1/3,所以這個比例來回擺動,在2/3和1/3之間,因此沒有明確的極限。

而且這樣的投擲結果序列是非常不可能的,但爲了定義“不可能”,我們需要定義概率。所以邏輯是循環的。此外,即使極限存在,它也可能不是1/2的“正確”值。一個極端的情況是硬幣落地時總是正面朝上(極限是1)。同樣,這是極不可能的。

伯努利決定從相反的方向來研究這個問題。首先定義正面和反面出現的概率爲0到1之間的p。如果硬幣是均勻的,那麼p=1/2,否則不是1/2(有偏差)。伯努利證明了一個基本定理,大數定律。

大數定律指出,如果拋擲次數足夠多,正面朝上的概率確實有極限,極限是p。從哲學上講,這個定理表明,通過以一種自然的方式分配概率(即數字)是合理的。所以伯努利的觀點是,作爲概率的數字提供了一個一致的數學模型來描述一遍又一遍拋硬幣的過程。

他的證明基於帕斯卡三角:

4. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

編輯搜圖

其中所有行都以1開始和結束,每個數字都是它上面兩個數字的和。我們現在稱這些數字爲二項式係數,因爲它們出現在二項式表達式(p + q)^n的代數中。也就是說:

5. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

伯努利的關鍵觀點是,如果我們拋n次硬幣,得到正面的概率是p,那麼拋擲特定次數得到正面的概率是(p + q)^n的對應項,其中q = 1 − p。什麼意思呢?

例如,假設我拋硬幣三次。那麼八個可能的結果是:

6. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

根據正面出現的次數對序列進行分組。所以在這八個可能的序列中,有:

  1. 三次正面
  2. 兩次正面
  3. 一次正面
  4. 零次正面

這種與二項式係數的聯繫並非巧合。如果你展開代數公式(H + T)^3,會得到:

7. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

指數表示爲:

8. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

然後,用概率p或q替換H和T。

即使在這種情況下,每一個極端的HHH和TTT只在8個試驗中出現一次。使用二項式係數進行更復雜的計算,可以證明伯努利大數定律。

當數學家們不知道如何計算一些重要的東西時,他們會找到一種方法來間接地靠近它。舉個例子,你想知道投擲100次硬幣得到42次正面的概率,你必須做200次乘法然後簡化一個非常複雜的分數。我的電腦瞬間就告訴我答案,是

9. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

但伯努利沒有電腦。

這種直接計算是不可行的。大約在1730年,亞伯拉罕·德·莫弗爾推導出了一個關於重複投擲“不均勻硬幣”的概率的近似公式。這引出了誤差函數正態分佈,由於其形狀,通常被稱爲“鐘形曲線”。他證明了,用公式定義均值μ、方差σ^2的正態分佈Φ(x):

10. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

對於投擲n次不均勻硬幣(n是大數),得到m個正面的概率非常接近Φ(x),當

11. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

這裏的“均值”指的是平均值,而“方差”指的是數據分佈的範圍——鐘形曲線的寬度。方差的平方根,σ本身,稱爲標準差。下圖顯示了Φ(x)的值如何依賴於x。

12. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

曲線看起來有點像鐘形。鐘形曲線是概率分佈的一個例子;這意味着,在兩個給定值之間獲得數據的概率等於曲線下和與這些值對應的垂直線之間的面積。曲線下的總面積是1。

當鐘形曲線開始出現在社會科學的經驗數據中時,它開始得到重視,而不僅僅是理論數學。1835年,比利時人阿道夫·奎特雷是社會學定量方法的先驅,他收集和分析了大量的數據,包括犯罪、離婚率、自殺、出生、死亡、身高、體重等,這些變量沒有人認爲會符合任何數學模式,因爲它們的原因太複雜,涉及到人類的選擇(自由意志)。認爲這可以簡化成一個簡單的公式似乎很可笑

如果你想準確預測誰會自殺,以及何時自殺,顯然是不可能的。但當奎特雷專注於統計問題時,例如不同人羣、不同地點、不同年份的自殺比例,他開始看到模式。這些是有爭議的:如果你預測明年某個地方將有六起自殺事件,當每個人都有自由意志時,這又有什麼意義呢?他們都可能改變主意。但是自殺的人所構成的人口數量並沒有事先明確說明;這不僅是那些自殺的人所做選擇的結果,也是那些想過自殺但沒有自殺的人所做選擇的結果。人們在許多其他事情的背景下行使自由意志,這些事情影響着他們的自由決定:這裏的約束包括經濟問題、關係問題、精神狀態、宗教背景……無論如何,鐘形曲線不能做出準確的預測;它只是說明哪個數字最有可能。可能會發生五到七起自殺事件,這給任何人都留下了施展自由意志和改變主意的空間。

數據最終贏得了勝利。無論出於什麼原因,人們的集體行爲比個人行爲更容易預測。也許最簡單的例子就是身高。當奎特雷繪製給定人羣的身高比例時,他得到了一條漂亮的鐘形曲線。他對許多其他社會變量得出了同樣的曲線形狀。

13. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

編輯搜圖

鐘形曲線迅速成爲概率論的標誌,特別是統計學。主要有兩個原因:一是鐘形曲線的計算相對簡單二是它在實踐中的應用。這種思維方式的主要來源之一是18世紀的天文學。由於儀器的微小變化,人爲的誤差,或者僅僅是大氣中氣流的運動,觀測數據都會出現誤差。那個時期的天文學家想要觀察行星、彗星和小行星,並計算它們的軌道,這就需要得到最符合數據的軌道。

這個問題的實際解決辦法首先出現了。它歸結爲:在數據中選擇一條直線,使總誤差儘可能小。這裏的誤差必須是正的,簡單方法是將其平方。所以總誤差是觀測值與直線模型偏差的平方和,期望的直線使其最小化。

1805年,法國數學家阿德里安-瑪麗·勒讓德發現了這條線的一個簡單公式,使得計算起來很容易。這個公式被稱爲最小二乘法。下圖說明了關於壓力和血壓的人工數據的方法。

14. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

編輯搜圖

圖中使用勒讓德公式得出的直線。不到十年,最小二乘方法就成爲法國、普魯士和意大利天文學家的標準方法。又過了20年,它成了英國的標準。

高斯將最小二乘方法作爲他在天體力學領域研究的基石。1801年,他成功預測了小行星穀神星的存在。這一預測奠定了他在數學和天文學上的聲譽,並使他成爲哥根廷大學的天文學教授。高斯並沒有使用最小二乘來做這個特殊的預測,他的計算歸結爲求解一個八次代數方程。但在1809年的《天體繞太陽作二次曲線運動的運動理論》中,他把重點放在了最小二乘法上。他還說,早在勒讓德10年前,他就提出並使用了這個方法,這引起了一些爭議。

爲什麼觀測誤差應該是正態分佈的?1810年,拉普拉斯給出了一個驚人的答案。拉普拉斯利用傅里葉變換證明了許多觀測值的平均值可以用鐘形曲線來描述,即使個別觀測值並非如此。他的結果,中心極限定理,是概率論和統計學的一個重要轉折點,因爲它爲數學家最喜歡的分佈——鐘形曲線——分析觀測誤差提供了理論依據。

中心極限定理指出鐘形曲線是唯一適合於多次重複觀測的均值的概率分佈。因此,它被稱爲“正態分佈”。1865年,弗朗西斯·高爾頓研究了孩子的身高與其父母的身高之間的關係。這是一個更大的目標:理解遺傳。證明中心極限定理很困難,因爲中心極限定理是一把雙刃劍。奎特雷發現了一個關於身高的漂亮的鐘形曲線,但這似乎並沒有顯示出影響身高的不同因素,因爲中心極限定理預測了正態分佈,不管這些因素的分佈是什麼。即使父母的特徵是這些因素之一,他們也可能被其他因素所覆蓋——例如營養、健康、社會地位等等。

15. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

  • 高爾頓

然而,到了1889年,高爾頓找到了擺脫這種困境的方法。拉普拉斯中心極限定理的證明依賴於平均許多不同因素的影響,但這些因素必須滿足一些嚴格的條件。1875年,高爾頓將這些條件描述爲“高度人爲的”:

  1. 它們的作用都是獨立的;
  2. 都是相等的(具有相同的概率分佈);
  3. 所有人都承認自己被視爲“高於平均水平”或“低於平均水平”的簡單替代品;
  4. 假設影響變量是無窮多的。

這些條件都不適用於人類遺傳。條件(4)對應於拉普拉斯的假設,即被加因子的數目趨於無窮大,所以“無窮大”有點誇張;然而,數學所建立的是爲了得到一個很好的正態分佈的近似,必須結合大量的因素。每一個因素對平均值的貢獻很小。比方說,有100個因素,每個因素貢獻了其價值的百分之一。每一個單獨的實驗都沒有顯著的效果。

中心極限定理爲正態分佈提供了一個充分條件,而不是一個必要條件。即使它的假設失敗,由於其他原因,有關的分佈可能仍然是正態分佈。高爾頓的任務就是找出這些原因。要想與遺傳聯繫起來,它們必須適用於少數大而不同的影響的組合,而不是大量的無關緊要的影響。他慢慢地摸索着找到了解決辦法,並通過兩個實驗找到了答案。

這兩個實驗都可以追溯到1877年。其中一種是設置一個裝置,在這種裝置中,滾珠從斜坡上掉下來,撞到一排柱上,向左或向右的幾率相等。理論上,球應該根據二項分佈在底部堆積起來,所以它們應該形成一個大致鐘形的堆。

他想象當球的一部分下落時,它們仍然會形成一個鐘形曲線,但這個鐘形更窄。這意味着最終的大鐘形曲線可以被看作是許多小曲線的總和。當多個因素(每個因素都遵循其獨立的鐘形曲線)組合在一起時,鐘形曲線就會自我複製。

當高爾頓培育出豌豆時,關鍵時刻到來了。1875年,他把種子分給了七個朋友。每個人都收到了70粒種子,但重量都不同。1877年,他測量了這七組種子的“後代”。每一組都是正態分佈,但每一組的平均重量不同,與原始組中每個種子的重量相當。當他將所有組的豌豆合併後,結果再次呈正態分佈,但方差更大——鐘形曲線更寬。這再次表明,組合幾個鐘形曲線會產生另一個鐘形曲線。高爾頓找到了這一現象的數學原因。假設兩個隨機變量都是正態分佈,均值和方差不一定相同。它們的和也是正態分佈的;它的均值是兩個均值之和,它的方差是兩個方差之和。

16. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

  • 高爾頓豌豆實驗史料

這個定理適用於少量的因子組合,每個因子可以乘以一個常數,所以它適用於任何線性組合。正態分佈是有效的,即使每個因素的影響都很大。現在高爾頓可以看到這個結果是如何應用到遺傳上的。假設由孩子身高給出的隨機變量是父母身高相應隨機變量的組合,這些隨機變量是正態分佈的。假設遺傳因素是相加的,那麼孩子的身高也會呈正態分佈。

隨着鐘形曲線的中心作用被牢牢地固定在當時被認爲是堅實的基礎上,統計學家可以以高爾頓的觀點爲基礎,其他領域的工作者也可以應用這些結果。社會科學是早期的受益者,生物學緊隨其後,而由於勒讓德、拉普拉斯和高斯,物理科學已經走在了前面。很快,任何想要從數據中提取模式的人都可以使用完整的統計工具箱。我將只關注一種技術,因爲它經常被用於確定藥物的有效性,以及許多其他應用。它被稱爲假設檢驗,其目標是評估數據中明顯模式的重要性。它是由四個人建立的:英國人羅納德·艾爾默·費雪、卡爾·皮爾森和他的兒子埃根,以及一個生於俄羅斯、在美國度過了大部分時間的波蘭人傑西·內曼。

在公衆意識中,“鐘形曲線”一詞與兩位美國人——心理學家理查德·J·赫恩斯坦和政治學家查爾斯·默裏在1994年出版的爭議性著作《鐘形曲線》有着不可避免的聯繫。這本書的主題是宣稱用智商衡量的智力與收入、就業、懷孕率、犯罪率等社會變量之間的聯繫。作者認爲,智商水平比父母的社會和經濟地位或教育水平更能預測這些變量。

17. 從賭博中衍生出的數學——正態分佈,成了社會科學的支柱性工具

爭論是不可避免的,無論這本書的學術功過如何,因爲它觸及了一根敏感的神經:種族和智力之間的關係。媒體報道傾向於強調智商差異主要源於遺傳,但這本書對這種聯繫持謹慎態度,並對基因、環境和智力之間的相互作用持開放態度。另一個有爭議的問題是,一項分析表明,美國的社會分層在整個20世紀顯著增加,而主要原因是智力的差異。另一項是一系列處理這一所謂問題的政策建議。一是減少移民,書中稱移民降低了平均智商。也許最具爭議性的建議是,據稱鼓勵貧困婦女生育的社會福利政策應該停止。

具有諷刺意味的是,這個想法要追溯到高爾頓本人。他在1869年出版的《遺傳天才》提出了這樣一個觀點:“人類的自然能力是在與整個有機世界的形式和物理特徵完全相同的限制下,由遺傳得來的。”因此,在連續幾代中,通過明智的婚姻來產生一個具有高度天賦的男性種族是相當可行的。他斷言智商較低的人生育能力更高。相反,他表達了社會可能會發生變化的希望,讓更聰明的人理解多生孩子的必要性。

把數學模型當作現實來看待是錯誤的。在物理科學中,模型通常非常符合現實,這可能是一種方便的思考方式。但在社會科學中,模型往往比漫畫好不了多少。僅僅因爲智商具有數學譜系,就認爲它是對人類能力的某種精確衡量,這種觀點也犯了同樣的錯誤。把廣泛的、極具爭議的社會政策建立在簡單化、有缺陷的數學模型之上是不明智的。

概率論被廣泛應用於新藥和治療方法的醫學試驗中,用來檢驗數據的統計意義。測試通常基於底層分佈是正態分佈的假設。一個典型的例子是癌症羣集的檢測。對某些疾病而言,羣集是指該疾病在總人口中發生的頻率高於預期的羣體。集羣可能是地理上的,也可能是指具有特定生活方式或特定時期的人。例如,退休的職業摔跤手,或者1960年到1970年出生的男孩。

從賭博問題中衍生出來的統計方法有多種用途。它們爲分析社會、醫療和科學數據提供了工具。任何使用統計方法的人都需要了解這些方法背後的假設及其含義。盲目地將數字輸入計算機,並把結果當作真理,而不理解所使用方法的侷限性,這將導致災難。然而,合法使用統計數字已使我們的世界得到了翻天覆地的改善。這一切都始於奎特雷的鐘形曲線。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。