這是一本心理學的普及讀物。不過他并沒有對心理學所取得的成果做多少普及性的介紹。而是把焦點集中在為什么說心理學是一門科學,作為一門科學,它必須滿足了怎樣的標準。
所以,這本書更應該被看成一本科學方法論的入門書。里面介紹的思維工具,是所有的科學都應該遵循的原則。運用這些原則,我們可以更加清晰地判斷哪些是科學,哪些是偽科學。
事實上,科學心理學已經在科學實證的道路上走了很遠了。而大眾眼中的心理學,還停留在兩大類。一是以佛洛依德為代表的精神分析類書籍。二是以張德芬《遇見未知的自己》為代表的勵志自助讀物。
但是,當你運用本書的原則以后,你會發現,這兩大類心理學,都不符合科學的標準,并不是科學意義上的心理學。
你可能要問一個問題,那什么才是科學的心理學?
最簡單的答案恐怕要至少包含兩點。
一是科學心理學采用的是科學的研究方法,這個研究方法跟其他學科,比如物理、生物并沒有什么不同。
二是科學心理學得到的理論大都是概率性的,目前,它還不可能準確預測每一個臨床個體的行為。
Over。
附:讀書筆記
書本安利完了,然后我根據書本框架的簡單的串一下書本的內容。
科學的目的,可以簡單地理解為尋找世界上存在的各種因果關系,然后利用這種因果關系,用于預測。它有三個標準。實證主義;公開可重復,經過同行評議;可證偽。
那么如何才能找出真正的因果關系。由于世間的萬事萬物都有聯系,那么為了找出真正的因果,則必須想辦法將所要研究的變量分離出來,單獨探求該變量對事件的影響。科學上,通常采取控制和操縱實驗的方式,來分離變量探求影響。這一套方法,也被叫做科學方法。
任何理論,只有通過這一套科學方法的檢驗,才可以被稱為科學。比如爭吵已久的中西醫之爭,實際上也不是要廢中醫,而是要將中醫用這套科學方法來重新檢驗,從而找到中醫中符合科學的部分。
心理學也一樣,必須通過這一套科學方法的檢驗,才可以被稱為科學。
第一章 心理學是一門科學
1.本章指出現代心理學已經是一門科學。是一門用科學方法研究人類行為的科學。
但是這門科學目前還只是許許多多較為零散的理論,還沒有一套經過整合的宏大的理論體系(雖然目前,經過心理學家的努力,其理論體系的統一性已經有所增強)。
但是,這個困境并不是心理學所獨有,其他科學也尚在整合當中,不斷的整合,本來就是科學的進程。
2.零散的尚不成體系的科學也是科學,而科學則有科學的標準。
——科學必須是實證主義的。即科學必須建立在可以觀測的現象之上。
——科學必須是公開的。即這種可以觀測的現象不能是個人化的,而必須是別人也可以重復的,也就是具備可操作性(實際上,實證主義必然推出可重復和可公開化)。
——科學必須是可以證偽的(實際上,可證偽的基礎也是實證主義,因為只有實證的事件才有可能被證偽)。
這有兩層含義。一是實證主義。理論預測的,必須是可以觀測的事件。因為只有可以觀測到的事件才是可以證偽的。二是理論框架本身要是可以證偽的。不能證偽的理論沒有意義。比如我提出兩條腿的動物都有兩條腿,這就是一個自圓其說的理論,不可能被證偽,理論也就沒有意義。
3.佛洛依德作為公眾心中最著名的心理學家,其實并不代表科學心理學,其代表的精神分析理論已經是100多年前的事了。
他的精神分析理論在以下幾點上,并不符合科學的標準。
——理論不能用于預測,但卻可以事后解釋所有事件,造成理論不能被證偽。
——用個案來證明理論,而不是控制實驗。
現實生活中的變量非常之多,除了佛洛依德關注的那個變量以外,還存在許多可能對結果造成影響的變量。
那么僅僅用個案而不是控制實驗,就無法排除該結果是由關注以外的某個變量引起的。
——作為一個科學的理論,其研究數據和理論之間的聯系是一定要滿足某種標準的。而佛洛依德的研究數據和理論的聯系并不滿足該標準。當然,本書并沒有細說這種標準是什么,以及佛洛依德的數據為什么不夠支持他的理論(但是本書給出了該說法的參考文獻)。
第二章 科學的一個重要標準 可證偽性
本章對科學標準之一,可證偽性做了具體分析,并舉了一些例證。
可證偽性,要求理論必須可以做事前預測,并且預測的是可以被觀測到的事件,以便隨時被證偽,然后被修正,然后用修正后的理論再次預測。
佛洛依德精神分析理論之所以無用,是因為其雖然有著龐大的理論框架,但是只能用于事后解釋,而且可以解釋所有事件。既無法事前預測,又可以事后解釋所有事件,使得該理論不可證偽,缺乏科學性。
第三章 科學的一個重要標準 操作主義
本章指出科學的另一個標準,操作主義。
操作主義實際上保證了科學的另外兩個標準——是實證主義并且公開可重復的。
1.操作主義。科學是操作主義,而不是本質主義的。即科學沒有辦法回答“本質上是什么”(本質主義)這個問題,科學概念的定義是不斷演進的,但是每個階段都必須與現階段可以被觀測到的事件相聯系。
我們用可以觀測到的事件來定義科學概念(實證主義),而這種可觀測的事件,是每個人都可以重復觀測、操作的,這就使科學概念從一種他人無法復制的個人化感覺中分離出來,變得標準化和公開化。
2.我們在用操作主義定義科學概念的時候,必須注意兩個標準,效度和信度。
信度。即與該科學概念相聯系的事件比較很穩定,也就是說當你用一套操作標準去測量該概念,得到的結果必須很穩定。比如用同一套IQ測試題去測某個人的IQ,每次得到的分數都應該差不多。
效度。即該操作標準能夠測量你所要測量的概念。測身高的儀器拿去測IQ,無疑很穩定,但是完全無意義。
3.圖靈問題是可操作主義的一個絕好例子。
——本質主義者試圖嘗試從本質上定義什么是智能。
——操作主義者則放棄了這種努力,直接定義了一種被觀測的場景,該機器是否能夠和人進行智能對話。我們可以想象有一天,也許有機器能夠達到這種操作標準。但興許我們依然不認為該機器擁有智能,那到那一天,我們就可以將智能的概念進一步演化,提出更進一步的操作化定義。
也許我們永遠都不知道智能本質上是什么,但是這個不重要,重要的是在這種操作定義下,機器無疑正在變得越來越智能。
4.在心理學領域,所有我們熟悉的那些詞匯,比如智商、焦慮..都有自己科學上的操作性定義。我們需要注意的是,這種操作性定義往往與我們平常所說的這個詞匯的意思不大相同。
我們平常所說的那些詞匯,往往是個人化的感受,缺乏可操作的標準。比如你理解的智商和我理解的智商,往往不太一樣(比如一個數學不太好的畫家,能否被稱為高智商,每個人的回答都可能不一樣)。
只有當一個概念具備可操作性的定義,它才是個有意義的科學問題。比如“動物有感情么”,要使這個問題變成一個科學問題,我們必須對“感情”這個詞匯下一個可操作的定義(注意,不是本質上的定義,而是一系列可以被觀測到的事件),比如在某個場景下血壓會不會升高等一系列生理指標。
也許你不并同意這個操作性定義,沒關系,你可以對它進行改進,因為這個操作性定義是可以不斷演化的。
但是首先,我們在討論一個科學問題以前,必須先給它一個操作性的定義,這個操作性的定義讓問題變得公開化、標準化,變得具備討論的基礎。
第四章 個案和見證敘述是沒有科學性的
本章指出個案和見證敘述是沒有科學性的。
1.個案在科學研究的早期是有價值的,因為它可以提示那些變量需要被研究。
但是在試圖建立理論的時候,個案是缺乏科學性的。原因有:
——個案缺乏比較,并不能排除其他的可能解釋(即不能排除是因為其他變量引起的,因此科學上必須設法對其他變量進行控制)。
——心理學理論是概率性的,因此總是存在于理論相悖的個案。
2.在臨床醫學和心理學上,個案之所以缺乏科學性,是因為存在“安慰劑效應”和“自愈效應”這個兩個變量,而個案沒有辦法對這兩個變量進行控制,不能排除結果可能是由這兩個變量引起的。
3.鮮活性效應。由于“鮮活性效應”存在,個案作為并不科學的證據,往往被錯誤地過分倚重,我們必須要克服這種錯誤傾向。
對“鮮活性效應”的正確應用,不是在證明理論上,而是在闡述理論上。我們應該用科學的方法來證明理論,然后用生動的個案來闡述理論,讓公眾接受。
第五章 相關并不代表因果
本章討論了相關不代表因果的三個原因。
1.方向性
變量A和變量B相關。但到底是A造成B?還是B造成A呢?這是沒辦法直接從相關性中得出結論的。
2.第三方變量
變量A和變量B相關,但是A和B之間可能沒有直接的因果關系。很可能是一個第三方變量C,分別和A相關和B相關。
3.選擇性偏差(即因為統計樣本被進行了選擇,而造成的偏差)
“方向性”和“第三方變量”都是真相關,但是不代表因果。而“選擇性偏差”是一種假相關,是由于樣本經過了一道自我選擇從而不夠有代表性造成的假相關,也就更加沒有辦法反映因果。
4.“選擇性偏差”的一個著名例子
二戰時有一個飛行分析師,他分析了一些轟炸機歸來后,機身的彈孔分布情況,發現某些地方彈孔多,某些地方少或者沒有。有些人會以為,應該在彈孔多的地方增加防彈加固板,因為從歸來的飛機來看,這些彈孔多的地方肯定容易被擊中,所以應該重點防備。
可是這樣就犯了選擇性偏差的錯誤。因為你做分析時所用的樣本并不具有代表性,已經經過了一道自我選擇,一部分飛機已經墜毀。
因此,你僅僅在歸來的飛機上(經過選擇的樣本上)做統計分析,就可能得出錯誤的結論。
正確的做法是要在無彈孔或者少彈孔的地方加固,因為那些地方中彈的飛機都沒飛回來。
5.相關雖然不代表因果,但是相關本身也是很有價值的。比如大數據,事實上,就是一種相關。當我們的目的僅僅是預測,而不是找出因果的時候,有相關就足夠了。
第六章 如何從相關性中找出真正的因果
在上一章節的基礎上,進一步討論了如果相關不代表因果,那么如何在相關中找到真正的因果。
1.由于存在“選擇性偏差”和“第三方變量”,你要從相關性中找到真正的因果,則必須進行控制和操縱實驗。
——控制。即采取各種手段控制其他的變量BCD...的保持不變。比如在選擇樣本的時候要具有代表性,從而避免選擇性偏差。比如在分配實驗組和對照組的時候遵循隨機原則,從而最大程度保持兩組的變量基本一致。
——操縱。即在控制其他變量不變的基礎上,操縱你要考察的那個變量A進行變化,看能否得到不同的結果,從而得出A是否與結果具有因果關系。
2.實現控制和操縱的最好辦法就是在實驗中設置實驗組和對照組進行比較。
——隨機分配樣本,使得實驗組和對照組的變量保持一致。
——同時對實驗組的變量A進行操縱,并將結果與對照組進行比較。
這也再一次說明孤立的個案和見證敘述,由于缺乏比較,不能控制其他變量的影響,是不具備科學性的。
3.現實生活中,很多變量往往是相互聯系的。比如經濟水平高的人,往往所處環境更好、營養更均衡、受教育程度更高。
那么為了達到控制和操縱的目的(剔除第三方變量的影響),科學家必須設計一些非自然的實驗,從而把要考察的變量分離出來。
第七章 對實驗的“人為性”質疑的回應
由于上一章談到的實驗的非自然性(在自然條件下,找不到這樣的實驗情景),引發了一種質疑,即人為設計的實驗得到的因果關系,是否準確,能否應用到真實的生活中。本章對此作出了回應。
1.這種質疑一部分來自于公眾對科學研究方法的不了解
實際上,非自然性不是實驗的缺點,而是實驗的優點。因為在自然條件下,各種變量往往互相聯系,也就無法對變量進行分離考察。
正是由于種種設計巧妙的非自然實驗,我們才能夠把變量分離出來,單獨考察它對結果的影響。
2.這種質疑一部分來自于人們對于很多心理學實驗取樣的非隨機性(比如很多實驗都用大學生做樣本,那么質疑就是大學生能否代表所有的人群)。
實際上,是否隨機取樣,是取決于不同的實驗目標的。
——在某些實驗中,我們假設大學生與其他人群的不同變量(比如年齡、經濟水平),對實驗的最終結果沒有影響。
比如在醫學中,用某個大學生做實驗得到的骨骼構造,也同樣可以推廣到所有的正常人身上。在骨骼構造這個目的上,并不因為實驗樣本是大學生,而無法推廣至所有人去。
——在某些實驗中,僅僅用大學生做樣本,確實可能存在一些問題。
但是。
首先,這并不能說明研究出來的結果是無效的,只能說需要更多實驗來證明該結果具有可推廣性。
其次,即使在推廣中得到了與理論不同的數據反饋,我們也不會完全否定該結論的價值,而是會根據該反饋,對理論進行完善。
3.這種質疑一部分來自于公眾對科學研究類型的不了解
科學研究可以大致得分為理論研究和應用研究。
應用研究的目的是為了預測具體環境下的事件,那么具體實驗情境就會比較重要。
理論研究的目的是為了發展完善理論,那么具體的實驗情境就不重要,理論并不會因為你的實驗是人工還是自然而有所不同。理論對應用是一種間接的價值。
4.科學界對“人為性”質疑的實質回應。
事實上,科學界是最樂于自我批評的一個領域。某些實驗的樣本非隨機這個問題,早已經被科學界考慮在內。
——比如在不同的群體中進行可重復實驗。
——比如在理論模型中加入年齡變量。
——比如在心理學中進行跨文化研究。
——比如巧妙地設計一些自然情景下的實驗,最直接回應“人為性”的質疑。
第八章 科學的兩個原則——關聯性和聚合性
1.關聯性。
科學的發展,新理論的提出與舊理論總是關聯性的,是在舊理論基礎上的進一步發展,而不是對舊理論的否定。
即便是有著巨大飛越的愛因斯坦的相對論,在微觀層面上,跟牛頓力學也是吻合的。
關聯性也是判斷是否是偽科學的一個重要標志。
2.聚合性。
科學理論的發展,往往不是靠某一個完美的實驗,而是一堆并不完美的實驗聚集在一起所形成的聚合效應。這個聚合效應有兩個層面上的意思。
——實驗A并不完美,但是它排除了某一種可能的解釋。
實驗B也一樣不完美,但是它可以排除另一種解釋。
ABCDE…幾個實驗聚合在一起,就形成了一個比較完善的理論。然后再等待新的實驗出現,理論再進一步完善。
——實驗A呈現了某種結果,但是實驗A設計上并不完美,可能存在某種缺陷,并且現在也無法確定是不是正在因為缺陷,才導致了這個結果。
實驗BCD…也呈現了該結果。但是實驗B CD…也不完美,但是因為B CD…的缺陷跟A的缺陷不一樣,因為你就不能說該種結果正是由于某種缺陷導致的。
或者說某個實驗是有缺陷的,但是這個缺陷卻正是其他實驗的強項。
因此,在無數個實驗的聚合效應下,該結果的說服力就得到了進一步的提升。
所以,通常,對某個具體實驗的批評,并不影響這個理論,因為理論的發展是由無數個實驗聚合在一起后產生的一種共識。這個具體實驗所存在的瑕疵,可能并不是沒有被意識到,而是已經其他的實驗所彌補。
第九章 人的行為往往不是單一原因決定的
前面探討了如何講變量分離出來,以探求變量和結果之間的因果關系。
但是現實生活中,人的行為往往不是單一原因決定的,而是多個原因共同作用的結果。
并且,多個原因之間往往會有交互作用。即一個變量的影響效果因為另一個變量水平的不同而不同。
——比如在兒童精神疾病的研究中,ABCD…均是兒童患病的潛在風險,但是研究發現,僅僅存在一項潛在風險的兒童,其患病的幾率并不比正常兒童高。但當潛在風險增加至兩項時,其患病的風險就超過原來的四倍(這兩個潛在風險起了交互作用)。
這個原則很好理解,但是在現實生活中,由于情緒的影響,人們往往會忘記這個原則。尤其是在爭辯的時候,人們往往會以某一個原因為立論依據,去攻擊其他的原因。
第十章、第十一章 心理學中的概率和統計思維
1.心理學所揭示的所有人的行為,都是以概率的形式表現的。
這也是個案沒有科學性的一個原因,因為既然理論是概率的,你就總能找到與之相悖的特例。比如吸煙致癌,但是你總能找到既吸煙又健康長壽的個體存在。
2.接受錯誤,以減少錯誤。
理論只對整體趨勢有預測作用。
目前,還沒有證據表明,臨床能夠預測統計趨勢是否會在特定個體上出現。因為,現實生活中的變量實在是太多,我們并沒有簡捷的方法可以一一測量。
對臨床預測和統計預測的比較研究表明,我們對個體的預測,并不會優于統計預測。因此,在科學意義上,面試這個事情實際上是缺乏效度的。
如果我們接受不能預測個體這個事實,我們在整體預測上反而可以取得更好的效果。例子見紅藍燈實驗。
3.概率很多時候是反直覺的,因為我們需要特別的學習,來破除這種錯誤的直覺。
我們常犯的一些直覺上的錯誤包括但不限于以下這些:
——賭徒謬論。在硬幣連續拋出正面以后,以為下一次出現反面的概率會加大,事實上,每次都是獨立事件,跟其他次是正面還是反面都沒有關系。
——忽視樣本規模對可信度的影響。比如在接觸了幾個福建人之后,就匆匆對福建人下了定論。
4.我們會有試圖解釋一切行為的傾向,但是,事實上,很多事情,真的就是偶然、和巧合。
5.統計和概率是認識世界的一門重要工具,是有一定難度的,不是一般的了解就可以掌握的,必須通過深入的正規學習。建議從基礎的書籍開始學習。