科學(xué)不是萬能的,因?yàn)榭茖W(xué)是用來解釋當(dāng)下客觀世界的假設(shè)。正是因?yàn)樗且环N假設(shè),所以在將來的某個時候,這個假設(shè)可能會被更好的假設(shè)所取代,于是新的理論產(chǎn)生。科學(xué)的理論(或稱為假設(shè))是可以通過一系列的觀察來證實(shí)的。可觀察、可檢驗(yàn)、可證偽,是科學(xué)的基本特征。科學(xué)的長處不在于它是一個不會犯錯的過程 ,而在于它提供了一種消除錯誤的方式。
哲學(xué)家波普爾稱其為“本質(zhì)主義”的觀點(diǎn)認(rèn)為:從內(nèi)在本質(zhì)或者本質(zhì)屬性的角度對現(xiàn)象做出最終解釋,才算得上是好的科學(xué)理論。但科學(xué)家并不企圖獲得本質(zhì)主義者所追求的那類知識,也不試圖回答關(guān)于宇宙的“終極”問題。自稱完美或絕對知識的主張及做法,往往會阻礙人們的探索,自由而開放地探索知識是科學(xué)活動的一個先決條件。
本質(zhì)主義者的態(tài)度通常有一種表現(xiàn):在探求知識之前,過于關(guān)注術(shù)語或概念的定義。當(dāng)一個詞被當(dāng)做理論中的概念使用之前,我們必須對這個詞所涉及的所有潛在語言問題,有一個全面而且清晰的理解,事實(shí)上這正好與科學(xué)家的工作方式相反。在科學(xué)領(lǐng)域,確定某概念的意義,是在與該術(shù)語有關(guān)的現(xiàn)象得到一定程度的研究之后,而非研究之前。一個精確的概念性術(shù)語來自科學(xué)過程中固有的那種數(shù)據(jù)和理論間的相互作用,而不是關(guān)于語言用法的辯論。科學(xué)家的目的是解釋現(xiàn)象,而非對措詞進(jìn)行分析。神經(jīng)病學(xué)家諾曼·格什溫德將這種區(qū)別描述如下:“我認(rèn)為,從醫(yī)學(xué)發(fā)展的歷史中,你能夠了解一件事 ,那就是:許多人認(rèn)為 ,研究一個問題的方式就是首先定義這個問題,然后再去研究它。這種想法被一次次地證明是錯誤的,因?yàn)槟惆l(fā)現(xiàn),只有先知道了答案,才能正確定義問題”。在所有的科學(xué)學(xué)科里,進(jìn)步的關(guān)鍵在于放棄本質(zhì)主義,接受操作主義。
操作主義的核心思想是:科學(xué)理論里的概念必須立足于可觀測事件,或與可觀測事件相關(guān)聯(lián),而這些可觀測事件是可以被測量的。將概念與可觀測事件相聯(lián)系的是概念的操作性定義,這使概念公開化了。操作性定義使得概念從個人化的感覺和直覺中分離出來,并且允許任何實(shí)施可測量操作的人對概念進(jìn)行檢驗(yàn)。
在科學(xué)領(lǐng)域里,定義一個概念靠的是一系列操作,而非單獨(dú)的行為事件或任務(wù),意識到這點(diǎn)非常重要。相反,一些差別細(xì)微的任務(wù)和行為事件通常聚合在一個概念上。例如,教育心理學(xué)家根據(jù)利用諸如“伍德庫克閱讀能力量表”之類的標(biāo)準(zhǔn)化工具測得的成績,來定義“閱讀能力” 這個概念。該量表測出的閱讀能力總分包含了一些不同分量表測得的能力指標(biāo)。這些分量表測查的能力稍有不同,但全都與閱讀相關(guān)。例如,閱讀一篇文章、想出一個合適的單詞在文章中填空、寫出一個詞的同義詞、獨(dú)立拼讀一個較難的詞,等等。所有這些任務(wù)上的表現(xiàn)綜合地定義了“閱讀能力”這個概念。
概念的操作性定義要想有用,必須同時具備信度和效度。
信度指的是測量工具的一致性,如果你對同一概念進(jìn)行多次測評,是否能夠得到相同的測量結(jié)果,用一句話來概括就是:任何總能夠產(chǎn)生相同結(jié)果的系統(tǒng)所具備的一種屬性。
在科學(xué)領(lǐng)域中,一個操作性定義的信度以類似的方式來評估。如果我們多次測量同一概念得到的結(jié)果是近似的,那么我們就說測量工具表現(xiàn)出較高的信度。信度僅僅是指前后一致,而不包括其他內(nèi)容。對于一個操作性定義而言,僅有信度是不夠的,信度是一個必要而非充分條件。作為一個好的操作性定義,操作必須被證明對于概念來說是有效的測量。
“結(jié)構(gòu)效度”這個術(shù)語是指一個測量工具( 操作性定義 )是否測量了它本應(yīng)測量的內(nèi)容。
一個科學(xué)概念的定義并不是固定不變的,而是隨著相關(guān)觀測結(jié)果的不斷豐富而發(fā)生變化。意識到這一點(diǎn)非常重要,如果一個概念的原始操作性定義在理論上被證明是無效的,那么該定義就會被拋棄,以另外一套定義的操作取而代之。這樣,隨著相關(guān)知識的積累,科學(xué)概念不斷演進(jìn),其抽象性逐漸增加。
人類記憶理論中的概念也以同樣的方式發(fā)展。現(xiàn)代心理學(xué)家很少使用類似“記憶”或“遺忘”這樣的籠統(tǒng)概念;相反,他們測量那些可以進(jìn)行明確定義的記憶子過程,如短時聽覺記憶、符號存儲、語義記憶以及情景記憶。傳統(tǒng)的“記憶”或“遺忘”的概念通過更加明確的操作性概念得到了細(xì)化。
因此,理論術(shù)語的用法在科學(xué)實(shí)踐中不斷演進(jìn) ,而不是在針對文字意義的爭論中獲得發(fā)展。這是科學(xué)的操作態(tài)度和本質(zhì)主義者,在追求絕對定義之間最顯著的區(qū)別。
隨著科學(xué)概念的演進(jìn),概念常常與許多不同的理論體系交織在一起,并且獲得多種操作性定義。這種情況的出現(xiàn)并不是因?yàn)楦拍畋旧沓隽藛栴}。例如,許多人認(rèn)為心理學(xué)不可信,因?yàn)樾睦韺W(xué)中許多重要的理論概念——例如智力,可以用不止一種方法來操作化和概念化。事實(shí)上,在科學(xué)領(lǐng)域里,這種情況是普遍存在的。例如,“熱”既可以從熱力學(xué)理論,也可以從動力學(xué)理論的角度來概念化。
心理學(xué)所面臨的一個難題就是,公眾要求心理學(xué)去回答本質(zhì)主義問題,而通常其他科學(xué)家并不需要回答類似的問題。這類要求常常導(dǎo)致人們貶低心理學(xué)領(lǐng)域已經(jīng)取得的進(jìn)步。盡管這類要求不能阻止心理學(xué)領(lǐng)域自身的發(fā)展——因?yàn)榫拖衿渌茖W(xué)家一樣,心理學(xué)家無視本質(zhì)主義問題并繼續(xù)他們的工作——但那些問題成了公眾理解心理學(xué)的障礙。
深刻理解操作主義的原則,有助于我們識別不具備科學(xué)意義的問題。例如,有一篇標(biāo)題為《動物會思考嗎?》的文章,講述了動物行為方面最新的實(shí)驗(yàn),文章中所引述的研究沒有任何錯誤,但是,顯然這個標(biāo)題僅僅是一個玩笑。這個標(biāo)題的問題在于沒有科學(xué)意義,沒有關(guān)于“思考”的操作性標(biāo)準(zhǔn)。許多報紙的標(biāo)題中存在類似的問題,比如 “計(jì)算機(jī)會思考嗎?”。
盡管大部分人對會思考的計(jì)算機(jī)這一設(shè)想表示強(qiáng)烈反對,但他們并沒有認(rèn)真思考這一問題,也沒有對“思考”做出一個更好的定義。預(yù)設(shè)偏見讓許多人不愿承認(rèn)機(jī)器思考的可能性。幾乎每一個人都認(rèn)為思考是發(fā)生在自然世界中的一個過程。但是請注意,我們在討論其他過程時,并不涉及“起源”的問題,比如這個問題:“起重機(jī)能舉重嗎?”我們的答案是否為“起重機(jī)不會舉重,因?yàn)槠鹬貦C(jī)是由人造出來的。因此,我們只能說是“人”在舉重。起重機(jī)真的不能舉重”?當(dāng)然不能這么說。一些事物的起源與它執(zhí)行某一特定任務(wù)的能力是完全不相關(guān)的。思考的過程也是如此。
因?yàn)槿藗儫o法理性地接受機(jī)器有思考的能力,艾倫·圖靈設(shè)計(jì)出著名的“計(jì)算機(jī)能否思考”的操作性實(shí)驗(yàn),這對于我們的討論是非常重要的。他的想法是:如果計(jì)算機(jī)能夠進(jìn)行智能對話的話,那么就可以說它是有思考能力的。圖靈這一設(shè)想的創(chuàng)造性在于,他提出了一種能將問題變得可操作化的方式,同時又防止了“預(yù)設(shè)偏見”的干擾。
圖靈測試啟發(fā)我們,如果我們想要理性地討論一個概念,那么操作性定義是必需的。我們要以一種有條理的方式進(jìn)行判斷,而不僅僅根據(jù)我們自己對某個問題的偏見。
觀察人們討論人工智能問題時所展示的思維方式,就能發(fā)現(xiàn)科學(xué)和非科學(xué)思維方式之間的區(qū)別。科學(xué)的方式是先發(fā)展一種合理的操作性定義,然后看我們可以從中得出哪些關(guān)于思考、計(jì)算機(jī)和人類的結(jié)論。與之不同的是,預(yù)設(shè)偏見主導(dǎo)了大多數(shù)人的思維,它對于計(jì)算機(jī)和人類表現(xiàn)出來的差異并不感興趣。相反,一旦形成定勢,他們就會絞盡腦汁地去找出各種理由,來鞏固自己的這些想法,避免發(fā)生改變。正是這種預(yù)設(shè)偏見和非操作性的本質(zhì)主義態(tài)度,讓人們認(rèn)定他們“就是知道”思維到底是怎么回事。持這種態(tài)度的人很多,說明了科學(xué)的普及遠(yuǎn)未達(dá)到應(yīng)有的高度!
此文對我們將來的評估工作有較大的啟發(fā)。盡可能用科學(xué)的態(tài)度和方法開展評估工作,才更有現(xiàn)實(shí)意義。