公眾號(hào):你想看的World(Youw2s)
Derek最近搗鼓了一個(gè)學(xué)習(xí)英語(yǔ)的社群,糾集了一群有共同愛(ài)好的朋友一起利用閑暇的時(shí)間學(xué)習(xí)英語(yǔ)。通過(guò)這個(gè)學(xué)習(xí)群,Derek認(rèn)識(shí)了很多很有毅力的英語(yǔ)學(xué)習(xí)者,于是,Derek的微信朋友圈里面多了一條另類的風(fēng)景線,“背單詞打卡”;現(xiàn)在幾乎所有背單詞的APP,都有分享朋友圈發(fā)送打卡信息給朋友的功能,于是,我開(kāi)始每天看著很多人“我已經(jīng)在XXAPP上背單詞xx天了,今天已經(jīng)征服了xx個(gè)單詞”。一般看到這種情況,我非常喜歡給大家點(diǎn)個(gè)贊,因?yàn)槲抑溃?strong>“背單詞”,絕對(duì)是一個(gè)非??嗟牟钍拢还苣闶褂檬裁碅PP,這種充滿了負(fù)反饋,不斷挑戰(zhàn)你耐心的學(xué)習(xí)活動(dòng),實(shí)在是值得上一個(gè)大大贊。
或許是好為人師的緣故,身邊不斷有朋友向Derek請(qǐng)教背單詞的方法和技巧,企圖找到一個(gè)不那么痛苦的方式。因?yàn)閱?wèn)的人太多,我突然覺(jué)得應(yīng)該寫(xiě)個(gè)文章出來(lái)共同討論下這個(gè)問(wèn)題。
我首先明確一下我自己的認(rèn)知,背單詞雖然不是學(xué)習(xí)英語(yǔ)的全部,但的的確確是英語(yǔ)水平提高必不可少的一個(gè)重要環(huán)節(jié)。所以,企圖從本文里找到一個(gè)捷徑的同學(xué)可能要失望了,我確實(shí)拿不出一個(gè)“躺在床上就學(xué)好英語(yǔ)”的好辦法來(lái)。因此,我并不打算在本文討論是否需要背單詞的問(wèn)題,也不討論方法問(wèn)題,我打算聊聊,如果要背單詞,你應(yīng)該選什么詞表。
實(shí)際上,本文是寫(xiě)給那些準(zhǔn)備真正提升英語(yǔ)能力,希望通過(guò)英語(yǔ)能更好的了解這個(gè)世界的朋友??荚圏h的選擇其實(shí)非常小,幾乎所有的為考試準(zhǔn)備的學(xué)習(xí)方法里面,都有一個(gè)對(duì)應(yīng)的詞表,需要考試的朋友可以略過(guò)了,因?yàn)槟阒恍枰P(guān)注大綱要求的詞表即可。
為什么我們需要一個(gè)詞表
現(xiàn)在,是一個(gè)移動(dòng)智能終端極度發(fā)達(dá)的時(shí)代,幾乎所有成人朋友在打算重拾英語(yǔ)的時(shí)候,都會(huì)選擇使用手機(jī)APP來(lái)背單詞,而所有的APP背單詞軟件都有幾大必須存在的功能:
- 適合各個(gè)水平階段的詞表
- 有對(duì)應(yīng)音標(biāo)
- 帶發(fā)音,例句
- 科學(xué)的記憶曲線,方便復(fù)習(xí)
這幾個(gè)功能,幾乎所有的背單詞APP都有,結(jié)合我們今天的主題,我們聊聊詞表。
在選擇開(kāi)始背單詞前,這幾乎是你的第一個(gè)需要作出決定的事情,你選擇什么樣的詞表來(lái)背?準(zhǔn)備考試的朋友還好辦,考啥背啥,根據(jù)大綱來(lái),如果準(zhǔn)備中考,就背中考詞表,如果準(zhǔn)備高考,就找找高考詞表。
對(duì)成人學(xué)習(xí)者來(lái)說(shuō),這個(gè)選擇就比較尷尬了,很多的成人英語(yǔ)學(xué)習(xí)者對(duì)自己的英文水平其實(shí)并不了解,他們掌握英語(yǔ)的目的是使用它,而不是應(yīng)付考試。這個(gè)時(shí)候,大部分人的選擇就比較盲目。上過(guò)大學(xué)的朋友,丟掉英語(yǔ)多年,比較可能選的詞表是四級(jí)詞匯或者六級(jí)詞匯,沒(méi)有上過(guò)的呢,很多都是從什么小學(xué)詞匯,中學(xué)詞匯,新概念第一、第二冊(cè)開(kāi)始,還有些朋友,估計(jì)是聽(tīng)過(guò)一些英語(yǔ)學(xué)習(xí)的講座,選擇了一些比較另類的詞表,比如說(shuō),老友記詞表,絕望主婦詞表來(lái)背。
朋友們,既然是學(xué)習(xí)英語(yǔ)的目的是真正的使用,那么大家有沒(méi)有想過(guò):
我們學(xué)了十幾年英語(yǔ),每個(gè)人心中都必然有個(gè)疑問(wèn):
想要流暢輕松的讀懂大部分的網(wǎng)頁(yè),小說(shuō),報(bào)刊,新聞等原版材料,大概需要多少詞匯量?
著名網(wǎng)站testyourvocab.com歷時(shí)幾年,做了一個(gè)比較真實(shí)完整的調(diào)查。
調(diào)查結(jié)果如下:
- 絕大多數(shù)母語(yǔ)成年人士的詞匯量為20,000–35,000 words
- 8歲的母語(yǔ)人士平均詞匯量為10,000 words
- 4歲的母語(yǔ)人士平均詞匯量為5,000 words
- 母語(yǔ)人士的詞匯量大小主要是4到15歲之間的閱讀量決定
令人比較喪氣的結(jié)果如下: - 絕大多數(shù)外語(yǔ)人士的詞匯量?jī)H為4,500 words
- 在英語(yǔ)國(guó)家居住的母語(yǔ)人士詞匯量平均僅為10,000 words
不少人看到這里肯定心存懷疑,考完專八背完托福詞匯卻無(wú)法流暢閱讀的也大有人在,與語(yǔ)言學(xué)家的研究“大相徑庭”。
究其原因,關(guān)鍵在于對(duì)“常用詞匯”的認(rèn)知。
語(yǔ)言學(xué)家發(fā)現(xiàn)的另一個(gè)有趣事實(shí)是:
英語(yǔ)使用頻率最高的9個(gè)單詞,在任何一篇100詞以上的文章中出現(xiàn)的頻率達(dá)25%!
所以,想要高效背單詞,必須了解每個(gè)單詞在母語(yǔ)使用者日常生活中出現(xiàn)的頻率高低。
詞匯量不在于你背了多少生僻單詞,而在于你日常生活會(huì)用的有多少。Active vocabulary才是英語(yǔ)學(xué)習(xí)中最重要的部分。
問(wèn)題浮出水面了,到底有沒(méi)有一個(gè)詞表,真正適合以實(shí)用為目的。寫(xiě)到這里,聰明的大伙可能已經(jīng)明白了,如果要說(shuō)以實(shí)用為目的,顯而易見(jiàn),就是根據(jù)英語(yǔ)詞匯使用的頻率統(tǒng)計(jì)出來(lái)的詞匯表了。那么,這樣的一個(gè)東西,存在嗎?如果存在,它是否權(quán)威?
先給答案:存在?。。〗^對(duì)存在??!權(quán)威?。。〗^對(duì)權(quán)威!!!
COCA詞表的介紹
COCA,全稱Corpus of Contemporary American English,即當(dāng)代美國(guó)英語(yǔ)語(yǔ)料庫(kù),它是這個(gè)世紀(jì)里最大的美國(guó)語(yǔ)言學(xué)研究項(xiàng)目,地位影響深遠(yuǎn)。
最重要的是,它研究的對(duì)象全部都是當(dāng)代美國(guó)英語(yǔ)語(yǔ)料,基本不包括20世紀(jì)早期和19世紀(jì)的語(yǔ)料。
COCA項(xiàng)目至今還沒(méi)結(jié)束,目前收集了4億詞匯的文獻(xiàn)資料。這4億詞匯的基礎(chǔ)材料包括1990至2015年這幾十年里閱讀量最廣泛的小說(shuō)和雜志(TIME, New Yorker等都是項(xiàng)目的參與者),電影、電視節(jié)目,大量的電話記錄和面對(duì)面談話記錄,甚至還包括911報(bào)告等)。它根據(jù)使用時(shí)間、文獻(xiàn)性質(zhì)等使用統(tǒng)計(jì)學(xué)方法進(jìn)行分類統(tǒng)計(jì),等于是在編一本帶詞頻和流行用法的新美國(guó)英語(yǔ)使用辭典。
在COCA當(dāng)前成果基礎(chǔ)上,美國(guó)楊百翰大學(xué)對(duì)這個(gè)資料庫(kù)用計(jì)算機(jī)方法篩選出了美語(yǔ)使用頻率最高的5000和20000個(gè)高頻詞匯。曾經(jīng)有人用GMAT和GRE的資料驗(yàn)證了一下這個(gè)詞匯表的覆蓋率,證明它的20000單詞覆蓋率真的很高,幾乎全部覆蓋,只有一兩個(gè)很個(gè)別的詞沒(méi)查到。
這個(gè)詞匯表最好的地方在于是每個(gè)單詞不僅帶詞頻和同義詞,而且還根據(jù)不同的詞性標(biāo)注著collocation,也就是所謂的搭配用法。就是標(biāo)出和這個(gè)詞使用最相關(guān)、密度最高的詞的集合。
有了它,我們就知道美國(guó)人對(duì)這個(gè)詞的最常用的幾十種用法和使用環(huán)境。
比如說(shuō)script排3315,這個(gè)詞的搭配里,常見(jiàn)的形容詞搭配是final, original和feminine,常見(jiàn)的名詞搭配是movie, film, writer,常見(jiàn)的動(dòng)詞搭配是write, read, follow. 所以我們知道這個(gè)詞的用法就有final script, write a script等等。這個(gè)比死記硬背好太多了。
這個(gè)語(yǔ)料庫(kù)涵蓋美國(guó)現(xiàn)當(dāng)代時(shí)期的口語(yǔ)(spoken)、小說(shuō)(fiction)、流行雜志(pop magazine)、報(bào)紙(newspaper)和學(xué)術(shù)期刊(academic)五大類型的語(yǔ)料庫(kù),并且在這五個(gè)類型方面基本呈均勻平衡分布。
美國(guó)當(dāng)代英語(yǔ)語(yǔ)料庫(kù)的文本內(nèi)容包括:
- 口語(yǔ)(spoken):包括150個(gè)電視或廣播節(jié)目對(duì)話,約85000000字。
- 小說(shuō)(fiction):包括短篇故事、戲?。娪皠”?,約81000000字。
- 雜志(popular magazines):包括新聞、健康、家庭園藝、女性話題、財(cái)經(jīng)、宗教、運(yùn)動(dòng)等將近100種不同領(lǐng)域的雜志,約86000000字。
- 報(bào)紙(newspapers):包括10家報(bào)紙不同版面(地方新聞、評(píng)論、運(yùn)動(dòng)、財(cái)經(jīng))的文章,約81000000字。
- 學(xué)術(shù)期刊(academic journals):包括近100種不同種類的期刊,約81000000字。
在這個(gè)龐大的語(yǔ)料庫(kù)中使用頻率最高的20000個(gè)單詞極具代表性,幾乎覆蓋所有權(quán)威英語(yǔ)考試的詞表。
COCA的詞表的樣子
COCA的最常用20000詞的詞表,是一個(gè)有2000多頁(yè)的文件,這份文件里面,沒(méi)有詞匯的解釋,如下圖,主要包含幾個(gè)部分
- 詞頻
- 根據(jù)詞性的搭配,如前面最經(jīng)常搭配什么詞匯,后面經(jīng)常搭配什么詞匯;
-
近義詞;
- 189代表詞頻,也就是company做n(名詞)時(shí),它出現(xiàn)的頻率在英語(yǔ)中是189位。
- 后面adj代表有哪些形容詞經(jīng)常和company這個(gè)名詞搭配。小黑點(diǎn)代表詞的位置,比如 drug company, phone company,不要理解成company drug, company phone。至于為什么有的詞有小黑點(diǎn)有的沒(méi)有,我也沒(méi)搞明白。
- 后面的大黑點(diǎn)代表同義詞。company做公司解釋時(shí),意思是business等,做朋友解釋時(shí),意思是companionship等,等等。
- 后面的203345代表在4.5億中出現(xiàn)的次數(shù)。0.93代表分布均勻度。越接近1代表在各種文體中分布越均勻。詞頻排名=次數(shù) * 均勻度。
- 有些詞的均勻度后還有個(gè)類似S,M等后綴,代表這個(gè)詞主要出現(xiàn)在如下文體中:Spoken, Fiction, Magazines, Newspapers, Academic
如何使用COCA詞表
寫(xiě)了這么多,終于找到一個(gè)真正按照語(yǔ)言實(shí)際使用情況的詞表了,這就意味著,這個(gè)兩萬(wàn)的詞表拿下,就掌握了英語(yǔ)世界的最高頻使用的詞匯,這可比任何為考試準(zhǔn)備的詞表更適合成年的英語(yǔ)學(xué)習(xí)者了。那么,這個(gè)詞表怎么使用呢?怎么才能開(kāi)始使用這個(gè)詞表呢?
扇貝單詞APP
扇貝上面有很多熱心人制作的各種詞表,有些免費(fèi),部分收費(fèi),在扇貝上面就有這個(gè)COCA的20000詞表,大家搜索一下應(yīng)該可以看到,如下圖,如果手里還有貝殼的話,大家可以購(gòu)買(mǎi)。
自行導(dǎo)入
目前,有很多背單詞的APP,支持詞表的自行導(dǎo)入,你可以用一個(gè)包含了詞表的純文本文件,直接導(dǎo)入到軟件里面背誦,據(jù)Derke所知,“知米背單詞”這個(gè)APP就可以自行導(dǎo)入詞表。只要你的詞表是UTF-8格式的純文本,都可以導(dǎo)入到“知米背單詞”。
如何獲得COCA詞表,下載資源
COCA詞表如果直接拿來(lái)背單詞,就是上面大家看到的那樣,確實(shí)難以直接使用,為了方便大家,造福群眾,Derek秉承著不給解決方法只提出問(wèn)題的任何干貨都是耍流氓的思路,啟動(dòng)了我的看家本領(lǐng),編程序,我從PDF文件中提取了20000所有詞表,并對(duì)文件根據(jù)詞性進(jìn)行了分類,還體貼的分成了10000,20000,兩個(gè)文件,并提供20000分詞性的版本,即按動(dòng)詞,形容詞,副詞等幾個(gè)大類進(jìn)行了分解。做到這一步,如果你還不點(diǎn)贊我就真生氣了,現(xiàn)在提供如下幾個(gè)文件下載:
- 20000詞表純TXT版本
- 0-10000 詞表純TXT版本
- 10000-20000詞表TXT版本
- 20000詞表分詞性版
- COCA原版詞表2200頁(yè)P(yáng)DF
注意:詞表不包含單詞解釋,大部分的軟件在導(dǎo)入詞表時(shí),會(huì)自動(dòng)添加解釋。
如何獲得:大家需要學(xué)習(xí)可以向我借閱,這是地址( https://pan.baidu.com/s/1bBcQr8 密碼: ti43)
公眾號(hào):你想看的World(Youw2s)