当前位置:文档之家› 中国学习者英语口语词汇量及常用词汇研究_基于英语口语语料库的词目研究11111

中国学习者英语口语词汇量及常用词汇研究_基于英语口语语料库的词目研究11111

中国学习者英语口语词汇量及常用词汇研究_基于英语口语语料库的词目研究11111
中国学习者英语口语词汇量及常用词汇研究_基于英语口语语料库的词目研究11111

收稿日期:2005-01-20

作者简介:甄凤超(1977-),男,河南安阳人,上海交通大学外国语学院博士研究生,主要研究方向为语料库语言学。

中国学习者英语口语词汇量及常用词汇研究

———基于英语口语语料库的词目研究

3

甄凤超

(上海交通大学外国语学院,上海200240)

摘 要:本研究比较COLSEC 、BNC (口语部分)和I CE (口语部分)三个口语语料库中词目覆盖率及常用词目,目的是分析中国学习者考试环境下会话词汇量及掌握常用词汇的情况。统计结果显示,中国学习者英语会话词目数量较少,词目覆盖率大,某些常用词目被高频使用。此外,学习者并没有完全掌握日常英语会话所需的常用词目,其会话缺乏足够的交互性。因此,我们应当在英语口语教学中继续加强常用词汇的教学。

关键词:口语语料库;词目;覆盖率

中图分类号:H31919 文献标识码:A 文章编号:10022722X (2005)0520038205

Vocabul ary S i ze and Co mm on Vocabul ary of

Ch i n ese L earners πSpoken English:A Corpus 2ba sed Study of L emma

ZHE N Feng 2chao

(College of Foreign Languages,Shanghai J iaot ong University,Shanghai,200240,China )

Abstract:The p resent study analyzes the vocabulary size and common vocabulary of Chinese learners πs poken English by comparing the le mma coverage and common le mmas in COLSEC,BNC (s poken texts )and I CE (s poken texts ).The findings show that Chinese learners use comparatively fe wer le mmas and overuse s ome common le mmas .Further more,Chinese learners are unable t o use s ome common vocabulary in s poken English discourse that p lay an essential r ole in conversati on .W e suggest that common vocabulary should be given more attenti on in teaching s poken English in China .

Key words:s poken cor pus;lemma;coverage

0.引言

据有关文献显示,目前词汇研究的焦点问题之一是:学习者掌握多少词汇才能满足日常口语交际的需求?对此,众说纷纭。Schonell 通过人工计算推断,大约2000个词族(word fa m ily ),包括单词的基本形式、屈折变化和派生词覆盖了日常会话词汇的99%,是学习者需要掌握的基本词汇。(1956,引自Adol phs &Sch m itt,2003)Schonell 研究的样本总量为512647个英语单词。后续研究,如Schm itt (2000)和Nati on 和Meara (2002)普遍接受Schonell 的观点。近年来,语料库语言学的飞速发展,尤其是大型口语语料库的建立,如BNC (B ritish N ational Corpus )口语部分、I CE (Interna tional Corpus of Eng lish )口语部分、CANCODE (Cam bridge and N ottingham Corpus of D iscourse in

English )等,为更加准确研究词汇覆盖率提供了基

础。Adol phs 和Schm itt (2003)基于CANCODE 的研究表明,2000个词族仅占该语料库的95%左右,而5000个单词(individual words )的覆盖率仅为96%,由此推断学习者需要掌握更多的词汇才能成功地进行日常会话。

上述研究引发的另一个议题是:学习者需要掌握覆盖率为多少的词汇才能成功地进行日常口语交际?到目前为止,对该问题的答案还未达成共识。Bonk (2000)基于口语文本,推断日本学习者需要掌握至少95%覆盖率的单词,才能成功地进行口语交际,而低于80%会导致交际困难。其他研究均基于书面语文本,结论在95%到99%之间。本研究借助他们的研究成果,并根据上海交通大学建立的中国学习者英语口语语料库(COLSEC ),对比分析了

第28卷 第5期2005年9月解放军外国语学院学报

Journal of P LA University of Foreign Languages Vol .28 No .5Sep t 12005

英语学习者口语与英语母语口语词目覆盖率及常用词目使用的差异,试图了解中国学习者掌握口语词汇的情况。

1.研究方法本研究采用词目统计方法,使用COLSEC 、BNC (口语部分)、I CE (口语部分)和CLEC 等语料库以及Words m ith 和SPSS 等软件。词目(le mma )包括“单词的基形(base f or m )及其屈折变化(inflected f or m ),并用单词的基形表示”

(Nati on &W aring 1997:9)。所有的形式进行词目归并

(le mmatizati on )。从定义上看,词目覆盖率要高于

单词覆盖率,而略低于词族覆盖率。我们采用词目

研究,一方面为了便于操作(词目统计词型而非语义),另一方面词目比单词更加准确描述学习者的

词汇量。为了比较COLSEC 与英语为母语的语料库

的词目,本研究对COLSEC 的语料做了一些筛选处

理。语料中有许多结巴语,如edu 2educa 2educati on,

软件自动统计出三个型符(t oken ):edu 、educa 、educati on,前两个均为不完整的英语单词。另外

,语料中有许多汉语拼音,如nage (那个),jiushi (就是),Zhaobo (人名)。如果把这些信息统计进COLSEC 词目表同英语为母语的语料库比较,则中国学习者的口语词汇量明显含有水分。因此,本研究在统计词目时,在词目表上手动删除不完整的英语单词和汉语拼音(中国地名和反映中国本土文化的汉语拼音除外,如jiaozi 、w ushu 等)。经过处理,原语料库的型符数从723299减为717049,类符数从9192减为7535。这些改动均在词目频数排列表上进行,没有影响语料的原貌。

另外,我们以Yasu masa Someya (1998)编制的E 2le mma 表为依据,设计出适合本研究的词目归并标准。细则如下:

1)词目包括单词的基形及其屈折变化形式。如名词复数形式,动词单数第三人称、过去时、过去分词及现在分词形式,形容词、副词比较级与最高级形式。

2)同形异义字,如bank (银行)与bank (岸)归并为同一个词目bank 。

3)省略体,如we πll 、I πm 、they πre 、he πs 、you πd 、gonna 等归并为各自不同的词目。

4)非语言声音,如eh 、uh 、mmm 、uh 等作为重要的口语话语特征,包含大量的语义信息,归并为各自不同的词目。

2.结果与讨论211词目覆盖率

根据Words m ith 的统计,BNC (口语部分)总型符数为9853249,I CE (口语部分)为719578。从库容量看,COLSEC 与I CE 接近。经过词目归并,我们统计出三个口语语料库词目总量:COLSEC 为5406,BNC 为47690,I CE 为16678。表1为常用

词目在三个语料库中的覆盖率,词目数按频数高低降序排列。 表1.COLSEC 、BNC 、I CE 中词目数及覆盖率

词目数

覆盖率%

C OLSEC

BNC I CE 2543115381013719150551755018148117100681916215458199200

80110

72116

67196

5009110982108781081000951998812984181

1500971809112388120

2000981659310390134

25009910994126911843000991369511592195 表1显示了词目数及其在三个语料库中的覆盖率。如,COLSEC 中频数最高的前25个词目占该库的43115%,BNC 为38101%,I CE 为37191%。为了直观显示词目数在三个口语语料库中的覆盖情况,我们做了词目覆盖率曲线图:图1.COLSEC 、BNC 、I CE 中词目覆盖率比较数据显示,COLSEC 词目总量少,仅为I CE 的1/3,不到BNC 的1/8。COLSEC 前3000个词目的覆盖率为99136%,而BNC 与I CE 分别是95115%和92195%。另外,COLSEC 词目覆盖率增长速度急骤,前1500个词目的覆盖率已达到97180%,而两个英语为母语的语料库覆盖率增长速度较缓。需要说明的是,由于考虑到词汇覆盖的问题,我们在建设COLSEC 时,选择了2000年至2004年上海、北京、武汉三个考区共39个考试话题的样本。尽管如此,受考试因素的局限,语料有可能没有充分

?

93? 第5期甄凤超 中国学习者英语口语词汇量及常用词汇研究

反映出学生业已掌握的词目量。然而,在目前条件下,COLSEC 的词目数据不失为反映中国大学生英语口语词汇情况的有益参照。对上述三个口语语料库词目覆盖率的比较分析,从一定程度上说明中国学习者的口语输出词汇量有限,掌握的词汇量比较少,使用面比较宽,过度使用了他们所掌握的常用词。

212常用词目研究

我们比较了COLSEC 、BNC 、I CE 和CLEC 的常

用词目,试图找到它们之间的异同。增加CLEC (中国学习者英语语料库,含书面语语料),是为了对比研究中国学习者英语口语与书面语常用词目的差异。以BNC 前100个词目为参照,比较其在四个语料库中的位置,运用相关系数和聚类分析的统计方法,观察它们之间的差异。表2为BNC 前100个常用词目及其在其他三个语料库中的位置。

表2.BNC 前100个词目及其在其他三个语料库中的排列次序

LE MMA BNC I CE COLSEC

C LEC LE MMA BNC I CE COLSEC CLEC the 1111then 516413396be 2222right 5257119171and 3344up 537516686I 4638or 54445655t o 5753see 55678887you 610715the m 56858958

a 7585mm 577122—

that 882512come 5874146103

it 99219she 596414389of 104106now 606328116in 1111117out 617226395have 12131211your 62932381do 13162418when 63737944get 14305947

t w o 6476112110er 15146—me 65887661yeah 1639787074

mean 6658

167158on 17173120I πm 67—98239we 18231310very 6854

12542go 19296649fr om 69566439this 20163724want 70988082they 2119

1916my 71681522it πs 22—

43128thing 72838367what 23276084which 734819571f or 24201714l ook 74100337149but 25182923ti m e 75805737say 2640

6164

because 76664659er m 27—40—peop le 77783319well 2834

103106

take 78979674know 29375254s ome 79842731s o 30251821make 80907730one 31354745how 8199125107no 324214292put 82138214206he 33226825use 831259077there 34245840three 84114

278284think 3533950I πve 85—627927can 36411413really 8681

193315oh 3765186711by 8759

12851not 38313029you πre 88—

13161352if 39493653down 89125565237will

40

21

16

17

good

90

105

42

52

?

04?解放军外国语学院学报2005年 

at413212336thereπs91—1881204 with42283226more92864128 thatπs43—72575work931078656 all44474434here9411016057 as45264827other95943860 donπt466173122back96113443211 just475251154any97111300190 yes484367869cos98260232211420 like49603457year9910315462 about50516275theyπre100—13951553 注:—符号表示该词目未在该语料库中出现。

表2数据显示,四个语料库前两个词目排序相同,为the和be。从第三个词目开始出现差异,如and在BNC与I CE中排在第三位,而在COLSEC与CLEC中位居第四位。BNC与I CE前10个词目相同,尽管有些排序差异,它们是the、be、and、I、t o、y ou、a、that、it、of。同两个英语为母语的语料库相比,COLSEC前10个词目中没有that和it,取而代之的是er与think。说明中国学习者在会话中过度使用插声停顿(filled pause)和话语填充词(conversati onal filler)。CLEC前10个词目中没有you和that,而是in和we,并且过度使用词目I和we。为了进一步揭示它们之间的关系,我们采用了相关分析统计。表3显示100个词目在四个语料库中频数排序的相关矩阵。

表3.100个最常用词目在四个语料库中频数排序的相关矩阵

BNC I CE COLSEC CLEC

BNC1

I CE01705941091

COLSEC014326630201387352151

CLEC0114712916013764250101708663511

从数据看,两个英语为母语的口语语料库的相关系数约为0171,有非常显著的统计学意义; COLSEC与CLEC相关系数约为0171,也有非常显著的统计学意义。而COLSEC和两个英语为母语的口语语料库的相关程度较低,分别约为0143 (BNC)和0139(I CE)。CLEC和两个英语为母语的口语语料库的相关系数更低,分别约为0115 (BNC)和0138(I CE)。这说明中国学习者会话中最常用的词目同英语母语者存在显著差异。从表2数据看,差异最明显的词目并非功能词(如代词、冠词、介词、助动词、连词等),而是一些意义宽泛的实词,如get、yeah、well、think、know、right、see、mean、come、really。Stenstr om(1990)把这些词定义为话语标记词(discourse markers),在会话中起到组织话语结构(如well、right、yeah、

really),以及表现人际关系(如you know、I think、I see、I mean、you mean)等功能。有数据显示,学习者在会话时不能灵活使用话语标记词,导致其会话缺乏交互性。另外,我们发现学习者高频率使用某些意义宽泛的实词,但其搭配形式却较为简单。如think词目,在COLSEC词目排列表中位居第9位(在BNC与I CE中分别为第35和33位),其搭配形式多为I think、do you think、s o I think、but I think等。而在英语为母语的语料库中与think 一起搭配使用的词块(chunk)有很多,如:I donπt think、do y ou think、I think that、well I think、yes I think、I should think、I canπt think、if you think、I would think、I do think、but I think、I think s o、donπt y ou think、Now I think、actually I think、I al w ays think、I mean I think、but I donπt think、why do you think、you know I think。这表明,学习者在多数情况下把I think作为话语填充词使用,以减弱犹豫程度或者缓冲由于思索造成的会话压力。COLSEC与CLEC高度相关,一方面说明学习者会话中缺乏口语话语的一些特征,另一方面说明学习者书面表达具有口语的特点,犹如“写话”(桂诗春、杨惠中,2003;文秋芳,2003)。书面语与口语特征界限不清的特点,从某种程度上反映了目前中国学习者主要通过书本及课堂学习英语的现状。

为了揭示表2中四个语料库之间的层次关系,我们做了聚类分析,如图2所示。

从图2可见,在前100个词目的比较中,CLEC 属单独一类,但和COLSEC较为接近,主要是由两个语料库的采样方案相似以及中国学生的书面语和口语相似等原因造成。BNC与I CE同属一类,都为英语为母语的口语语料库。COLSEC尽管接近两个英语为母语的口语语料库,但还是存在差别。为了进一步揭示COLSEC与英语为母语的口语语料库的差别,我们把常用词目的范围扩充到500个,比较COLSEC与BNC。结果显示,两个语料库中前500

?

1

4

?

 第5期甄凤超 中国学习者英语口语词汇量及常用词汇研究

个词目里相同的词目有289个,不一致的词目有211个。如果把词目的范围扩充到1000个,相同词目增到619个,不同词目增到391个(受篇幅限制,这里不再详细列出不同词目)。

图2.100个最常用词目在四个语料库中频数排

序的聚类分析

从数据上看,COLSEC 前500个词目中和BNC 不一致的词目在两个语料库中排列位置呈显著差别。如Student 词目,在COLSEC 中位居按频数高低降序排列的第49位,频数为2808次,而在BNC 中位居第991位,频数为775次。另外,这些不同词目多数是表示具体语义的名词、动词和形容词,与COLSEC 语料内容高度相关,如advantage 、study 、discussi on 、maj or 、university 、computer 、exa m inati on 、learn 、English 、college 等。如上所述,COLSEC 语料来自中国大学英语口语考试。尽管我们在建立COLSEC 时采集不同考试话题的样本,但是话题仍可大致分为社会问题和校园生活两大类。此外,由于参加口语考试的均为在校大学生,他们的生活方式、知识体系、社会阅历、情感等存在着相似性,因此,在参加口试时趋于就某一类题材展开讨论。这些应是导致该类词目在COLSEC 里高频率出现的原因之一。那么,BNC 前500个词目中和COLSEC 不一致的词目是否和BNC 语料内容有关?结果显示,BNC 前500个词目中不同于COLSEC 的多数是能够体现口语交互性特点的功能词和使用面较广的实词。如副词certainly 、actually 、already 、exactly 、yet 、p r obably 、obvi ously 、alright 、s ort of 等。它们高频率出现在英语母语会话中,使用面较广,并使得口语交际自然、流畅,具有很强的交互性。对比BNC 和COLSEC 前500个词目再次验证了上述结论,即我们的学习者并未很好掌握体现口语交际特点的常用词目,交际时缺乏足够的交互性。

3.结论

本研究对比分析了COLSEC 与两个英语为母语的语料库(BNC 口语部分和I CE 口语部分)的词目覆盖率及常用词目,试图了解目前条件下中国学习者英语口语词汇量和常用词汇使用情况。研究表

明,1)中国学习者掌握的口语词汇量较少,并且过度使用某些常用词汇;2)大多数中国学习者没有完全掌握英语会话的常用词汇,其会话缺乏足够的交互性。因此,有必要加强英语会话常用词汇的教学,使学习者的会话更加自然和流畅。

受COLSEC 语料性质的限制,我们的词目研究有可能没有充分反映学习者业已掌握的词汇量。然而,在目前条件下,本研究在一定程度上反映了中国学习者的英语口语词汇量及会话常用词汇的掌握情况,同时为更加全面深入地研究中国学生英语会话特征提供了启示。

3感谢杨惠中教授、卫乃兴博士、李文中博士给予的指导以及濮建忠博士提出的修改意见。

参考文献:

[1]桂诗春,杨惠中.中国学习者英语语料库[M ].上海:

上海外语教育出版社,2003.

[2]文秋芳.中国大学生英语书面语中的口语化倾向———高

水平英语学习者语料对比分析[J ].外语教学与研究,

2003,(4):268-274.

[3]Adol phs,S .and N.Sch mitt .2003.Lexical coverage of s poken

discourse [J ].Applied L inguistics 4(2003):425-438.[4]B iber, D.,S .Johanss on,G .Leech,S .Conrad,and E .

Finegan .L ongm an Gramm ar of Spoken and W ritten English [M ].Harl ow:Long man,1999.[5]Bonk,W.

J.

Second language lexical knowledge and

listening comp rehensi on [J ].International Journal of

L istening 14(2000):14-31.

[6]McCarthy,M.

and R.Carter .W ritten and s poken

vocabulary [A ].V ocabulary:D escription,A cquisition,and

Pedagogy [C ].

Eds .

N.

Sch m itt and M.M cCarthy .

Cambridge:Ca mbridge University Press,1997.

[7]Nati on,P .and R.W aring .Vocabulary size,text coverage

and word lists [A ].V ocabulary:D escription,A cquisition,and Pedagogy [C ].Eds .N.Sch m itt and M.M cCarthy .

Cambridge:Ca mbridge University Press,1997.[8]Nati on,

P .

and R.

W aring .

Vocabulary [A ].

A n

Introduction to A pplied L inguistics [C ].

Ed .N.Sch m itt .

London:A rnold,2002.[9]Sch m itt,N.

V ocabulary in L anguage Teaching [M ].

Cambridge:Ca mbridge University Press,2000.[10]Stenstr o m, A.

2B.Lexical ite m s peculiar t o s poken

discourse [A ].

The Lond 2Lund Corpus of Spoken English

[C ].Ed .J .Svartvik .Lund:Lund University Press,1990.[11]S o meya,Yasu masa .e 2le mma 1txt (Ver .1:1998)[E B /OL ].

htt p://w w w 1lexically 1net/words mith/versi on3/index 1ht m .

(责任编辑 严辰松)

?

24?解放军外国语学院学报2005年 

日常英语口语单词

日常英语口语单词 1.卧室 blanket 毛毯 cushion 垫子 quilt 被子 cotton terry blanket 毛巾被 feather quilt 羽绒被 cotton quilt 棉被 bedding 床上用品 mosquito net 蚊帐 pillow 枕头 bolster 长枕 pillow case 枕套 tick 褥子 carpet 地毯(一般指大的整块的,铺房间的那种)rug 地毯(一般指小块的,放在沙发等边上的那种)bed frame/bed base 床架 headboard 床头板 sofa bed 沙发床 folding guest bed 折叠床 loftbed frame 架在空中的床(下面可放沙发、桌子等)

bunkbed frame 上下铺的床 slatted bed base 板条床 sprung base 弹簧床 bedspread 床罩 sheet 床单 mat 席子 mattress 床垫(厚的那种) mattress pad 床垫(薄的那种) bed canopy 支在床上的篷子(一般用于儿童床上的装饰)bedside table 床头柜 2. 厨房 refrigerator 冰箱 automatic rice cooker 电饭锅 steamer 蒸锅 oven 烤箱 grill 烧烤架 toaster 烤面包机 egg beater 打蛋器 ice crusher 刨冰机

food processor 食品加工机 paper towel 纸巾 apron 围裙 tableware 餐具 plate 盘子 dish 碟子 bowl 碗 cupboard 碗橱 dining table 餐桌 larder 食品柜 drop-leaf table 可以折叠边缘的桌子chopping board 案板 cutlery tray 装餐具的容器 3. 卫生间 bathroom 浴室,厕所 flushing system 冲水系统 flush toilet 抽水马桶 flush pipe 冲水管 foul drainage system 排污水系统

外教一对一英语口语

外教一对一英语口语的重要性 随着2008北京奥运、2010上海世博会,中国与国际融合的脚步加快,而英语作为搭建国际化沟通的重要桥梁,受到中国社会各界尤其是企业界的追捧。从长远来看,双语人才,尤其是英语人才,不论在企业国际化人才架构中,还是在中国国际化和平崛起的进程中,都是不可或缺的“基础设施”。外教1对1的培训能很快的提高口语水平,加速双语人才进程。 正是在这样一个国际化浪潮汹涌澎湃的背景下,外教1对1培训的重要性和紧迫性再次被突显,而英语培训过程中经常出现的“缺乏方向”、“缺乏标准”和“缺乏绩效考核”成为企业挥之不去的心病。正是因为这样,我们就不难理解为何“让英语培训机构按企业特定岗位的语言需求培养人才,真正实现企业英语培训与岗位语言胜任能力的无缝对接”、“如何借助第三方语言测评机构的专业力量完善企业英语培训外包机制”、“如何更有效地向英语培训机构下订单”等话题会被企业HR们所关心和热议。 在很多有经验的HR看来,外教英语1对1培训更多是源于改善或提高员工岗位语言胜任能力的直接需求,而企业只有将培训需求和考核标准量化后,才能精准地向英语培训机构提出“订制人才”的标准和要求,这也就是我们常听到的“订单式培训”。在企业内部英语培训的外包操作上,记者最近也注意到越来越多涉外企业的HR们倾向采用“第三方语言测评机构+英语培训机构”的二元培训模式。

那么,HR们又是如何借助英语外教1对1推进企业英语培训的需求下单、绩效考核及效果评估的?首先,企业借助第三方测评机构的专业化力量和专家资源,例如北京的速恩英语,先设计好公司各部门相应的岗位英语胜任标准,然后在培训之前组织相关岗位员工通过相应的英语考试测评,将考试测评的成绩与既定的岗位英语胜任标准进行比照,找出能力与胜任之间的差距,并以此量化成培训需求和向英语培训机构下培训订单的考核标准;其次,英语培训机构根据企业培训订单的培训需求和考核标准,量身定做相应的培训方案,对参训人员进行培训;最后,在培训结束时,再次组织参训人员参与英语测评考试,通过培训前、培训后两次成绩对照以检验“本次英语培训的是否达到既定的预期”、“员工的英语胜任能力通过培训是否得到改善或提高”,做到企业内部英语培训可量化考核和整体绩效评估,避免主观判断。

哪里有可以免费使用的大型英语语料库资源-外语教学与研究出版社

语料库相关资源 David Lee语料库研究书签 Bookmarks for Corpus-based Linguists (David Lee) https://www.doczj.com/doc/ee11944125.html,.au/~dlee/CBLLinks.htm (https://www.doczj.com/doc/ee11944125.html,/corpora) 常用语料库资源链接汇集(语料天涯) https://www.doczj.com/doc/ee11944125.html,/corpus/ 互动平台 https://www.doczj.com/doc/ee11944125.html,/forum/ 入门读物 专著 梁茂成、李文中、许家金,2010,《语料库应用教程》。北京:外语教学与研究出版社。Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进) Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进) 期刊论文 中国期刊网 EBSCO英文期刊数据库 书店可以买到的语料库相关书籍 Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进) Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St. Jerome Publishing. (外研社引进) Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999. Longman Grammar of Spoken and Written English. Longman Publications Group. (外研社引进) Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进) Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)

基于语料库的中国学生英语学习认知特征分析

基于语料库的中国学生英语学习认知特征分析 英语中介词使用频率相当高,也是二语学习者难以把握的词类之一,本文采取以语料库为基础的,以英语空间介词on , over 为例,从语料库CLE中随机选取,抽样分析,对中国学生使用空间介词on , over错误现象进行分析,发现中国学生在以英语作为第二语言的学习过程中的认知 规律。 语料库;空间介词;介词错误 杨卉卉,男,江苏省泰州人,1979年出生,学历本科,职称江苏泰州学院外国语学院讲师,研究方向认知语言学,英语教学。 [] H31 []A []1002-2139(2018)-27--02 一、引言 介词是英语中使用频率较高的词类,语义多样,用法复杂,对于以英语作为第二语言的中国学生来说,介词使用错误在所难免。认知语言学认为,语言来自人们对外部世界的客观体验,对空间的认识成为人们认知世界的开始。本文选择基于语料库研究空间介词on , over使用情况,剖析以空间概念为核心的语言认知体系,得出中国学生英语学习认知特征及规律。语言学是一种以语料库为基础的语言研究方

法,它包括两部分一是标注自然语料库,二是研究利用已经标注的语料。语料库是语料库语言学研究的基础,随着计算机技术展,统计软件能够帮助研究者罗列分类介词错误类型,使研究结果更具有实证性。 二、研究方法 2.1 研究问题 本文通过对语料库CLEC中空间介词on ,over进行检索,并对其的错误进行分析,试图解决如下问题 1.中国EFL学习者对空间介词on ,over的使用错误是否集中在某一特定类别? 2.造成空间介词on ,over的使用错误的原因是什么? 3.中国学生在学习英语的过程中呈现出何种认知特 征? 2.2 语料的选择 本文所涉及的两个空间介词on ,over,从CLEC语料库中进行抽取,语料库为百万词汇容量,使用软件Wordsmith,AntConc提取也可。其中介词on在CLEC及BNC中随机抽样形符(token)分别为308,over在CLEC随机抽样形符(token)分别为151。 2.3 错误标注及分类 CLEC 语料库已将语言错误分类并标注,根据言语失误分类和标注原则(桂诗春&杨慧中,2018),本研究对中国学

自建小型语料库在英语教学中的运用

自建小型语料库在英语教学中的运用 引言:随着语料库语言学近年来的发展,运用电脑语料库进行教学已经成为现代外语教育的新趋势。各种大型语料库(如LOB, BROWN, ELEC)已被广泛用于课堂教学的很多方面,如语料库在语法教学中的应用(何安平,2001;关文玉,2004),语料库在英语精读课中的应用(林丽云,2004)以及语料库在词汇(莫咏仪,2004;邓飞,2004)及写作(胡玉迎,2004)等方面的应用。然而,大型语料库最初的建库目的并非直接用于课堂教学,其语料规模庞大,就语言教学的具体方面而言,难免缺乏针对性,而且,由于价格,市场等原因,个人很难购买到大型语料库及检索软件。因此,在日常教学中,个人教学语料库的建设就显得尤为重要。Ragan(2001)指出小型语料库已成为以课堂为中心的实证教学研究的有力手段。而国内目前对个人教学语料库的研究还相对贫乏,本文将初步探讨自建小型语料库在帮助学生理解课文篇章主题意义方面的作用。 1.自建小型语料库的特征 1.1 针对性强。首先,与大型语料库相比,自建小型语料库规模小,但在内容选择上却比较有针对性,建库者可以根据自己教学及学生自主学习的需要科学的选择合适的语料,从而,使语料能够充分体现学习者的需求,满足不同层次学习者的需要,如目前大多数小学都开设了英语课,但适合这些初学者的语料库却几乎没有。在这种情况下,老师便可以通过因特网搜集儿童英语的材料和儿童感兴趣的话题制成小型语料库,从而是儿童能从开始就学到地道的英语。其次,小型语料库易于突出语言的语域和语体特征,正如Beaugr (2001)所说,依据特定的语域,语篇和话题而建的小型语料库有助于学习者培养语言的体裁,语域,语篇感,深化对语言在具体环境下的涵义的理解。 1.2 实效性强。与大型语料库相比,小型语料库在内容选择上非常灵活,可以避免选择那些语法正确但已经过时的语料,使语料库能跟上语言不断发展变化的步伐,尤其是新闻,杂志等语料更是能把最前沿的语言变体及新词,新句带给学习者。另外,小型语料库标注比较灵活,能满足更多学习者的个性化需求,而且,检索方便快捷,学习者可以在自己的操作过程中去发现目标语的各种语法特征和规律,便于学习者进行自主学习。 2.自建小型语料库促进英语教学的实例 正如Guy(1997)所说,小型语料库有助于学习者通过建构陈述性和程序性知识培养语言使用能力。目前计算机的使用已经相当普遍,所以对中学生灌输有关计算机方面的知识是非常有必要的。下面我们将以the use of computer 一文为例,说明在引导学习者建构该篇课文主题意义及对已有知识进行扩展方面,自建小型语料库能起什么作用。 学习者通过日常接触,对有关计算机方面的基础知识已经有了一定的基本图式,如计算机是一种高科技产品,运用广泛,速度快,因特网,游戏等。然而,若要比较全面的建构出有关计算机的图式,则还需对已有图式进行深入和扩展,如对计算机功能,利弊,历史,前景等方面知识的掌握。为了使学习者能够最大限度熟悉该话题,建构起该话题的心理词库,流利准确的表达该话题的相关知识,我们将利用自建的语料库的词频显现和语境共现功能,为学习者提供大量真实的语料,让学习者在自己观察,分析,概括的基础上归纳出相关图式,建构起该话题的陈述性知识;并通过小组讨论,任务汇报,课堂演示等方法扩展和巩固该话题的图式,从而,实现程序性知识的建构。 2.1 建立相关微型语料库 在大学英语第二册中有一篇the use of computer的课文,主要介绍了计算机的历史及目前计算机在各个行业中的广泛运用。为了向学习者提供更多的相关语料,笔者另外从因特网上搜集了十篇难度和体裁相当的相关文章,通过对无关内容的删减,加工,标注后制成微型

英语口语常用词汇分类表

英语口语常用词汇分类表 一、学习用品 (school things) ruler (尺子) post card (明信片) comic book (漫画书) newspaper (报纸) schoolbag (书包) story-book (故事书) notebook (笔记本) math book (数学书) magazine (杂志) dictionary (词典)calendar(日历) 二、人体(body) foot (脚) nose (鼻子) head (头) face (脸) hair (头发) mouth (嘴) eye (眼睛) ear (耳朵) arm (手臂) hand (手) finger(手指) leg (腿) tail (尾巴) tooth牙齿 back 后背 neck脖子 stomach胃throat喉咙heart心脏 knee膝盖finger手指 toe脚趾beard胡子 三、颜色(colours) colour (颜色) red (红) blue (蓝) yellow (黄) green (绿) white (白) black (黑) pink (粉红) purple (紫) orange (橙) brown (棕) 四、动物(animals) cat (猫) dog (狗) pig (猪) duck (鸭) rabbit (兔) horse (马) elephant (大象) fish (鱼) kangaroo (袋鼠) ant (蚂蚁) bird (鸟) eagle (鹰) beaver (海狸) snake(蛇) mouse(老鼠) squirrel(松鼠) monkey(猴) panda(熊猫) bear(熊) lion(狮子) tiger(老虎) fox(狐狸) zebra(斑马) deer(鹿) giraffe(长颈鹿) goose(鹅) hen(母鸡) turkey(火鸡) lamb(小羊) sheep(绵羊) goat(山羊) cow(奶牛) donkey(驴) squid(鱿鱼) lobster(龙虾) shark(鲨鱼) seal(海豹) whale(鲸) dolphin海豚camel 骆驼koala考拉penguin企鹅 parrot鹦鹉 ant蚂蚁 mouse老鼠 spider蜘蛛 goldfish金鱼chimpanzee(黑猩猩) 五、人物(people) friend(朋友) mother(母亲) father(父亲) sister(姐妹) brother(兄弟)uncle(叔叔,舅舅)man(男人) woman(女人) Mr(先生) Miss(小姐) lady(女士,小姐) mom(妈妈)dad(爸爸) parents(父母) grandma/ grandmother(祖母,外祖母) grandpa/ grandfather(祖父,外祖父) aunt(姑姑) cousin(堂表兄弟,堂表姐妹)son(儿子) baby(婴儿) kid(小孩) classmate(同学) queen(女王) visitor(参观者) neighbour(邻居) principal(校长) university student(大学生) pen pal(笔友) net friend(网友) tourist(旅行者) people(人物) robot(机器人) 六、职业(jobs) teacher(教师) student(学生) doctor(医生) nurse(护士) driver(司机) farmer(农民) singer(歌唱家) writer(作家) actor(男演员) actress(女演员) artist(画家) TV reporter(电视台记者)engineer(工程师)accountant(会计)policeman(警察) salesperson(销售员)cleaner(清洁工) baseball player(棒球运动员) assistant(售货员)reporter记者 inventor发明家 scientist科学家guide导游 waiter男服务生waitress女服务生 assistant助手businessman生意人 psychologist,心理学家author作家 photographer摄影师 musician音乐家violinist小提琴手pianist钢琴家coach教练clerk职员dentist牙科医生director导演 translator翻译 pilot飞行员 lawyer律师sailor水手 tutor家教collector收藏家 七、食品、饮料(food & drink) rice(米饭) bread(面包) beef(牛肉) milk(牛奶)water(水)egg(蛋)fish(鱼)tofu(豆腐) chicken(鸡

日常英语口语900句

免费外教在线一对一英语口语课程,太平洋英语,三个月与老外畅谈无阻!https://www.doczj.com/doc/ee11944125.html, 第1册A版 一、Greetings 问候语 1. Hello! / Hi! 你好! 2. Good morning / afternoon / evening! 早晨(下午/晚上)好! 3. I'm Kathy King. 我是凯西·金。 4. Are you Peter Smith? 你是彼得·史密斯吗? 5. Yes, I am. / No, I'm not. 是,我是。/ 不,我不是。 6. How are you? 你好吗? 7. Fine, thanks. And you? 很好,谢谢,你呢? 8. I'm fine, too. 我也很好。 9. How is Amy / your wife / your husband? 爱米好吗?/你妻子好吗?/你丈夫好吗? 10. She is very well, thank you. 她很好,谢谢。 11. Good night, Jane. 晚安,简。 12. Good-bye, Mike. 再见,迈克。 13. See you tomorrow. 明天见。 14. See you later. 待会儿见。 15. I have to go now. 我必须走了。 二、Expression In Class 课堂用语 16. May I come in? 我能进来吗? 17. Come in, please. 请进。 18. Sit down, please. 请坐。 19. It's time for class. 上课时间到了。 20. Open your books and turn to page 20. 打开书,翻到第20页。 21. I'll call the roll before class. 课前我要点名。 22. Here! 到! 23. Has everybody got a sheet? 每个人都拿到材料了吗? 24. Any different opinion? 有不同意见吗? 25. Are you with me? 你们跟上我讲的了吗? 26. Have I made myself clear? 我讲明白了吗? 27. Could you say it again? 你能再说一遍吗? 28. Any questions? 有什么问题吗? 29. That's all for today. 今天就讲到这里。 30. Please turn in your paper before leaving. 请在离开前将论文交上。 三、Identifying Objects 辨别物品 31. What's this? 这是什么? 32. It's a pen. 是支笔。 33. Is this your handbag? 这是你的手提包吗? 34. No, it isn't. / Yes, it is. 不,它不是。/是的,它是。 35. Whose pen is this? 这是谁的笔? 36. It's Kate's. 是凯特的。

基于语料库的中国大学生英语口语表达中的“中式 英 语” 探究

基于语料库的中国大学生英语口语表达中 的“中式英语” 探究 摘要:本文利用大学学习者英语口语语料库,选取全国大学英语考试口语考试部分27名考生的口语语料库作为研究对象,对其中出现的中式英语进行标注和分类。作者根据统计结果,从词法和句法两个层面分析我国大学生英语口语中出现的中式英语现象,探讨汉语母语作为中式英语出现的主要原因及对英语口语的影响,最后对中国大学生的英语日常学习及口语水平的提高提出相关建议,为广大高校师生提供借鉴意义。 关键词:中式英语中国大学生口语语料库 1.引言 中国大学生在他们的年纪已经获得用汉语思考和表达的能力,形成用汉语思考和表达的习惯。绝大部分中国人都是在掌握了母语之后才开始学习英语的,所以在学英语的过程中,总是从中国人的思维角度思考,不顾西方的语言习惯,这就造成中式英语的大量存在。由于不符合英语的表达习惯,中式英语在人际交流中有时会引起误解和困惑。因此,它作为一种特殊的语言现象,应该引起人们的注意。在中国,高校在校学生占英语学习者的很大一部分,他们毕业之后就

由英语学习者转变为英语使用者,所以他们在学校学得如何,直接影响他们在工作岗位上用得如何。 从现状看,我国大学毕业生的平均英语水平不能满足各行各业越来越高的需求,尤其是在口语表达和人际交流方面。在现行教育体制下,高校英语教学过于强调语法和词汇的讲解,而对学生语言能力的培养和英语文化的教授则有所忽略。其结果就是许多中国大学生在学了十多年英语之后,只是善于记忆单词和语法规则;他们能在笔试中得高分,但是一张嘴就是中式英语。 《牛津英语词典》对中式英语作了如下定义:中式英语是一种汉语和英语的混合体;尤其是汉语使用者使用的或中英双语语境中的一种英语变体,典型地夹杂一些汉语的词汇和结构,或是汉语语境中特有的英语术语。 总的说来,中式英语是指一种不符合英语文化习惯的畸形英语,由某些受汉语思维方式和文化背景影响而将母语的语言规则运用到英语中的中国人说出或写出。 2.研究方法 2.1研究对象和数据收集 “大学学习者口语语料库”由上海交通大学的杨惠中教授主持完成。该语料库容量达70万字,来源是全国大学英语考试口语考试部分的真实音视频材料。它按照考试来源地、专业、考试成绩和对话题目,采取随机抽样的方法组

大学英语口语课教案

大学英语口语课教案 【篇一:大学英语口语课程教案】 大学英语口语课程教案 学院:外国语学院 学期: 2008-2009学年第一学期 学时 18 教材《大学英语基础口语教程第一册》 (let’s talk book 1) 授课教师大学英语口语精品课程组 授课对象 2008级普本 上课地点南、北校区、学院路校区 上课时间周一至周五 授课题目(teaching title): unit 12 foreign customs 授课类型(class type): lecturing and practice 授课课时安排(teaching periods): 2 periods 本授课单元教学目标(teaching objectives): in this unit students are required to: 1.master the basic vocabulary related to western wedding.

2.learn to describe the different manners between chinese and western customs. 3.learn the proper way to behave in western society. 本授课单元教学重点(main points of teaching): 1.instruct students to speak and behave properly in western society concerning some important events. 2.analyze the different manners between chinese and western countries. 本授课单元教学难点(difficult points of teaching): instruct the students to use cultural-related words to describe and compare the proper manners in chinese and western events.教学手段(teaching aids) multimedia (audios, videos, pictures, texts), blackboard. 本授课单元教学步骤及时间分配 (teaching procedures and time allotment): 1. warming-up activities (about 15 minutes) 1.1 role play: a typical western wedding (about 10 minutes) student are assigned the task in the previous class. they are asked to perform a typical western wedding. useful materials and information should be collected before the class. (about 10 minutes)

英语口语最常用单词

英语口语最常用单词Absolutely!---- 绝对正确! Adorable! ---- 可爱极了! Amazing! ---- 太神了! Anytime! ---- 随时吩咐! Almost! ---- 差不多了!- Finished - Almost! Awful! ---- 好可怕呀! After you. ---- 您先。 About when ---- 大约何时 All set ---- 一切妥当 } Allow me! ---- 让我来! Baloney! ---- 胡扯!荒谬! Behave! ---- 放尊重点! Bingo! ---- 中了! Boring! ---- 真无聊! Bravo! ---- 太棒了! Bull太好了! ---- 胡说! C‘mon! ---- 拜托了! Check, please! ---- 唔该埋单! Cheers! ---- 干杯! ` Congratulations! ---- 恭喜啊!

Correct! ---- 对的! Crazy! ---- 疯了! d*amn! ---- 该死的! Deal! ---- 一言为定! Definitely! ---- 当然! Disgusting! ---- 好恶心呀! Drat! ---- 讨厌! Encore! ---- 再来一次! Exactly! ---- 完全正确! ' Fantastic! ---- 妙极了! Farewell! ---- 再见啦! Fifty-fifty! ---- 对半分! Foul! ---- 犯规了! Fresh! ---- 好有型!帅! Gesundheit! ---- 保重!(特别用于对打喷嚏的人说)Gone! ---- 跑了! Gorgeous! ---- 美极了! Great! ---- 太好了! Hey! ---- 嘿! 。 Hopefully! ---- 希望如此!有希望的话... Horrible! ---- 好可怕!

英语口语20个对话主题

英语口语20个对话主题 英语口语对话主题(001)相貌 A: That girl looks very attractive, doesn’t she? B: do you think so? I don’t like girls who look like that. I like girls who aren’t too slim. If you like her, go and talk to her. A: I’d like to, but there’s her boyfriend. He’s very broad-shouldered. B: he’s huge! He must go to the gym to have a well-built body like that. A: do you prefer tall girls or short ones? B: I don’t mind, but I like girls with long hair. A: we have different tastes. I like girls with short hair. I like tall girls- probably because I’m so tall myself. B: have you ever dated a girl taller than you? A: no, never. I don’t think I’ve ever met a girl taller than me! Have you gained weight recently? B: yes, I have. Perhaps I should go to the gym, like t hat girl’s boyfriend. A: I ‘m getting a bit plump myself. Perhaps I’ll go with you. 英语口语对话主题(002)身体部分 A: I’m going to the beauty parlor. Do you want to come too? B: sure. Let’s go. What are you going to have done? A: I want to have a foot massage and haircut. B: a foot massage sounds like a great idea. They are very relaxing. I’d also like to have a mudpack on my face. It’s supposed to help with your complexion. A: good idea. We should also pedicures and manicures. B: this could become a very expensive trip to be beauty parlour! A: I think it’s a good idea to pamper yourself occasionally. Don’t you agree? B: oh, I agree. We both work hard and a little beauty treatment can relieve stress. A: maybe we should try a thai massage too. B: what’s specia l about a thai massage? A: that’s when the masseuse walk on your back and massage you with her feet. B: sounds painful! 英语口语对话主题(003)身体部位的运动 A: when you are in a restaurant you want the waiter to bring the bill, what do you do to attract his attention? B: I just make eye contact with him and nod my head. Then I tell him when he comes over to the table. Why do you ask? A: I went out with my girlfriend to a nice restaurant last night and I noticed that many people shouted for the bill.

可以免费使用的大型英语语料库资源

可以免费使用的大型英语语料库资源 https://www.doczj.com/doc/ee11944125.html,/time/ http://www.lextutor.ca/concordancers/concord_e.html 常用语料库资源链接汇集(语料天涯) http://202.204.128.82/sweccl/Corpus/ https://www.doczj.com/doc/ee11944125.html,/netprints/Corporalink/Corporalink.htm 1. BNC-World Simple Search ☆☆☆ https://www.doczj.com/doc/ee11944125.html,/lookup.html But no more than 50 hits will be displayed, with a fixed amount of context. 2. Brown, LOB, BNC sampler ☆☆☆ Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora. English: https://www.doczj.com/doc/ee11944125.html,/concordance/WWWConcappE.htm English: http://www.lextutor.ca/concordancers/concord_e.html Parallel: https://www.doczj.com/doc/ee11944125.html,/concordance/paralleltexts/ 3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆ https://www.doczj.com/doc/ee11944125.html,/Corpus/CorpusSearch.aspx The Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text. 4. New BNC interface - VIEW: ☆☆☆☆☆ https://www.doczj.com/doc/ee11944125.html,/ 5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆ The Brown Corpus and many others - native, learner... Go to http://www.lextutor.ca/concordancers/concord_e.html 6. MICASE ☆☆☆☆ https://www.doczj.com/doc/ee11944125.html,/m/micase/ There are currently 152 transcripts (totaling 1,848,364 words) available at the site. 7. CLEC online concordancing ☆☆☆☆ https://www.doczj.com/doc/ee11944125.html,/corpus/EngSearchEngine.aspx CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。For an introduction of the corpus, its error tagset and some statistics, see https://www.doczj.com/doc/ee11944125.html,/baseinfo/achievement/Achievement1.htm 8. Business Letter Corpus Online KWIC Concordancer ☆☆☆

英语教师常用英语口语

英语课堂用语 1、Let’s get ready for class. 准备上课。 2、I’m sorry I’m late. /Excuse me for coming late. 对不起,我迟到了。 3、Please come earlier next time. 下次请早点到。 4、Class begins. 上课。 5、Who’s on duty today? 今天谁值日? 6 、Is everyone here? 都到齐了吗? 7、Who’s absent today? 今天谁没来? 8、What day is today? 今天是星期几? 9、What’s the date today? 今天是几号? 10 Li Hong, have you collected all the exercise-books? 李红,作业本都收齐了吗? 11 、Here are your exercise-books. Please hand them out. 这是练习本,请发下去。 12、 Monitor, would you please fetch some chalk for me? 班长能帮我去拿些粉笔来吗? 13 Open your books, please. 请翻开书。 14 Please turn to Page 12. 请翻开书本十二页 15 Please take out your notebooks/exercise books. 请拿出笔记本/练习本。 16 No more talking, please. 请安静。17 Attention, please. 请注意。 18 Let’s have a dictation. 让我们来听写。 19 We’re going to have a new lesson today. 今天我们要上新课。 20 First let’s have a revision. 首先我们复习一下。 21 Who can answer this question? 谁能回答这个问题? 22 Do you have any questions? 你们有问题吗? 24 Let me see. 让我看看/想想。 25 Put up your hands if you have any questions. 如果有问题请举手。 26 Raise your hands, please. 请举手。27 Hands down. 把手放下。 28 Repeat after me/Follow me. 跟我读。 29 Listen to me, please. 请听我说。 30 Look at the blackboard/screen, please. 请看黑板/屏幕。 31 All eyes on me, please. 请都看着我。 32 Can you solve this problem? 能做出这道题吗? 33 Let’s read it together. Ready, go! 大家齐声朗读,预备,起。 34 Read slowly and clearly. 读慢一点,清楚一点。 35 Who wants to try? 谁想试一试? 36 Who wants to do it on the blackboard? 谁愿意到黑板上来做? 37 Are you through? 做完了吗?Have you finished? 做完了吗? 39 You did a very good job. 做得不错。 40 Very good./Good try./ Well done! 完成得不错。 41 Terrific!/ Wonderful! / Excellent! 很棒! 42 Please give him (her) a big hand. 请给他/她一些掌声。 43 Can you follow me? 能跟上吗? 44 Do you understand? 你听懂了吗?45 Don’t be nervous. 不要紧张。 46 Any one can help him/ her? 谁来帮他/她一下? 47 Any volunteers? 谁自愿回答?

基于语料库的中国英语学习者knowledge搭配研究

基于语料库的中国英语学习者knowledge搭配研究 【摘要】本文运用语料库方法对中国英语学习者语料库(CLEC)中出现的knowledge一词的搭配进行了研究,对比分析了中国英语学习者与本族语者在使用knowledge一词方面的特点,以及中国不同水平学习者之间的特点。研究结果表明,中国英语学习者在knowledge一词的使用方面存在过度使用搭配词等现象,并以此揭示其搭配规律,对英语词汇教学、翻译教学提供一个全新的研究途径。 【关键词】语料库;词语搭配;CLEC;BNC 0 引言 自从Firth于半个世纪前提出至今,语言学者关于词语搭配的研究一直在不断地发展、深入并取得了显著的成就。研究者试图从不同的角度、使用各不相同的研究方法去探讨和界定词语搭配。学者们使用的术语也不统一。过去的词语搭配研究仅限于学者的自觉,难免带有个人的偏好,具有一定的局限性。而语料库语言学的兴起为词语搭配的研究带来了全新的理念和研究方法。搭配不再是语言学家头脑里的直觉存在,它是成百上千万词容的语料库连续文本(running text )中的语言使用实体,是数据处理的结果显示。1961年,Sinclair开始了第一个基于语料库证据的词语搭配研究项目。此后,基于语料库的搭配研究在语言学界展开。目前,语料库语言学已形成一套研究词语搭配的方法和手段。 1 词语搭配的概念 根据Firth(1957年)对collocation的界定:“You shall know a word by the company it keeps” (“由词之结伴可知其词”)[1],词语搭配是指词与词的结伴使用这样一种语言现象。Firth关于collocation 的观点概括起来大致有四条:第一,collocation是指词与词的结伴使用;第二,collocation是一种意义方式;第三,习惯性词语搭配的各伙伴相互期待和相互预见;第四,类联接(colligation)是高于词语搭配的抽象。Susan Hunston“…here it is sufficient to note that collocation is the statistical tendency of words to co-occur.”(这足以说明词语搭配是具有统计意义的词语共现)[2]。 2 国内关于词语搭配研究的文献综述 中国期刊全文数据库的检索(CNKI)结果显示,1999-2006共发表以词语搭配为题目的论文53 篇。 卫乃兴(2002年)的《基于语料库和语料库驱动的词语搭配研究》是近年来该研究领域的代表作,在学界引起了广泛的关注,对搭配研究产生了积极的影响。该文介绍和讨论了语料库证据支持的词语搭配研究的基本方法和主要原则。作者将基本研究方法分为“基于语料库数据”和“语料库数据驱动”两类。基于数据

相关主题
文本预览
相关文档 最新文档