简论语料库国内语料库相似度检测语状况分析

摘 要: 本文对过去11年(2001年—2011年)发表在国内16种外语类核心期刊上关于语料库相似度检测语研究的论文进行了统计分析,分析了国内语料库相似度检测语研究的总体发展趋势,并从研究内容、语料库类型和研究方法等方面对语料库相似度检测语研究现状进行了分析。研究结果显示:国内语料库相似度检测语研究总体呈上升趋势,语料库相似度检测语研究涉及的领域广,研究所使用的语料库类型多,研究方法以“自下而上”和“对比研究”为主。
关键词: 语料库 相似度检测语 现状分析

一、语料库与语料库语言学

1.语料库

语料库是在随机采样的基础上收集人们实际使用的、有代表性的真实语言材料而创建起来的(何中清等,2011)。语料库为人们进行语言的研究提供了大量的语言事实和例证,同时也为语言学的研究提供了新的视角和方法。近年来,语料库的研究领域从传统的词典编撰和语法研究,扩展到语言教学、翻译研究等领域。语料库的局限性在于,它能为我们提供例证、语言事实等,却无法对其进行解释、推理或提供相关的文化和社会背景信息。

2.语料库语言学

语料库语言学是在语料库的基础上对语言进行分析和研究的科学。语料库语言学主要是指在语料库所提供的真实的语言数据的基础上,对详尽的语言事实进行宏观分析,从而探索语言使用的规律。它为语言研究提供了全新的学术视角和研究方法。相似度检测语是介于母语和目的语之间的一种语言系统,是二语习得研究的重要领域。近年来,我国国内学习者语料库应用于相似度检测语的研究迅速发展,已建立了中国英语学习者语料库、CEC中国英语语料库等,基于这些语料库的论文不断出现。
为了进一步了解国内语料库在相似度检测语研究现状、最新进展和发展趋势,本文对过去11年(2001年—2011年)发表在外语类核心期刊有关语料库相似度检测语的研究论文进行了梳理,并做了统计分析,归纳国内语料库应用于相似度检测语的研究特点,分析存在的问题并预测未来的发展趋势。同时对语料库用于相似度检测语的研究提出一些建议,促进国内语料库在相似度检测语领域的广泛应用。

二、研究方法

本文在CNKI中国期刊全文数据库中以“语料库+相似度检测语”和“语料库语言学”等关键词进行文献筛选,期刊论文的搜索时间限定在2001—2011年,检索出了《外语教学与理论》、《外语界》等16种外语类核心期刊,并从中最后确定了100篇论文作为本研究的分析样本。

三、研究结果

从表1可以看出,对词汇的研究的论文数量最多(27篇),其后依次是语法(26篇)、口语(17篇)、写作(13篇),这四类主题的论文占所有论文的83%。用语料库研究方法对其他领域的研究论文共18篇,研究主题涉及了语篇、话语、语义韵、语块等方面。
词汇:有关语料库应用于词汇的研究主要涉及以下几方面内容:中国学习者词汇的使用,如张萍、周敏(2007)的“‘Besides’:基于语料库的对比研究”一文;词汇搭配,如钟珊辉(2009)的“基于语料库的Seek搭配行为对比研究”;词块,如张霞(2010)的“基于语料库的中国高级英语学习者词块使用研究”一文;类联接,如许家金、熊文新(2009)的“基于学习者英语语料的类联接研究概念、方法及例析”。
语法:主要涉及以下方面:词类:如闫丽莉(2003)的“中国学生英语冠词习得初探——一项基于中国学习者英语语料库的研究”;句法:如胡学文(2007)的“中国学生英语双宾构式的习得——一项基于语料库的对比研究”;时态:如张雪梅、杨滢滢(2009)的“英语专业学习者的时态习得现状——一项基于中国英语专业写作语料库的研究”;语态:如陈万霞(2002)的“从中国学习者英语语料库看英语被动语态习得”。
写作:语料库应用于写作方面的研究涉及以下三方面的主题:写作用词特点:如何华清(2009)的“非英语专业学生写作中的词汇错误分析一项基于语料库的研究”;句法:如王立非、张岩(2006)的“大学生英语议论文中疑问句式使用的特征——一项基于中外学习者语料库的对比研究”;语篇衔接:如潘璠、冯跃进(2004)的“非英语专业研究生写作中连接词用法的语料库调查”。
除了上述五个方面主要内容外,语料库应用于相似度检测语的研究

源于:标准论文格式www.shuoshilunwen.com

内容还涉及了语篇、语块、话语、语义韵等多个领域。

四、现状分析

1.研究领域的发展趋势

国内语料库应用于相似度检测语的研究具体研究内容广泛,涉及的主题有词汇、语法、口语、写作、语篇、类连接、语块、话语,语义韵等。从表1可以看出,词汇是语料库应用于相似度检测语研究的热点,依次研究较多的是语法、写作和口语。相比之下,对于其他领域如语篇(7)、语义韵(4)、话语(3)等研究较少。目前,基于语料库对相似度检测语的研究多属于描述性或错误性分析,但是,对于隐藏在这些语言现象背后的深层文化背景原因,导致二语学习者和本族语者在语言习得方面的意识形态的差异,以及对如何最有效地最大限度地改进英语教学从而帮助二语习得者改进学习策略,提高学习效率,缩小与目标语的差距的切实的改进办法的研究较少。

2.所使用的语料库类型分析

从表2可以看出,从核心期刊上所选取的100篇文献中,所用到的语料库的总量为163,其中包括单个语料库在多篇论文中被使用。从主要所使用的语料库应用于语言的研究分析可以发现,国内基于语料库对相似度检测语的研究多集中于词汇、口语、语法、写作等普通语言描述研究,深层研究较少。此外,基于语料库的相似度检测语研究还处于理论研究层面,未真正应用于学习者的二语学习实践和英语教学。

3.研究特点

(1)采用自下而上的研究方法。自下而上,即从真实语言使用的数据出发,依赖于语言数据的频数或者概率信息,通过提取(extraction)—观察(observation)—概括(generalization)—解释(interpretation)的研究过程,描述语言事实,抽象语言学理论(甄凤超,2010)

学位论文www.shuoshilunwen.com

(2)采用对比研究的方法。“相似度检测语对比分析”是近年来兴起的二语习得研究的方法。该方法采用语料库研究的基本技术手段和方法,通过对比本族语与相似度检测语、不同母语背景的相似度检测语、相同母语但不同习得阶段的相似度检测语在一系列维度上的相关数据,概括出学习者和本族语者的差异、相似度检测语的模式和学习者的行为趋势,发掘相似度检测语的非本族语特征,并探讨引起这些特征的背后原因(卫乃兴,2006)
五、建议

1.拓展、深化语料库相似度检测语的研究

自2000年以来,我国语料库相似度检测语的研究呈现了良好的发展态势,取得了不错的成果。同时我们应该看到,目前,国内基于语料库相似度检测语的研究主要停留在语言描述或者错误分析层面,较少涉及这些语言现象背后隐藏的原因。因此,我们应该进一步深入研究二语习得者在英语学习过程中所遇到的困难,研究英语运用的特点及中常犯的错误,对比二语习得者和本族语者的语言特征及其不同的学习策略,研究差异背后的文化背景因素,确定适合中国二语习得者的学习方法和教学体系。

2.建立适合课堂教学及学生学习的在线语言数据库

把语料库相似度检测语的研究成果,包括词汇、语法、写作、口语、语块、错误分析等方面的研究建成在线语言数据库。一方面,二语习得者可以自主利用现有的研究成果,对比检测自己在英语学习中存在的问题,然后充分利用在线语言数据库的研究成果,促进自己的英语学习,缩小与本族语者的差距,从而切实提高语言水平。另一方面,教师可以利用在线语言数据库研究学生的学习特点、常犯错误和自身的语言特征、话语质量等;教师可以利用在线语言数据库在课堂教学中为学生提供真实的语料,提高课堂教学质量和学生学习的水平与效率。
六、结语
通过文献检索和内容分析,本文对所统计的论文的研究现状总结如下:(1)国内语料库应用于相似度检测语的研究领域广泛,但多数停留在语言描述和错误分析,研究不够深入。(2)研究论文所使用的语料库类型广,数量多。(3)研究方法的特点主要是“自下而上”和“相似度检测语对比分析法”。基于此,笔者提出以下两点建议:(1)拓展、深化语料库相似度检测语的研究;(2)建立适合课堂教学及学生学习的在线语言数据库。
目前,语料库语言学在国内虽然仍然是一门比较年轻的学科,但由于语料库的使用可以辅助人们对语言的“直觉“和“内省”判断,从而克服研究者的主观性和片面性,语料库语言学已逐渐成为语言学和应用语言学研究的主流方法。其研究已不局限于最初的语法研究和词典编撰,而是扩展到了语言教学、翻译研究、话语分析等领域。基于语料库的研究方法越来越受到研究者的重视和广泛应用,并在二语学习者和英语教学中发挥更重要的作用。
参考文献:
何中清,彭宣维.英语语料库研究综述:回顾、现状与展望[J].外语教学,2011(1).
甄凤超.语料库语言学在中国的成长和发展[J].当代外语研究,2010(3).
[3]卫乃兴.基于语料库的学生英语中的语义韵对比研究[J].外语学刊,2006(5).

相关论文

语料库,基于语料库中美经济语篇批评

:批评话语浅析是浅析语篇的语言特点和它们生成的社会历史背景来考察语言结构背后的意识形态作用,并进而揭示语言、权力和意识形态之间复杂。
浏览量:14052 点赞量:4863