首页 > 公司 > 合伙联营 > 怎么通过语料库研究翻译,如何运用ca做语料分析 百度文库

怎么通过语料库研究翻译,如何运用ca做语料分析 百度文库

来源:整理 时间:2023-02-12 01:49:18 编辑:律生活 手机版

本文目录一览

1,如何运用ca做语料分析 百度文库

你好你所需要的文库资料http://wenku.baidu.com/link?url=uQwnwzSKKyzn3wbQfI71qE-G6emQOSr9HhVTr_JxRuDp8kXhTZCvTervihlBmJYgjlmw0k4EiunA19vdot9keewEzThrkdKjb5zb-ERN0X7手机提问的朋友在客户端右上角评价点满意即可如果你认可我的回答,请及时点击采纳为满意回答按钮

如何运用ca做语料分析 百度文库

2,如何在英语学习教学和研究中使用语料库资源

学习英语方法还是比较关键! 1、初学者  在多年的学习和教学实践中,我发现初学口语的最有效方法就是背诵英文句型或段落。在背诵前切记要跟着录音带大声朗读5遍以上。有读者会说,我试过了但记不住。其实,背诵时最好有中文译文,一边看句子,一边背。这样就可以确定背不下来是因为情节的连贯问题,而不是因为英语水平的问题。  2、中级水平  许多通过了四级或六级的同学只是在阅读、听力或写作方面有能力,并不代表口语也有相应的水平。大家不要认为自己学的口语教材简单,可以做个试验:拿一篇你认为很浅显的文章,将其翻译成汉语,让别人将每句汉语读给你听,然后你再翻译成英文。如果没问题,说明你口语很好,否则就需要多做这种练习。
可以购买北外梁茂成教授组编的《中国学生英语口笔语语料库》,是现成的,有光盘,很好用,推荐使用。我就买了一本,很好。在线的还是不是硬盘里的用着放心啊

如何在英语学习教学和研究中使用语料库资源

3,英译汉语料语库在哪里找

企业家中心(TheCenterforEntrepreneurship)是国家科学基金委员会(NationalScienceFoundation-fundedInnovationCorpsProgram)创新项目下属的2个分支中的一个。这个项目的目的是:使研究团队通过开设实验室外的用户探索课程(out-of-the-labcustomerdiscoverycourse)来推进对世界各地研究的翻译。每年由CFE负责区域性,联邦性及基于工业的创新项目,并全程指导UM人员和研究者们。I-Corp:InnovationCorpsCFE:CertifiedFraudExaminer你没有给上下文。很多缩写我只能猜。这是我在美国Nationalsciencefoundation里查的。共参考。以后这种翻译要注意标签。百度能够有3个标签。。其中一个给英文标签,推荐另两个选择电气电子等理工科标签。这世界上理工科的学生是最牛逼的。因为技术文档全是英语,即使是英语专业的,没有专业背景也白搭。正因为文科生们不会翻译,理工科生们不屑于翻译,所以大多数技术文档全是英语的。
1、Tmxmall语料商城上有用户已上传的各类双语语料库,你需要英汉财经新闻语料库,按语言对和类别检索,或者直接搜索关键词即可。2、“北外语料库语言学 Corpus Linguistics at BFSU”上面有很多国内外的语料资源和链接。权威官方。3、自己去各大贴吧和翻译网站找资源,看看有哪位大牛分享。不过这个看运气了,一般专业语料库资源都是有“版权”的。4、搜集英汉双语语料,然后自己建库吧。

英译汉语料语库在哪里找

4,trados有什么用吗 如何下载呢

搜搜“象群网”,论坛上有QQ群,群共享里就有这个软件的2009版下载。另外论坛还有trados 2009的视频教程以及术语库记忆库资源下载。另外偷偷地告诉你,象群网已提供trados 2011的试用版下载啦~~~可以尝尝鲜:)Trados 的用处:1.统一术语2.提高翻译效率与质量(稿子是同一类型的时候,该效果特别显著!)3.方便翻译项目管理,统筹计划4.支持的翻译文本格式多样,word、excel、PDF、PPT等等4.还有其它的一些功能,自己摸索就知道了象群网论坛资源:Trados Studio 2011 试用版下载Trados 2011 首份中文评测(一)SDL SDLXLIFFConverter 下载Trados 2009视频教程,记忆库/术语库下载资源20分钟入门(一):准备工作20分钟入门(二):创建/设置项目20分钟入门(三):翻译内容20分钟入门(四):验证和生成译文良好的习惯(一):“打开文档”和“新建项目”良好的习惯(二):“Ctrl + 回车”的意义术语库教程(一):术语库在编辑器中的四种操作术语库教程(二):Excel 制作术语库术语库教程(三):利用网络资源快速创建术语库术语库教程(四):微软官方术语库和TBX文件格式术语库教程(五):中文<=>多语种的微软官方术语库记忆库与术语库欧盟委员会翻译司官方记忆库 2011年微软官方术语库(三语):中文、英语、德语医学术语库(中英文)31个俄汉、汉俄记忆库TMX法律专业英中记忆库sdltm23本金山快译专业词典术语库法律英语词典集锦(纸质词典PDF版及在线法律英语词典)
trados是计算机辅助翻译软件~建完语料库后能整句整句比较准确地翻译~不过跟一般的在线词典啊有道啊什么的不一样,它自己没有可以提取翻译结果的资料库,那个你得自己弄~下载的话电驴那个就还成~可能挺慢的但是多人验证绝对是可下载的~

5,做与英语有关的工作

与英语有关的工作大致可分为以下七类:1.英语语言学方向:主要是研究语言的结构、性质等,一般会细分为语义学、语用学、社会语言学等,分别具体是什么内容,我也说不清楚咯!这个方向比较适宜继续深造考博,因为这是英语专业的核心内容,学好它,考博时就比较容易,也容易出成果。但是一开始会觉得困难,后来路子越走越顺的。 2.文学方向:包括文学与文学批评,英国文学,美国文学等。主要是作品分析,很需要文论知识,也就是要懂些哲学知识,一般比较玄乎的,需要看很多英语原著小说,但是又不能仅仅是看,还要用比较深奥的思想分析它,不过这个方向对语言能力的提高还是帮助比较大,毕竟要阅读很多原著作品。考博也比较方便。是传统专业。3.翻译方向:这是一个比较新兴的专业。但要注意和北外,上外的高翻班分别开来,它们这些高翻班是专门培养应用人才,而翻译研究方向通常是研究怎么翻译,在理论上进行探讨,跟实践有些差异。所以毕业时未必能找到翻译工作,除非你有较多的实际经验。因为较新兴,可能考博较难,如果能上名校,考博才会有点希望。4.外语教育方向:包括二语习得,外语教学等不同名称,其实都一样,强调研究语言是怎么教和怎么学的。可能是英语专业中应用性最直接的一个方向了,因为可以用自己的研究来检验英语教学。5.文化研究方向:包括社会与文化、跨文化交际研究,美国文化研究等。这个方向是英语专业的边缘,要么是新兴的,要么是别专业,比如美国研究就是本属于历史专业或者国际关系学专业的。所以学这样的方向可能会和英语专业走得比较远,有时会被别人认为不是英语专业的。 6. 商务英语方向:这个方向是应现实需求而生的,表面上很实用,不过通常商务知识都无法在学校学到,而且也很少有称职的老师能教好,都是一些别的方向换过来混的。毕业后,最多不过是学些皮毛,搞得四不像。所以要有心理准备,除非是到名校去,这样有个名校头衔也有人看得起,否则毕业后痛苦。7.语料库语言学方向:本来也可以将这个称作语言学方向,但因为语料库研究比较新兴,而且应用较热,不过没有几个学校有这方面厉害的老师,有些也是瞎混的,所以警惕毕业后发现自己什么也没学到。现在北外,上交大,华南师大有厉害的人物。
考个报关员吧
"国际商务师"是个职称证,分初、中、高,有了他会有更多的机会。但做贸易和学书本的两码事,书本中只会了解一些贸易术语,实际操作会完全不一样。所以实际经验很重要。一个学国贸的的学生,走到工作岗位,就是白纸一张,一切都要在实践中从头开始学习。当然,毕竟要比门外汉上手快。因此,关键在于人自身能力,再加上一些辅助条件(如外语水平、证书,要是有经验更好),把握会更大。
不用的,其实现在的证考出来也只是书面的东西,跟实际工作大不相同,而且你都出来工作了,考个证恐怕会有些逼迫,看来,你的英语还可以,既然你在往常的工作中真的有接触的话,就放胆去干吧,毕竟你有一定的工作经验了,不要让自己退缩,不然永远是做不成事的。就说说我自身吧,一应届生,找工作也不容易,现在找到一份干文员的,算了,幸好跟自己专业有点挂钩,反正当是给自己找经验呗。其实,如果真的是做外贸的话,不需要太多证,那些证也没用,如果你想做报检,报关才要考证的。
做翻译 直接带你去跟客户谈判 帮老板翻译的话比较难的,做做一些文件翻译,网站翻译什么的好是可以的。做国际贸易么,找个小点的公司 能力有的话 不会太在意你是什么专业。毕竟你也过了6级。做外贸考证么去考个报关证,单证员什么的还是有点用的。至于那个国际商务师没怎么听说

6,知网汉语词库即HowNet怎样使用

一、理论基础 首先,二者都以一种“模式假设”(patterning hypothesis)为前提和理论基础。其次,“理解性假设”(comprehensiveness hypothesis)也是二者的理论基础。但二者的理论基础不同之处也很多。Wordnet的一个较主要的理论基础是“可分离性假设”(separability hypothesis)即语言的词汇成分可以被离析出来并专门针对它加以研究。 Hownet的最重要的理论基础是它的哲学。其根本点是:世界上一切事物(物质的和精神的)都在特定的时间和空间内不停地运动和变化。部件和属性这两个单位在Hownet的哲学体系中占有着重要的地位,一个事物被视为是整体还是部件,可以因系统的不同而不同对待;而关于对属性的认识是:任何一个事物都一定包含着多种属性,事物之间的异同是由属性决定的,没有了属性就没有了事物。二、设计原理与方法 二者的建设方法最明显的相同之处就是自上而下的方法。具体来说,Wordnet是以同义词集合作为基本构建单位进行组织的。Hownet则是先提取义原,以它为基本构建单位进行组织的。虽然细节不同,但总的指导性建设方法还是相同的。具体的设计原理与建设方法上,两者的不同点就凸现出来了。 1、Wordnet 的基本设计原理是它的“词汇矩阵模型” 一个词汇矩阵从理论上可以用单词与其同义词集合之间的映射来表示。当某个词有多个同义词时,通常同义词集合足以满足差异性的要求。当然,同义词是词形之间的一种词汇关系,但由于这种关系在Wordnet中被赋予了中心角色。因此,同义关系的词被放在中,与其他被放进[]中的词汇关系的词区别开来。Wordnet是按语义关系组织,由于语义关系是多个词义之间的关系,而词义用同义词集合来表示,因此很自然地把语义关系看作为同义词集合之间的一些指针。 2、Hownet的基本设计原理是把概念与概念之间的关系以及概念的属性与属性之间的关系形成一个网状的知识系统。这是它与Wordnet的本质不同。Hownet的建设方法的一个重要特点是自上而下的归纳的方法。通过对全部的基本义原进行观察分析并形成义原的标注集,然后再用更多的概念对标注集进行考核,据此建立完善的标注集。无论是义原的提取还是义原的考核与确定,在Hownet的建设中都是至关重要的并具有决定意义。三、描述关系的比较 1、上下位关系 这是二者都有的。Wordnet是词义之间的语义关系。Hownet的上下位关系由概念的主要特征体现,也具有继承关系。 2、同义关系 同义关系是二者都有的。Wordnet最重要的关系是同义关系。Hownet对于同义的定义与Wordnet相似,都采取了较宽泛的定义,只是Wordnet的同义关系是显性的,而Hownet的同义关系是隐性的。 3、反义关系 Wordnet对于反义关系采取了直接反义和间接反义两种关系都包括的方法。Hownet中的反义关系比Wordnet定义的还要宽泛,只要属性值一样就可以形成反义关系。四、目的与应用 1、目的 Wordnet一开始要建立一个词典浏览器,后来又发展成自足的词汇数据库和语义或义类的机读词典。而Hownet是要建立一个面向计算机的知识库,揭示多重语义关系网络,为自然语言处理系统的建立提供最终需要的知识库。 2、应用 由于二者都是为自然语言信息处理服务的系统,那么二者的应用有交叉。例如,二者都在进行意义排歧,语义分析,语料库语义标注,信息过滤和分类,机器翻译等方面有着十分广泛的应用。 两者又有自己独特的应用领域。例如,Wordnet由于许多国家都在它的基础上建立了词汇数据库,那么Wordnet就可以进行多国语处理的词汇转换。由于它的内部结构是以层次为主,所以可进行信息语义层次检索,还可以进行主题名义识别和图像检索等;而Hownet也有它自己的应用领域,如:基于Hownet的内部语义关系建立,语料库句法关系标注,信息检索系统自然语言接口。还有它关于汉语方面研究与应用的独特之处,如:它的信息过滤和分析系统都是双语的,可以进行事件角色语义特征的提取。把Wordnet和Hownet结合起来的典型应用要算基于两者建设的双语语义词典。五、小结 经过对Wordnet和Hownet的一番比较,可以看出二者虽然是两种系统,但把二者结合起来研究,找出各自的不足之处,对自然语言处理研究还是有一点帮助作用的。Wordnet的词语概念是够用,但关系方面不足以支持推理。Hownet恰恰就是这样一种推理的知识库。Wordnet可向Hownet吸取这一点。Wordnet几乎没有关于句法方法方面的标注。而Hownet作为一个面向计算机并借助于计算机建立的常识知识库,它在语义知识构建方面明显优于Wordnet,而且许多现在Wordnet正致力解决的问题,在Hownet中都不是问题。所以在面向自然语言的信息处理方面,Hownet要优于Wordnet。当然Wordnet的研究人员也从来觉得这是一个“完工”的项目,Wordnet仍在继续发展中。
去高校的图书馆中去查或者近期建立一个个人数字图书馆,创建之日起15天之内可以免费下载10篇期刊和2篇博硕士论文。

7,语料库可以应用于语言学哪些领域

论文关键词:语料库语言学 语义处理 句法标注模型  论文摘要:由于自然语言的语义存在不确定性,形式化很困难,因此语义处理成为自然语言处理的瓶颈所在。基于大规模标注语料库的语义处理已经成为发展趋势,语料标注本质上就是语言知识(包括语义)形式化。现有句法标注模型主要包括基于短语结构语法(psg)和基于依存语法(dg)的句法标注模型,还存在一些局限性。文章在现有句法标注模型的基础上结合认知语法(cg)的有关理论提出改进思路,以探索新的句法标注模型。      人类社会发展的基本轨迹是:原始社会—农业社会—工业社会—信息社会。人工智能的目标是用计算机模拟人的智能,以最大限度地解放和延伸人的智能,无疑是信息社会的制高点。语言是人思维的物质外壳,人不可能离开语言而具备真正属于人的高级智能。因此,模拟人类语言智能的自然语言处理无疑是人工智能的重要研究方向。然而,迄今为止的研究表明,在可以预见的将来,语义处理将是自然语言处理的瓶颈所在。原因是语义十分复杂,而基于现有计算机软硬件的自然语言处理要求语义形式化。解决这一问题的根本之道是:探索新的句法标注模型,进行大规模的语义标注,基于语料库进行语义知识获取和自然语言处理。      一、句法标注模型      语言的复杂性在于语言与认识的关系。语言具有意义,而意义是入对主客观世界的认识结果。主客观世界的复杂性决定了意义的复杂性,进一步决定了语言的复杂性。语言本身又可以视为人的主客观世界中的一部分,因此语言研究是一种特殊的认识活动,是人对语言的认识。由此可见,语言离不开认识。人对主客观世界的认识可以如此描述:认识主体借助认识工具按照认识方法处理认识对象获得认识结果。认识是由多种认识因素(主体、工具、方法、对象)共同作用的活动,认识结果是这一活动的产物,被多种认识因素共同决定,任何一种认识因素的改变必然导致认识结果出现或大或小的差异。显然,认识结果与认识对象不能等同,是认识主体对认识对象的选择性反映,认识具有主观能动性。从这个意义上讲。认识不可能也不应该去被动地还原认识对象,而是从符合主体目的性出发,力求简单有效地描述和预测认识对象。借用模型的概念,认识结果就是认识对象的模型(model),认识就是建立认识对象的模型,简称建模(modeling)。这是一种实用主义认识观。   模型一般分为心理模型(psychological model)、数学模型(mathematical model)和物理模型(physical model)。心理模型是认识对象在人认识中的定性关系,是数学模型的基础;数学模型是认识对象在人认识中的定量关系,是物理模型的基础;物理模型是人借助特定材料和工具按照认识对象的数学模型实现的物质结构。传统意义上的建模主要指建立数学模型和物理模型,一般意义上的建模还包括建立心理模型。人的认识能力是有限的,表现在:人不能建立任意认识对象的心理模型,也不能建立任意心理模型的数学模型,也不能建立任意数学模型的物理模型。由于具有明确的实用主义特点,建模在理工科领域大行其道,在文科领域也逐渐受到青睐。人类将二进制数学模型成功实现为晶体管物理模型,并开发出越来越复杂和先进的计算机软件和硬件,从而进入信息时代。20世纪以来一些主要或次要的语言理论都或多或少应用了数学模型,特别是一些面向语言计算的语言理论。随着计算机技术的飞速发展,人们对计算机自动或辅助处理语言信息的需求越来越大。但计算机的根本缺陷在于,凡是不能建立数学模型的信息都无法处理。传统语言理论往往只在心理模型层面定性研究,无法满足这一需要。因此有必要引入数学模型研究语言,称为语言数学模型,简称语言模型(1anguage model)。统计语言模型(sta-tistical language model)就是一个成功的例子。但统计语言模型的性能取决于训练语料的规模和质量。目前,由于语料的不断积累和计算机技术的不断进步,语料规模已不成问题,语料中包含语言知识的数量和质量才是关键。   计算机的语言知识主要来源于人。将语料中包含的语言知识标注出来,有助于计算机获得更丰富、更有价值的语言知识,从而提高语言处理水平,这就是语料标注(corpus tagging)。一般认为主要包括词汇标注(1exical tagging,分词、词结构标注、词性标注、词义标注等)、句法标注(syntax tagging,语法树标注、语义树标注等)、语篇标注(discourse tagging,语体标注、领域标注等)等内容。经过标注的语料还可以用于语言学研究、语言教学、语言测试、词典编撰等诸多理论研究和实践应用领域,越来越受到人们重视,并形成一门新兴学科——语料库语言学(corpus linguistics)。目前,相对句法标注,词汇标注有更成熟的规范、准确率更高的技术和更大的标注规模。句法标注的主要困难在于,没有一个真正成熟的语法或语义标注模型。句法结构尤其是语义结构很难统一描述,现有的句法理论还不完善,难以制定统一规范,标注主观性很大,自动标注准确率比较低。因此,句法标注成了语料标注的瓶颈问题。由于句法知识在语言知识中的重要地位,有理由相信:如果有了大规模、高质量的句法标注语料库,围绕语料库的各种研究和应用有可能在现有基础上产生质的飞跃。因此,研究句法标注模型应是当务之急。语料库语言学属于交叉学科,句法标注模型是语料库语言学的基础理论,又与语言学的句法理论密切相关。一方面可以借鉴现有句法理论,另一方面,也可以从语料库语言学的角度研究句法,提出新的句法标注模型。
论文关键词:语料库语言学 语义处理 句法标注模型  论文摘要:由于自然语言的语义存在不确定性,形式化很困难,因此语义处理成为自然语言处理的瓶颈所在。基于大规模标注语料库的语义处理已经成为发展趋势,语料标注本质上就是语言知识(包括语义)形式化。现有句法标注模型主要包括基于短语结构语法(psg)和基于依存语法(dg)的句法标注模型,还存在一些局限性。文章在现有句法标注模型的基础上结合认知语法(cg)的有关理论提出改进思路,以探索新的句法标注模型。      人类社会发展的基本轨迹是:原始社会—农业社会—工业社会—信息社会。人工智能的目标是用计算机模拟人的智能,以最大限度地解放和延伸人的智能,无疑是信息社会的制高点。语言是人思维的物质外壳,人不可能离开语言而具备真正属于人的高级智能。因此,模拟人类语言智能的自然语言处理无疑是人工智能的重要研究方向。然而,迄今为止的研究表明,在可以预见的将来,语义处理将是自然语言处理的瓶颈所在。原因是语义十分复杂,而基于现有计算机软硬件的自然语言处理要求语义形式化。解决这一问题的根本之道是:探索新的句法标注模型,进行大规模的语义标注,基于语料库进行语义知识获取和自然语言处理。      一、句法标注模型      语言的复杂性在于语言与认识的关系。语言具有意义,而意义是入对主客观世界的认识结果。主客观世界的复杂性决定了意义的复杂性,进一步决定了语言的复杂性。语言本身又可以视为人的主客观世界中的一部分,因此语言研究是一种特殊的认识活动,是人对语言的认识。由此可见,语言离不开认识。人对主客观世界的认识可以如此描述:认识主体借助认识工具按照认识方法处理认识对象获得认识结果。认识是由多种认识因素(主体、工具、方法、对象)共同作用的活动,认识结果是这一活动的产物,被多种认识因素共同决定,任何一种认识因素的改变必然导致认识结果出现或大或小的差异。显然,认识结果与认识对象不能等同,是认识主体对认识对象的选择性反映,认识具有主观能动性。从这个意义上讲。认识不可能也不应该去被动地还原认识对象,而是从符合主体目的性出发,力求简单有效地描述和预测认识对象。借用模型的概念,认识结果就是认识对象的模型(model),认识就是建立认识对象的模型,简称建模(modeling)。这是一种实用主义认识观。   模型一般分为心理模型(psychological model)、数学模型(mathematical model)和物理模型(physical model)。心理模型是认识对象在人认识中的定性关系,是数学模型的基础;数学模型是认识对象在人认识中的定量关系,是物理模型的基础;物理模型是人借助特定材料和工具按照认识对象的数学模型实现的物质结构。传统意义上的建模主要指建立数学模型和物理模型,一般意义上的建模还包括建立心理模型。人的认识能力是有限的,表现在:人不能建立任意认识对象的心理模型,也不能建立任意心理模型的数学模型,也不能建立任意数学模型的物理模型。由于具有明确的实用主义特点,建模在理工科领域大行其道,在文科领域也逐渐受到青睐。人类将二进制数学模型成功实现为晶体管物理模型,并开发出越来越复杂和先进的计算机软件和硬件,从而进入信息时代。20世纪以来一些主要或次要的语言理论都或多或少应用了数学模型,特别是一些面向语言计算的语言理论。随着计算机技术的飞速发展,人们对计算机自动或辅助处理语言信息的需求越来越大。但计算机的根本缺陷在于,凡是不能建立数学模型的信息都无法处理。传统语言理论往往只在心理模型层面定性研究,无法满足这一需要。因此有必要引入数学模型研究语言,称为语言数学模型,简称语言模型(1anguage model)。统计语言模型(sta-tistical language model)就是一个成功的例子。但统计语言模型的性能取决于训练语料的规模和质量。目前,由于语料的不断积累和计算机技术的不断进步,语料规模已不成问题,语料中包含语言知识的数量和质量才是关键。   计算机的语言知识主要来源于人。将语料中包含的语言知识标注出来,有助于计算机获得更丰富、更有价值的语言知识,从而提高语言处理水平,这就是语料标注(corpus tagging)。一般认为主要包括词汇标注(1exical tagging,分词、词结构标注、词性标注、词义标注等)、句法标注(syntax tagging,语法树标注、语义树标注等)、语篇标注(discourse tagging,语体标注、领域标注等)等内容。经过标注的语料还可以用于语言学研究、语言教学、语言测试、词典编撰等诸多理论研究和实践应用领域,越来越受到人们重视,并形成一门新兴学科——语料库语言学(corpus linguistics)。目前,相对句法标注,词汇标注有更成熟的规范、准确率更高的技术和更大的标注规模。句法标注的主要困难在于,没有一个真正成熟的语法或语义标注模型。句法结构尤其是语义结构很难统一描述,现有的句法理论还不完善,难以制定统一规范,标注主观性很大,自动标注准确率比较低。因此,句法标注成了语料标注的瓶颈问题。由于句法知识在语言知识中的重要地位,有理由相信:如果有了大规模、高质量的句法标注语料库,围绕语料库的各种研究和应用有可能在现有基础上产生质的飞跃。因此,研究句法标注模型应是当务之急。语料库语言学属于交叉学科,句法标注模型是语料库语言学的基础理论,又与语言学的句法理论密切相关。一方面可以借鉴现有句法理论,另一方面,也可以从语料库语言学的角度研究句法,提出新的句法标注模型。
关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;⑵同质的(Homogeneous):只收集同一类内容的语料;⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;⑷专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS) corpus(短消息服务(SMS)语料)等。
文章TAG:怎么通过语料库研究翻译怎么通过语料库

最近更新

  • 不超过,篇幅不超过300字个字数不超过300字有什么区别不超过,篇幅不超过300字个字数不超过300字有什么区别

    篇幅不超过300字个字数不超过300字有什么区别2,不超过27岁是包括27岁还是不包括27岁3,文件最大不超过200M是什么意思4,请问坐飞机行李不能超过多少公斤5,新劳动合同每周工作不超过多少小时.....

    合伙联营 日期:2024-02-08

  • 口爆什么意思,嘿咻是什么意思口爆什么意思,嘿咻是什么意思

    嘿咻是什么意思2,羞射是什么意思3,口吹是什么意思4,口交是什么意思5,潮喷是什么意思6,口嗨是什么意思1,嘿咻是什么意思语助词,没什么意思,相当于劳动人民做事时喊的号子,有控制节奏的作用.2,.....

    合伙联营 日期:2024-02-08

  • 欧阳琴,欧阳琴的韩语怎么写欧阳琴,欧阳琴的韩语怎么写

    欧阳琴的韩语怎么写2,关于陆小凤之决战前后3,求代号十三钗里十三个金钗的所有名字4,代号十三钗的十三位主角是5,代号十三钗剧中女演员名单6,长相甜美上过央视春晚演过主旋律影视剧的女明星1.....

    合伙联营 日期:2024-02-08

  • 希腊签证中心官网,希腊签证中心网站用哪个浏览器能打开希腊签证中心官网,希腊签证中心网站用哪个浏览器能打开

    希腊签证中心网站用哪个浏览器能打开你好;你用QQ浏览器就可以打开的,QQ浏览器的安装包很小,占不了多大的内存,功能却很强大,它采用单核模式,有很小的安装包,和超强的稳定型。浏览网页的速度也.....

    合伙联营 日期:2024-02-08

  • 公车上书,简述公车上书公车上书,简述公车上书

    简述公车上书2,简述公车上书的历史意义但也不要太短3,及求公车上书之上书的内容原文4,公车上书怎么读5,哪里能看到公车上书原文6,历史上的公车上书中的公车是什么意思1,简述公车上书1985年,以.....

    合伙联营 日期:2024-02-08

  • 三违,在安全生产工作中通常所说的三违现象是指什么三违,在安全生产工作中通常所说的三违现象是指什么

    在安全生产工作中通常所说的三违现象是指什么2,什么是三违3,三违是什么4,三违指的有哪些5,三违是指什么6,三违是指什么7,什么是三违8,什么是三违1,在安全生产工作中通常所说的三违现象是指什么.....

    合伙联营 日期:2024-02-08

  • 重庆公积金贷款利率,重庆首套房公积金贷款利率是多少重庆公积金贷款利率,重庆首套房公积金贷款利率是多少

    重庆首套房公积金贷款利率是多少2,重庆住房公积金贷款利率一般是多少3,重庆市住房公积金贷款利息是多少钱4,重庆住房公积金房贷最新利率是多少1,重庆首套房公积金贷款利率是多少现行公积金.....

    合伙联营 日期:2024-02-08

  • 天津小客车调控,天津摇车牌号怎么报名天津小客车调控,天津摇车牌号怎么报名

    天津摇车牌号怎么报名2,天津市怎样申请汽车摇号3,天津小客车摇号怎么摇4,天津市汽车限购限行的具体措施是嘛5,天津小车摇号怎么摇6,小车怎么摇号1,天津摇车牌号怎么报名天津市小客车调控管理.....

    合伙联营 日期:2024-02-08