bcc语料库


教师节 2019-09-29 08:35:27 教师节
[摘要](1) [bcc语料库]对外汉语教师备课找例句:一站即可语料库是对外汉语教师必不可少的好帮手,可以帮老师筛选例句、进行词汇对比、查看学生偏误。今天的教程就是教对外汉语的老师们如何用目前全球最大的汉语语料库BCC来备课。教程包含两个部分,其一是介绍BCC,其二是介绍BCC用法。什么是BCC一BCC

【www.shanpow.com--教师节】

(1) [bcc语料库]对外汉语教师备课找例句:一站即可

语料库是对外汉语教师必不可少的好帮手,可以帮老师筛选例句、进行词汇对比、查看学生偏误。
今天的教程就是教对外汉语的老师们如何用目前全球最大的汉语语料库BCC来备课。教程包含两个部分,其一是介绍BCC,其二是介绍BCC用法。
什么是BCC一BCC(BLCU Chinese Corpus)北京语言大学现代汉语语料库,总字数约 150 亿字,是目前最大的汉语语料库,没有之一,语料多得让人兴奋。简单说说它的特点吧,用四字概括,大、多、久、强。怎么有点老司机上路的感觉。哈哈。
1. 大
字数规模大,150亿字的容量可以全面反映当今社会语言生活。
2. 多
涵盖语体多,不同于以书面语体为主的CCL,BCC涵盖报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料。
3. 久
时间覆盖久,报刊中部分语料可以追溯至1945年。
4. 强
搜索模式强,我在玩这些功能时,感觉自己摇身变成码农。是不是已经被提起兴致来啦?想知道怎么用?跟着老司机走。备课时怎么用BCC一
网站入口:http://bcc.blcu.edu.cn
BCC在汉语教师备课时候,我觉得主要有5大功能,其他功能还有待大家开发,文章末尾有BCC提供的检索式示例。1 词语辨析在备课时,特别是中高级汉语课程,由于学生词汇量较多,他们常常会拿以前学过的词和新词做对比。老师可以用“[ ]”这个符号进行语料搜集,“[ ]”的功能可以理解为“或者”。比如想辨析“不料”和“竟然”,那么在搜索栏里添加[不料 竟然]即可,注意“[ ]”是英文符号。下图就是结果,有“不料”的语料,也有“竟然”的语料,老师即可通过语料去分析词语的差别。点击大图查看2词语例句在备课时,词语是重要部分,要找适合学生水平的例句一点都不容易,但是有了BCC,so easy!比如想找“舍不得” 动词的例句,可以在搜索栏输入“舍不得v”,结果如下图:
点击大图查看
还有更牛的,点击界面中的“统计”按钮,就可以穷尽式地查找“舍不得”到底可以和哪些动词一起连用,数字表示出现频次。
点击大图查看3句型例句汉语句型例句也能通过BCC搜索出来,而且是精确搜索,比如刚开始教“把”字句,一般都是结果补语为“在”“到”“成”“给”的“把”字句,那么可以在搜索栏输入“把*v[在 到 成 给] ”即可,“*”的功能可以理解为“离合”。例句结果如下:
点击大图查看
再使用统计功能,这种“把”字句能用哪些动词也一目了然了,这太节省时间了!
点击大图查看4结构例句汉语中有一些固定结构,比如“越…越…”,可以用通过在搜索栏搜“越.越.”来实现,“.”可以理解为一个字,搜索结构如下:
点击大图查看
如果想要看到底“越”后面可以跟那些词,然后根据这个结构造一些更易于学生理解的句子出来,通过统计也可以实现,结果如下:
点击大图查看5错句搜索北京语言大学以前最有名的一个语料库是HSK动态作文语料库,主要是查看学生偏误的,BCC整合了HSK动态语料库的功能,也可以查看学生在某个词或者某个结构的错误,方便老师查看并在易错地方进行强化教学。比如同样用“越.越.”搜索,但是选择HSK语料,即可看到学生在“越…越…”这个结构中的错误,比如一个学生的错句为“人越多越那个工作容易完成”。通过检索学生错句来发现教学中应该侧重的地方,这对新老师来说尤为重要。
点击大图查看从书面语料到口语语料再到中介语语料,
BCC是堪称一站式备课网站。
备课有了BCC,百度从此是路人。
文末附上BCC语料库提供的检索示例
赶紧分享给小伙伴
无数对外汉语老师伏案备课的夜晚急需你的解救附检索示例
参考文献:荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制[J],语料库语言学,2016(1).
本文来源:唯一汉语人公众号

(2) [bcc语料库]哇,9大对外汉语必备语料库,每个都很有“性格”!!


每一个语料库我都为你尝试打开过了,绝对实用~
        注:本文为“汉府中文”原创,其他网页或者微信公众号转载时请务必联系我,也欢迎大家转发到自己的朋友圈哦~
1、中山大学留学生汉字偏误语料库
这个语料库,对于对外汉语专业的研究生来说,非常实用,海量的字词句偏误案例,简洁大方的界面,让人心情倍儿爽!
语料库首页
其中又分为汉字偏误标注版和字词句偏误标准版。我们随便点开一个版本看看:
哇塞,所有的信息一目了然~关键简单注册一个账号,就可以了~
网址是:http://cilc.sysu.edu.cn/
2、中央民族大学国际汉语教学数据库平台君要给大家介绍的另一个语料库是中央民族大学国际汉语教学语料库,在这里,你不仅可以查到有用的学术资源、教学资源,还可以了解到对外汉语圈子里发生的新鲜事儿~
注意在搜索时,先注册一个账号哦~
网址是:http://tpi.muc.edu.cn/App_Pages/Default.aspx
3、北京语言大学HSK动态作文语料库
北语,作为对外汉语教学的领军学校,自然在这方面研究颇多,其中动态作文语料库是一个不错的资源,非北语的学生也可以使用。不过还有很多资源没有对外开放,平台君建议方便的话,多开放一些哦~
简单注册一个账号就可以使用啦~
网址是:http://202.112.195.192:8060/hsk/login.asp4、BCC语料库
这里的BCC,可以不是英国的BBC哦,北京语言大学为加强对于语言教育和语言信息化的技术支持,2009年在语言信息处理研究所基础上成立汉语国际教育技术研发中心。2014年更名为大数据与语言教育研究所。研究所立足北语,旨在利用大数据和云计算,着力研究和开发各类语言研究、教学和语言应用所需的关键技术。
BBC语料库搜集了微博、报刊、科技、文学等各领域的语料,非常的齐全。
同时,你在这里还可以下载到各类常用的资源,比如:
网址是:http://bcc.blcu.edu.cn/
5、国际汉语教学案例库作为汉语国际教育专业的老大和领导,孔子学院也贡献了一份力量,建立了“国际汉语教学案例库”,类别清楚,资料充分,赞一个~
而在每个类别下,又细分为很多类别,更方便大家查询:
网址是:http://anli.chinesecio.com/public/index.html6、国际汉语教材案例库谈完了案例,再来看看教材方面的语料库,看这里,整个界面没有一个多余的字,是不是很赞?
根据提示,输入关键词,你就能找到你想要的教材!比如输入“中文”一词,一共查找到468本教材:
网址是:http://www.languagedata.net/corpus/
7、语料库在线它是一个集大成者,现汉、古汉,全部包含,资源非常丰富:
同时,还有各类免费的资源下载:
而让人更兴奋的是,居然还可以在线自动标注拼音:比如,我们输入:
汉府中文是一个专业的对外汉语学习交流平台,看看奇迹:
网址是:http://www.cncorpus.org/index.aspx
8、全球汉语教材库中山大学是值得我们钦佩的一个大学,这不,又建立了一个全新的对外汉语教材语料库,先来看看首页:
真的很干净~
那么资源量大不?我们随便输入一个词“汉语”来看看,一共搜索到15000余个结果!
网址是:http://www.ctmlib.com/main9、北京大学汉英双语语料库
这个语料库很强大,不仅提供了现代汉语和古代汉语的语料,还提供了英文语料。在查询方式上,除了普通查询方式外,还有批量查询和模式查询,大大提高了搜索速度。需要写论文的你快来试试吧~
网址是:http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp

(3) [bcc语料库]普通人也能用的9个语料库网站,做研究、学外语的来看看


提到语料库,很多人脑中浮现出这样的画面—— 或者这样的—— 但其实,语料库可以是我们做(语言)研究、学外语的好帮手。比如,你可以在某些语料库查到最地道的英语表达,也可以听到世界各地的英语口音。
今天就为大家介绍9个语料库网站——
1. 语言结构世界地图集
Word Atlas of Language Structure
知道阿伯卡茨语有多少元音和辅音?波罗罗语的词缀有几种形态?恰卡通戈米斯特克语有几种声调?
想回答这些问题?
你需要的只是登陆这个名为The World Atlas of Language Structures Online(语言结构世界地图册,简称WALS)的网站 这里有各类语言分布的详细地图,有对于世界上2600多种语言192个语言学特征的详细记录,非常适合语言爱好者。 嗯,妈妈再也不用担心我被多语狂魔们实力嘲讽了,随便选出一个语言了解一下,足以技惊四座! 详细的使用指南以及更多精彩内容,午餐早已备好,我不会这门语言,但我可以查到关于它的一切 | 语言学午餐
2. 语言口音档案馆
the Speech Accent Archive
大家学英语这么多年,基本上属于身经百战了,哪个地方的英语口音没听过,什么纯正伦敦音,印度咖喱腔,苏格兰懵逼腔,布鲁克林街头腔,那是如数家珍。 但是,你听过刚果金非洲小哥的英语口语嘛?你了解玻利维亚大妈的英语口音嘛?喏,这个名为the Speech Accent Archive 的网站绝对可以满足各位英语语音控的猎奇愿望。
该数据库搜集了几百名来自世界各地,不同民族语言背景的人们针对同一段文字的录音资料,每段录音都详细记录了音频提供者的详细背景资料,每段语音也很详细的进行了转写。
对于研究者来说,可视之为研究英语使用者发音特征的独门利器;对普通人来说,则是一个了解各地英语口音的难得窗口。
3. 当代美国英语语料库
COCA
想知道某个单词在新闻和小说中的使用有什么差异?英文写作的时候想知道自己写出来的英语搭配够不够地道?想知道背下多少单词就可以流利阅读各类小说报纸? 嗯,你需要的只是一个语料容量巨大的英语语料库,COCA恰好可以满足你的这些需求。
当代美国英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库。
语料库由包含4.5亿词的文本构成,文本分为口语、小说、流行杂志、报纸以及学术文章五种不同的文体。单词,短语,搭配,想搜什么搜什么,丰富的英语语料很适合英语学习者了解地道表达。 再一份详细使用指南倾情奉上,走近COCA,在线语料库的翘楚 | 语言学午餐(注:目前COCA界面和该文章写成时稍有出入,但主要操作流程仍值得参考)。
4. 儿童语音语料库
CHILDS
午餐君曾经有过这么一个想法,将来如果成功升级为孩儿他爸,一定要把自己孩子学说话的过程进行录音,然后安心保存,处理,分析,说不定可以探究出语言习得的奥秘,然后提出理论,一战封神,著书立说,设馆招徒,麾下天启四骑士,再然后成为顶级公知(喂喂喂!快醒醒!你个单身狗!) 不过话说回来,实际记录儿童语言这个想法早就有学者付诸实践了,他们还创立了一个规模庞大的儿童语音语料库CHILDES(Child Language Data Exchange System)。
儿童语言数据交流系统是在儿童语言研究相关领域被最广泛使用的语料库,创立于上世纪八十年代,涵盖了多门语言中儿童习得者的语音记录。根据学者统计,截至2000年,已有1000余项基于该语料库的研究成果发表( MacWhinney 2000)。
在这里,你可以找到儿童语言习得过程的详细音频文件和转写文本,涉及的语言包括英语,德语,法语,日语,汉语,广东话等等。错过了记录自己牙牙学语的轨迹,或许这个数据库是一个不错的弥补手段。
嗯,这个也有使用指南:一款超级强大的儿童语音语料库 | 语言学午餐 5. 语言学数据联盟
Linguistic Data Consortium
前不久AlphaGo席卷棋坛,人工智能再显神威;提到语言学中的人工智能,大家第一反应或许会是苹果的语音助手Siri。
不过各位有没有想过如果你有足够的数据资料,辅以适当的算法,做一个人工智能语言系统也许并不是那么困难,这不,Linguistic Data Consortium就为你提供了这种可能。 这个上世纪90年代初由宾夕法尼亚尼亚大学发起的数据共享平台,目前已经由上百所大学加盟,涵盖几百种语言数据,包含英语,法语,西班牙语,汉语等十多种语言。
Siri之所以能够神奇的听懂使用者的命令,很大程度上得益于其背后强大的语音数据库,而LDC的强大之处就在于它提供了大量的语音资源,口语对话,新闻广播,电话对话等等。唯一有些伤感的是,这个数据库并不是免费的,不过也别气馁,如果你有惊人的idea不妨尝试申请一下LDC提供的研究奖励金,这样就可以继续实现你的语言智能梦想了。 说了这么多,就差一个程序员了...
6. 北大&北语汉语语料库
CCL and BCC
刚刚说了好多英语数据库,我们再来聊聊汉语语料库。
汉语语料库里有两个不得不说,一个是老牌劲旅,北京大学汉语语料库(CCL);一个是后起之秀,北京语言大学汉语语料库(BCC)。
两个语料库各有千秋,各有特点,小编也不敢妄下评价,不过有一点是相同的,那就是两个语料库用来做汉语研究和日常搜索(比如教外国人汉语时找例句)都相当不错。 北京大学汉语语料库是汉语研究中最主要的语言案例来源,每当使用的时候,都可以自豪的说出自己使用的是专家同款语料库,其语料编排得当,挑选细致,搜索方便,这些优点都使得其广为语言学众所喜爱。北语汉语语料库则拥有更多数据搜索功能,例如可以查看搜索词的历时词频变化,学生作文语料等等,语料容量更是达到了惊人的bilion级。
除了上述这些以外,语言学数据库还有很多很多,比如一些强大的专业性语料库,双语平行语料库,多模态语料库,依存树库等等。
在文末午餐君再为各位附上两个提供语料库索引功能的网站:
http://www.helsinki.fi/varieng/CoRD/corpora/corpusfinder
这个名为corpus finder的网站提供了近60种语料库的资料信息和使用链接,感兴趣的朋友不妨试试看。 http://www.bfsu-corpus.org
不少大学院系网站上也会提供大量的数据资源和相关指南,北京外国语大学语料库团队的网站就是一个不错的选择,网站提供了大量语料库相关资源,相比国外网站,其汉语数据也更丰富。

本文来源:https://www.shanpow.com/rc/471454/

《bcc语料库.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式

相关阅读
  • 校领导教师节表彰大会精彩讲话稿精选四篇 校领导教师节表彰大会精彩讲话稿精选四篇
  • 在庆祝教师节暨表彰大会上的讲话材料范文(通用5篇) 在庆祝教师节暨表彰大会上的讲话材料范文(通用5篇)
  • 学习教师节重要寄语精神心得体会三篇 学习教师节重要寄语精神心得体会三篇
  • 教师节写给老师的一封信【4篇】 教师节写给老师的一封信【4篇】
  • 一年级祝老师教师节祝福语(合集五篇) 一年级祝老师教师节祝福语(合集五篇)
  • 教师节庆祝大会讲话致辞稿范文(通用6篇) 教师节庆祝大会讲话致辞稿范文(通用6篇)
  • 教师节卡片简单的祝福语范文汇总八篇 教师节卡片简单的祝福语范文汇总八篇
  • 教师节黑板报【九篇】 教师节黑板报【九篇】
为您推荐
  • 教师节感恩老师的语言集合3篇
    教师节感恩老师的语言集合3篇
    老师又作教师是一种职业,古已有之,指传授学生知识的人员,有各种教育类型(幼儿老师、小学老师、初中老师、大学老师等);也泛指在某方面值得学习和能够给大家带来一定正确知识和指导,有能力的人。下面是小编精心整理的教师节感恩老师的语言集合3篇,仅供参考,大家一起来看看吧。
  • 书记在2021年庆祝教师节大会讲话范文六篇
    书记在2021年庆祝教师节大会讲话范文六篇
    教师的品德和素养是能否培养好学生和教师发展的重要前提,只有对“怎样做一名好教师”这一问题有深刻的认识,对教师这一职业有崇高的责任感,才能培养出优秀的学生,才能对自己提出更高的要求。以下是为大家整理的书记在2021年庆祝教师节大会讲话范文六篇,欢迎品鉴!
  • 2022年教师节感谢信范文(精选5篇)
    2022年教师节感谢信范文(精选5篇)
    教师节,旨在肯定教师为教育事业所做的贡献。在中国近现代史上,多次以不同的日期作为过教师节。直至1985年,第六届全国人大常委会第九次会议通过了国务院关于建立教师节的议案,才真正确定了1985年9月10日为中国第一个教师节。以下是小编为大家收集的2022年教师节感谢信范文(精选5篇),仅供参考,欢迎大
  • 2022年教师节座谈会活动方案汇编4篇
    2022年教师节座谈会活动方案汇编4篇
    方案,汉语词语,一般是指进行工作的具体计划或对某一问题制定的规划。以下是为大家整理的2022年教师节座谈会活动方案汇编4篇,欢迎品鉴!
  • 有关教师节图画精选4篇
    有关教师节图画精选4篇
    图画,汉语词语,读音是tú huà,意思是绘画,出自《汉书·苏武传》。以下是小编收集整理的有关教师节图画精选4篇,仅供参考,希望能够帮助到大家。
  • 教师节短信息范文(通用5篇)
    教师节短信息范文(通用5篇)
    企业信誉是使公众认知的心理转变过程,是企业行为取得社会认可,从而取得资源、机会和支持,进而完成价值创造的能力的总和。从理论上讲,企业存在的所有信息都可以被看成为企业信誉的内容。以下是小编为大家收集的教师节短信息范文(通用5篇),仅供参考,欢迎大家阅读。
  • 最新写给老师教师节祝福语范文三篇
    最新写给老师教师节祝福语范文三篇
    祝福语是指对人们的美好祝福的语句。以下是小编为大家收集的最新写给老师教师节祝福语范文三篇,仅供参考,欢迎大家阅读。
  • 教师节寄语简洁(合集4篇)
    教师节寄语简洁(合集4篇)
    寄语,是一个汉语词汇,拼音是jìyǔ,意思是所传的话语,有时也指寄托希望的话语。可作名词、也可作动词。以下是小编整理的教师节寄语简洁(合集4篇),仅供参考,希望能够帮助到大家。
  • 教师节写给老师的祝福范文四篇
    教师节写给老师的祝福范文四篇
    祝福语是指对人们的美好祝福的语句。以下是小编收集整理的教师节写给老师的祝福范文四篇,仅供参考,希望能够帮助到大家。
  • 小学生教师节祝福语范文五篇
    小学生教师节祝福语范文五篇
    教师节,旨在肯定教师为教育事业所做的贡献。在中国近现代史上有多个日期曾作为教师节。以下是小编整理的小学生教师节祝福语范文五篇,欢迎阅读与收藏。