2011年中国语言生活状况报告

Mark wiens

发布时间:2022-08-20

  2011年中国语言生活生机勃勃,健康多彩。总体状况为:中央政府高度重视语言文字事业;国家语言文字工作的视野和领域进一步拓展;大力推广和规范使用国家通用语言文字、科学保护各民族语言文字稳步推进,亮点突出;残障人士的语言文字权利得到切实保障;社会大众广泛关注语言生活;国际化、市场化进程中的语言文字问题受到关注;海峡两岸语言文字学术交流活跃;媒体、教材等的用字用语情况稳定。

  (一)10月,中国党第十七届中央委员会第六次全体会议通过《中央关于深化文化体制改革,推动社会主义文化大发展大繁荣若干重大问题的决定》,提出要“大力推广和规范使用国家通用语言文字,科学保护各民族语言文字”,对语言文字事业提出明确要求,凸显了语言文字工作在社会主义文化建设中的战略地位,体现了党和国家对语言文字事业的高度重视和殷切希望。

  (二)1月,中央局委员、国务委员刘延东在纪念《国家通用语言文字法》颁布10周年座谈会上代表党中央、国务院发表重要讲话,指出“加强国家通用语言文字的推广和普及,是维护国家主权与尊严、体现国家核心利益的战略举措”,阐述了语言文字方针政策,强调了语言文字工作的地位作用,明确了新时期语言文字工作的方向,对当前和今后一个时期的语言文字工作具有重要指导意义。

  (三)国务院2011年发布的多个文件都涉及语言文字工作内容,包括残障人士的语言权利保障、少数民族语言文字工作以及语言文化国际交流,如《兴边富民行动规划(2011-2015年)》《关于促进牧区又好又快发展的若干意见》《中国遏制与防治艾滋病“十二五”行动计划》《国务院关于修改〈出版管理条例〉的决定》《中俄人文合作委员会第十二次会议纪要》等。

  1.国家民委、国家发展改革委、财政部、中国人民银行、国务院扶贫办6月联合发布《扶持人口较少民族发展规划(2011-2015年)》,内容涉及促进双语教育,推进语言文字规范化、标准化和信息化,支持民族语文文化产品的出版发行,加强濒危语言的抢救和保护工作等。

  2. 民政部7月发布《婚姻登记机关等级评定标准》,规定婚姻登记员统一使用普通话,涉外婚姻登记机关婚姻登记员至少熟练掌握一门外语。

  3.卫生部12月发布《医疗机构从业人员行为规范(征求意见稿)》,要求医疗机构从业人员言语文明,认真执行医疗文书制度,规范书写、妥善保存病历材料,正确运用医学术语。

  4.国家广播电影电视总局2月发布《关于进一步加强电视剧文字质量管理的通知》,要求“电视剧制作机构应对所制作的电视剧进行文字质量检查,确保电视剧用字用语正确、规范,避免出现字幕错别字,同时尽可能减少读音错误、用词错误和表达错误。”“电视剧审查机构要制定明确、严格的文字质量监管制度,加强对送审电视剧的文字质量把关。”

  5.新闻出版总署2月下发《关于倡议开展向中西部贫困地区农村中小学捐赠新华字典活动的通知》,倡议向中西部贫困地区农村中小学生捐赠《新华字典》平装本,为贫困山区的孩子奉献一片爱心,切实解决农村地区学生缺乏正版字典问题。

  新闻出版总署和海关总署3月联合发布《音像制品进口管理办法》,规定出版进口音像制品要使用经批准的中文节目名称;外语节目应在音像制品及封面包装上标明中外文名称;出版进口音像制品使用的语言文字应符合国家公布的语言文字规范。

  《国家中长期语言文字事业改革和发展规划纲要(2010-2020年)》基本定稿。制定并发布实施《语言文字规划纲要》,对语言文字事业适应形势发展,全面贯彻落实《教育规划纲要》,保证国家语言文字事业全面、协调、可持续发展具有重要作用。《语言文字规划纲要》还将根据十七届六中全会提出的“大力推广和规范使用国家通用语言文字,科学保护各民族语言文字”要求进一步修改完善。

  《通用规范汉字表》8月17日经国务院常务会议审议通过。《通用规范汉字表》是贯彻《国家通用语言文字法》,适应信息时代社会各领域汉字应用需要的重要汉字规范。发布了《出版物上数字用法》《标点符号用法》《中国人名汉语拼音字母拼写规则》等3项社会急需的国家标准,有助于提升社会各领域语言文字应用的规范化水平。

  第十四届全国推广普通话宣传周活动在全国各地广泛开展。9月,宣传周开、闭幕式分别在内蒙古自治区鄂尔多斯市和自治区拉萨市举行。本届推普周的宣传主题是“提升国家通用语言文字应用能力,弘扬中华优秀文化传统”。

  国家语委2011年度集中立项的“十二五”科研项目总计136项,覆盖了国家语委的重点工作,包括语言政策、语言文字规范标准、普通话的推广与测试、国民语言能力、中华经典诵读、双语教育、盲文手语标准等。

  汉语能力测试取得突破性进展。12月,汉语能力测试试点工作在北京、内蒙古、上海、江苏、云南和南开大学等地(校)启动,共有2442人参加测试。

  面向社会的其他语言测试有序开展,包括汉字应用水平测试、中国少数民族汉语水平等级考试、汉语口语水平测试、新汉语水平考试、中国汉语水平考试、国家职业汉语能力测试等。

  推进规范汉字书写教育。举办了“中华诵?2011全球华人学生暨全国学生规范汉字书写大赛”;组织开展国家级规范汉字书写教育特色学校评审;举办了首届规范汉字书写、书法师资培训班;召开了规范汉字书写教育论坛。

  教育部、国家语委下发《关于在学校开展“中华诵?经典诵读行动”试点工作的通知》;全国教育系统开展红色经典诵读活动,其中天津、江苏、浙江等14个省(区、市)共组织各类红色经典诵读活动近5万场次,直接参与和观摩师生人数近1400万人,参与学校1.5万所;组织开展“中华诵?2011经典诵读大赛”“中华诵?2011中小学生作文大赛”等活动。

  教育部办公厅4月下发了《关于开展第三批国家级语言文字规范化示范校申报、认定工作的通知》,要求各地重视示范校建设,积极组织申报。经评审和复查,教育部、国家语委12月授予506所学校国家级语言文字规范化示范校称号。

  新时期普通线月召开。普通线月在北京成立,“普通话语音规范网(普通话审音网)”同时开通。新时期普通话审音工作将围绕普通话审音原则制定和《普通话异读词审音表》修订,进一步完善普通话语音标准,适应新时期语言生活发展的需要。

  中国语言资源有声数据库上海库、北京库和辽宁库的建设工作先后启动。中国语言资源有声数据库建设试点总结会在南京召开,会议总结了江苏省的试点经验,肯定了“政府主导、学者承担、社会参与”的工作模式,同时开通了中国语言资源有声数据库(江苏库)展示网。

  蒙古语标准音水平测试在内蒙古自治区的14个考点举行了11次考试,考生总人数达到2500人次。壮语文水平考试研制工作 2010年启动,2011年在广西部分考点完成了模拟考试和题目分析。

  “现代藏语语法信息词典数据库研究”项目12月通过专家鉴定,项目成果为进一步开展藏语文本语法标注、机器自动分词、藏汉机器翻译等奠定了基础。“达斡尔、鄂温克和鄂伦春语语音声学参数数据库”11月通过专家鉴定。这些项目的成果有助于我国少数民族语言语音资源的保护和开发。《中国少数民族语言文字规范化信息化报告》出版。

  新闻出版总署发布了《新闻出版业“十二五”时期发展规划》,提出建设“中华字库工程”。该工程将收集现有文献资料中的汉字形体和少数民族文字形体,建立字际联系,并按照出版印刷及网络数字化需求,制作出符合各种应用需求的汉字和少数民族文字的编码及主要字体字符库。

  “十二五”期间,国家“重点民文出版译制工程”每年资助重点民文(含民汉双语)图书和民文音像制品,资助优秀汉文、外文出版物的民文翻译。“五种民族文字500种图书进千村千校”项目从12月开始,向蒙古、藏、维吾尔、哈萨克、朝鲜5个少数民族聚居的省区免费赠阅50万册图书。

  最高人民法院围绕西部民族地区建立双语法官培训基地开展调查研究,组织并资助新疆、青海、内蒙等地编写双语法官培训教材,编写完成了《汉藏对照法学词典》。

  国务院法制办就《无障碍环境建设条例(征求意见稿)》公开征求意见,其中规定:发布政务信息、播出电视节目时应提供无障碍信息交流服务;城市公共服务场所、公共交通工具等应为无障碍信息交流创造条件;网站、图书馆等应逐步提供无障碍信息交流服务。服务方式包括:文字提示、手语、语音提示、屏显字幕、视觉引导、听力辅助、有声读物、盲文读物、盲文选票、盲文试卷等。

  中国残疾人联合会发布《中国残疾人事业“十二五”发展纲要》,将手语、盲文研究与推广工作纳入国家语言文字工作规划,建立手语、盲文研究机构,规范、推广国家通用手语、通用盲文,提高手语、盲文的信息化水平,建立手语翻译员培训、认证、派遣服务制度。

  新闻出版总署发布《新闻出版业“十二五”时期发展规划》,提出“十二五”期间国家实施“盲文出版工程”, 加强盲文出版基地建设,配置盲文刻印机和盲文制版印刷生产线;开发符合盲人认知的盲文乐谱、工具书、期刊、数字有声读物;建设中国盲文图书馆;设立盲用信息化辅助技术研究和产品研发专项。

  12月,国家语言资源监测与研究中心、商务印书馆等单位主办的“汉语盘点2011” 活动,发布了“年度字词”“年度流行语”“年度新词语”。国内、国际年度字词分别是“控”“伤不起”和“债”“欧债危机”;十大流行语是:中国党建党90周年、“十二五”开局、文化强国、食品安全、交会对接、日本大地震、欧债危机、利比亚局势、乔布斯、德班气候大会;十大新词语是:伤不起、起云剂、虎妈、政务微博、北京精神、走转改、微电影、加名税、淘宝体、云电视。

  新华网7月报道,历时3年研制的“汉语能力测试”将于年内试点开考。这则消息引起社会极大关注。赞成者认为,当前测试仍是促进学习的主要手段,推行汉语能力测试有利于提高国民的母语能力,促进汉语的健康发展。质疑者担心开展测试会增加学生的学习负担,损害汉语的教育与学习。

  关于湖北“襄樊”市改称“襄阳”市引发社会议论。支持者认为,历史上襄阳的地位比樊城高,更名凸显了襄阳的历史文化底蕴,有利于招商引资或旅游开发。反对者认为,樊城的历史文化同样深远,更名要修改各种地图、公章等,至少要付出1亿元的成本。

  淘宝体录取通知。7月,南京理工大学给新生发送了“淘宝体”录取短信:“亲,祝贺你哦!你被南理工录取了哦!不错的哦!211院校哦!……”。有人认为该短信采用年轻人喜闻乐见的表达方式,很亲切,但质疑者认为这种短信不够严肃。

  淘宝体通缉令。上海徐汇警方发布了一则“淘宝体通缉令”,通缉令中以“亲”称呼在逃人员,并使用了“优惠”“客服热线”“预订”“套餐”等商家常用的词语。质疑者认为,这种表达形式模糊了与罪犯的界限,消解了司法的严肃性,使庄重的执法带上娱乐化色彩。

  淘宝体招聘公告。8月,外交部微博“外交小灵通”发布了一则“中日韩三国合作秘书处”招聘公告。该公告用“亲”的称呼开头,用“不包邮”结束,中间还使用了“有木有”等带有咆哮体特征的词语以及网络表情符号。批评者认为,“外交无小事”,外交部门使用的语言不应过于随意。

  《公共服务领域外文译写规范 英文》专家委员会8月在北京成立,“公共服务领域外文译写”网站同时开通。《公共服务领域外文译写规范 英文(通则)》(草案)12月经审议通过。我国公共服务领域外文译写规范将包含英、俄、日、韩四个语种,覆盖交通、旅游、文娱、体育、卫生、商贸、餐饮住宿等十多个领域。

  有专家指出,目前我国国家外语能力远不能满足国家快速发展的需求,主要表现在外语语种数量不足;外语资源质量不高;高端外语人才缺乏;对现有外语资源的掌控和开发利用程度不够。建议国家相关部门采取措施,加强统一管理。

  据目前掌握的资料,截至2009年底,我国语言翻译服务企业有15 039家,翻译和本地化业务年产值约120亿元人民币;语言培训市场规模2013年预计将达400多亿元,并将在未来的3至5年内保持每年15%以上的增长速度;商务印书馆推出的《新华字典》,已在海内外累计发行 4亿余册,称得上是“世界上发行量最大的辞书”;《全球华语大词典》列入国家“十二五”出版规划重大项目。

  6月,游客赴台个人游开放。为招揽游客,扩大商机,地区一些商家开始使用简化字的招牌、标识、产品说明书、餐馆菜单等,有的也将菜名改为熟悉的名称。有些机构的网站开始启用简化字版。

  海峡两岸合编中华语文工具书工作取得较大进展。12月,完成《两岸常用词典》(《中华语文词典》简编本)的编纂、中华语文知识库网站检索等系统的建设、5000万字语料的建库和加工,中华语文知识库网站实现云技术服务。

  9月,“2011两岸汉字艺术节”在台北故宫博物院开幕,期间展出了台北故宫博物院收藏的书法作品,举办了“书写汉字——当代艺术展”“两岸篆刻名家展”“数字e笔书画展”,开展了名家对谈、艺术讲堂等活动。11月,以“国语运动百年”为主题的“第六届海峡两岸现代汉语问题学术研讨会”在澳门召开,与会者围绕国语运动、方言、汉语词汇、汉语语音、语文教育、语言政策等进行了多角度的深入探讨。

  报纸、广播电视、网络(新闻)的年度用字用语状况,可以反映媒体年度的语言使用实态。从这些字和词语的使用状况可以反映年度社会生活、时事面貌。

  2011年度国家通用语言媒体用字用语调查在2011年度国家语言资源监测语料库上进行,语料共计1 167 751个文本,1 292 983 007字符次,其中汉字出现1 054 313 804字次。

  (1)覆盖率达到80%、90%、99%的字种数分别为593、957、2396个,高频汉字使用稳定,与2010年对比,相同覆盖率汉字的数量和使用的字种略有不同。

  (2)在高频汉字中,使用频率变化较大的汉字体现了年度用字特点,记录了社会生活。如在2011年中,使用频率明显增高的汉字有:“亥、叙、微、党、债、卡、食、限、核、醋、乔”等,与2011年的“辛亥90周年、叙利亚局势、微博、小微企业、中国党建党90周年、欧债危机、卡扎菲、食品安全、限购令、福岛核泄漏、勾兑醋、乔布斯去世”等热点线)低频汉字数量大。纵观历年用字调查,覆盖率从99.99%到100%是年度独用字集中出现的范围。年度独用字都是低频字,大部分出现在人名、专名、术语、方言用字中。

  全部语料共计619 752 369 词次,2 369 349个词种。其中在报纸、广播电视、网络(新闻)3种媒体中都出现的词语有231 272个,占全部词语的9.76 %,3种媒体词语使用差异较大,这表明除了语文词和热点事件以外,不同媒体都有各自关注的线%。这些词语使用了2732个汉字,这些汉字中有2658个出现在年度用字总表的前3000位高频汉字中。3种媒体高频词语的使用具有较强的共性。

  (1)高频词语数量及高频词语用字数量较稳定。高频词语数量稳定在1万余条,高频词语用字数量稳定在2700个左右。这些高频词语主要是语文词语,也包括少数专有名词和时间表达式。

  (2)高频词语中使用频率变化较大的词语体现了年度社会生活。与2010年相比,2011年度下列词语使用频率明显增加,反映了2011年的社会图景:卡扎菲、限购、校车、房产税、辛亥、欧债危机、瘦肉精、京沪高铁、塑化剂、乔布斯。

  (3)媒体中大量词语出现频率较低,占年度全部词种数91%的词语仅覆盖全部语料的1%。这些词语主要是人名、地名、组织机构名以及时间、数字表达式等。

  2011年从国家语言资源监测语料库中提取出新词语594条。其中三字词语最多,占51.68%;其次为四字词语,占21.04%;二字词占15.66%。三字词语比例持续占优势,与近几年多用热门格式造词有关。2011年持续了2010年的“××门、××族、××哥、××体、微××”格式,其中“××体、微××”特别活跃,如“咆哮体、淘宝体、宝黛体、撑腰体、高铁体,微电影、微访谈、微小说、微生活、微招聘”等。

  594条新词语中,完全由汉字构成的有573条,占96.46%;其余21条大多是字母词,如“CDI(综合发展指数)、U站、4D报纸、hold住”等。

  2006到2010年共搜获年度新词语2977条,在2011年语料中,这些年度新词语有40%能留存下来,年使用频次在10以上,如博客、微博、动车、80后、保障房;有1/4低频使用,年频次在10以下,如晒友、高薪蓝、秒杀族、雷词、奴;还有1/3会隐退,从语言生活中消失,如撞峰、晒黑族、有碗族、楼断断、俗贿。

  在全部语料中出现了704 835个不同的名字(包括带姓的称谓,如“欧阳女士”之类),这些名字或称谓共出现

  排在前100位的单姓是:李、王、张、陈、刘、杨、周、黄、吴、赵、孙、马、胡、徐、郭、林、朱、金、郑、高、何、宋、罗、梁、谢、姚、韩、冯、许、邓、曹、丁、蔡、蒋、于、杜、叶、唐、温、沈、彭、袁、姜、余、潘、万、苏、曾、董、汪、鲁、范、田、陆、白、方、贾、肖、谭、崔、雷、吕、石、钟、任、韦、康、卢、江、牛、魏、程、孟、安、廖、夏、戴、邵、龙、钱、齐、秦、毛、汤、邱、洪、乔、俞、华、莫、梅、熊、薛、穆、易、侯、尹、顾、段、傅。

  出现的二字姓如:欧阳、司马、诸葛、上官、司徒、慕容、闾丘、皇甫、西门、尉迟、公孙、东方、令狐、申屠、端木、夏侯、东郭、呼延、拓跋、万俟、长孙、澹台、鲜于。

  国家语言资源监测与研究中心以新浪、网易和搜狐三家网站公布的名博列表中的用户发布的博客帖为调查对象,对1728个博客用户2011年全年发布的共计201 488个博客帖进行了多角度的调查和分析。

  年发帖量小于或等于50的用户占总用户数的53.29%;发帖量小于或等于300的用户占总用户数的90.68%,这些用户合计发帖102 445篇,占总发帖量的50.84%。年发帖量大于300的用户有161个,占总用户数的9.32%,共发帖99 043篇,占总发帖量的49.16%。年发帖量大于1000篇的用户主要是一些广告媒体机构、和经济评论家等,由此可以看出少数机构和个人在网络宣传中所发挥的作用。

  长度小于等于3000个字符的博客帖占总帖数的81.76%,长度小于等于5000个字符的博客帖占91.19%。最短的博客帖只有7个字符,长度在30个字符以内的有802篇,主要是只有标题和图片说明的博客帖。

  在2011年收集的1728个博客用户中,选择了350个男性博客用户和350个女性博客用户,对他们的博客帖用频率差的方法进行调查统计。结果显示,男性和女性在字词使用上都有所不同。

  男性用得更多的10个字是:国、学、中、政、民、为、文、教、年、社;女性用得更多的则是:我、女、你、一、她、不、好、爱、情、男。

  男性用得较多的10个名词是:社会、问题、国家、政府、学生、文化、、历史、学校、大学;女性用得较多的则是:女人、男人、时候、女性、爱情、朋友、孩子、美女、明星、妈妈。

  男性使用更频繁的前10个人名是:、孔子、蒋介石、鲁迅、曹操、孙中山、胡适、袁世凯、斯大林、马克思;女性使用更频繁的则是:张柏芝、杨幂、琼瑶、谢霆锋、赵薇、姚晨、周迅、林志玲、刘亦菲。

  从这些数据可以看出,男性用户的博客帖关心的话题更多与、社会等相关;而女性更关心生活、情感、娱乐类话题。

  第一次对藏文的报纸、网络媒体词语的使用情况进行了调查。语料源自2010年度4种藏文报纸的全部文本、3家网站的新闻报道,共计2 247 821词次,31 403个词种。对全部语料覆盖率达到90%的词种数是2326个。

  1.高频词语使用相对集中。覆盖率达到90%时,报纸媒体的词语计2166个,网络媒体计2261个,其中2104个词语相同,共用率达到各自高频词语的95%左右;将两媒体覆盖率达到90%时的2326个高频词与藏语文教材(小学、初中、高中)语料中覆盖率达到90%时的2220个词语对比,相同的词语共计2065个,共用率也达到各自高频词语的90%左右。可见藏语高频词语的使用相对集中。

  2.将调查语料中出现的全部31 403个词种与已有的8部藏汉词典、新词术语词典以及藏文术语表中的词语对比,占32.43%。这表明2010年度作为大众媒体传播的报纸、网络(新闻)使用的词汇仅占这些词典总词汇量的三分之一。媒体高频词中的新词语多属于政策、法规和经济类词语。

  国家语言资源监测与研究中心今年开展了包括国家通用语言、少数民族语言和海外华语在内的基础教育教材的调查。(一)基础教育数理化教材

  根据教材的流行程度、使用范围以及教学界评价,在数学、物理、化学三科中各选取了两套教材作为调查对象。

  调查数据显示,数学教材用字2391个,物理教材用字2425个,化学教材用字2053个,三科总用字3014个,其用字1610个,占53.04%;每科都有一些独用字,其中大部分是学科用字。

  基础教育语文教材共用字5070个,数学、物理、化学三科使用的3014字中与语文教材共用的有2927个,占其总数的97%;独用字有87个,如“氯、钾、铝、镁、氖、氟、钨、幂、锂”,其中多数是指化学元素或化合物的汉字。

  将数学、物理、化学的3014个字与《现代汉语常用字表》的3500字比较,不见于《现代汉语常用字表》的267个,如“铀、瀚、簧、涸、绚、钨、黏、铂、熨、兹、骼、彗、豚”等。

  数学教材用词10 647个,物理教材用词8927个,化学教材用词5913个,三科总用词17 537个,其用词2406个,占13.72%,独用词比例高达68.39%,可见不同学科用词差别较大。数学中的独用词如正方形、函数、不等式、分母、乘法;物理中的独用词如磁场、动能、浮力、电功率、摩擦力;化学中的独用词如化学式、盐酸、溶质、氯化钠、镁。

  基础教育语文教材一共用词50 670个,数学、物理、化学三科使用的17 537个词中与语文教材共用的有10 413个,占其总数的59.38%;独用词有7124个,占40.62%,其中绝大部分是学科词语,只出现一次的高达3269个,表明学科用词数量多,复现率低。

  由此可见,数学、物理、化学三科教材所使用的字词虽然在总量上不大,但在很大程度上与语文课形成互补,和语文课一起承担着培养学生语言能力的任务。这些课程不仅具有传授自然科学知识的功能,在学生语言能力培养上的作用也不容低估,这应引起教材编写者和教学工作者的重视。

  调查选取的是新疆教育出版社出版的普通高中教育维吾尔语文新课程标准实验教科书,包括必修课教材和选修教材。

  必修课教材共用139 880词次,32 125词种,15 895词干种;选修教材有333 306词次,57 518词种,23 031词干种。二者比较可以看出,必修课教材从语料规模到词种、词干种数量都小于选修教材,必修课教材词汇使用集中,注重基础知识;选修教材词汇使用量大,词种丰富,用以拓展词汇和知识领域。

  将高中教材与小学、初中教材用词状况统一考查,维吾尔语语文教学从小学到高涉及33 248个词干,其中小学、初中阶段学习词干24 568个,高中阶段学习词干26 124个。两个阶段的共用词干17 444个,分别占各自总词干的71.00%、66.77%。可以看出,高中教育是对小学、初中基础教育所学知识的巩固、延伸和扩展,高中也是学生词汇量快速增长的阶段。

  将维吾尔语语文教学从小学到高涉及的33 248个词干与在《中国语言生活报告2009》发布的“现代维吾尔文网站用词调查”中的31 452个词干比较,共用词干23 493个,占整个网络词干种的74.70%,占小学、初中、高中语文教材词干种的70.66%。这个数据说明,经过中小学阶段的维吾尔语文学习,学生基本能够阅读网络媒体资料。

  国家语言资源监测与研究中心今年首次开展了哈萨克语教材的调查。调查选取了新疆教育出版社出版的两套哈萨克小学语文教材,分别为普通班版和双语班版。

  调查数据显示,普通班版使用了108 515词次,26 679个词种,6975个词干种,273个词尾种;双语班版使用了54 396词次,16 607个词种,6065个词干种,239个词尾种。从教材词语使用规模上看,普通班版几乎是双语班版的2倍,词种数也多出2/5,显示出两套教材不同的性质和特点。

  两套教材各册在词种、词干的使用数量上分布基本一致,使用词种、词干数量最多的都在第8册,显示出一定规律性。

  马来西亚的华文教学属于第一语言教学,《华文》是供马来西亚华文小学统一使用的教材,共6册,230篇课文。这次调查的对象是教材中的课文用词,并与人民教育出版社出版的新课标小学《语文》、马来西亚主要华文媒体语料库进行了对比研究。

  《华文》共使用30 089词次,6924个词种;《语文》共使用132 401词次,13 950个词种。二者共用词种4535个,占《华文》词种数的65.50%,占《语文》词种数的32.51%。数据表明,无论教材篇幅还是词汇量,《语文》都远远大于《华文》。

  马来西亚主要华文媒体语料库的词种数共180 428,词次共38 013 207,将其词语按频率降序排列,取前6924个词语(此时的覆盖率为88.32%)和《华文》全部词语进行对比,二者共用词种数2807,占40.54%,独用词种数4117,占59.46%。《华文》独用词语大多是日常生活中的知识性词语,如青蛙、大地、风筝、大海、星星等,适合儿童认知,体现了小学语文教材的特点。马来西亚主要华文媒体语料库独用词语多为人名、地名、时政性词语、马来西亚特色词语,如拿督、新闻、议员、国会、大选等。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186