Está en la página 1de 42

测试与评估

第一章 语言测验的基本原理
 语言测验的含义
 语言测验的作用与目的
 语言测验的种类
为什么要研究测试与评估?
 培训与评价是推动教育的两个车轮,缺一不可。
 最好的培训,是基于评价之上的培训,是“因材施教”的培训。
 最好的评价,是培训中的评价,是在教室里或工作场所中的评价。
 测验:对样本行为的测量。
 测验是不可能在培训中或实际工作中进行评价时的一种可行的、经济的替代方式。
考试源于中国:
 6 世 纪,隋文帝建立科举考试制度。
 隋朝以后,历代沿用,不断完善。
 17 世纪,考试方法才通过传教士逐渐介绍到西方。
 公正性:单间、弥封、誊录、搜身、惩治舞弊。
 公开性:妇孺皆知。
 竞争性:百里挑一,皓首穷经
 八股之害,甚于焚书,而败坏人材,有甚于咸阳之郊之所坑者。——顾炎武
 中国之割地败兵,非他为之,而八股致之也。 ——康有为
 救弊之法归之于废科举、兴学校。——梁启超
 救亡之道当如何?曰:痛除八股而大讲西学。——严复
 在进步人士的坚决反对下,从隋朝开始实行了 1300 年的科举考试于 1906 年取消。
 科举考试的覆车之鉴,值得所有教育工作者认真思考。
公平、公开、竞争的科举考试为什么遭到近代思想家的尖锐批评?
原因是:
虽然具有公平、公开、竞争的形式,却不具有科学化的内容。既没有将考试内容的确定建立在科学
研究之上,也没有通过不断的科学研究来改进和完善考试内容。
怎样在利用考试的同时减少考试带来的负面效应?
 考试科学化!
 “学生为考试而学,教师为考试而教。”
 “学一本书,教一本书,背一本书,考一本书。”
 这是中国教育的痼疾。
 考试对教育具有重要的导向作用,考试的科学化程度和考试质量,关系到教育的发展。
 高质量的考试,引导考生去提高自己的核心能力(内功)和技能水平(剑术);质量不高的考
试,逼迫学生去背复习资料,许多背的东西考后就遗忘了。
 高质量的考试,向实践中的人才倾斜;质量不高的考试,向只会背书的“书呆子”倾斜。
 高质量的考试,可以有助于将“人口负担”转化为“人力资源”,质量不高的考试,可以将
“人力资源”转化成“人口负担”。

1
一、语言测验的含义:
 语言测验:对样本语言能力的测量。
二、语言测验的作用和目的: 科学地测量出学习者的语言能力。
1、选拔
2、诊断
3、评估
4、研究
三、语言测验的种类:
1、按用途:
(1)水平测验
(2)成绩测验
(3)能力倾向测验
(4)分班测验
(5)诊断测验
2、按测验方式或评分方式:
(1)主观测验和客观测验
(2)分立式测验和综合式测验
(3)笔试和口试
(4)纸笔测验和计算机辅助测验
3、按参照性质:
(1)常模参照性测验:高考

普通高等学校招生全国统一考试,简称“高考”,是中华人民共和国(不包括香港特别行政区、澳
门特别行政区和台湾省)合格的高中毕业生或具有同等学历的考生参加的选拔性考试。

普通高等学校根据考生成绩,按已确定的招生计划,德、智、体全面衡量,择优录取。高考由教育
部统一组织调度,教育部考试中心或实行自主命题的省级教育考试院命制试题。考试日期为每年 6 月 7
日、8 日,各省市考试科目名称与全国统考科目名称相同的必须与全国统考时间安排一致。2015 年 1 月
1 日年起,高考逐步取消体育特长生、奥赛等 6 项加分项目。

2019 年 9 月 3 日,中国最高人民法院、最高人民检察院联合对外发布《关于办理组织考试作弊等刑
事案件适用法律若干问题的解释》。
(2)标准参照性测验:HSK
测验的标准化: 是具有规范的标准,各个环节按照系统的科学程序组织对误差做了严格控制的测验,
是一个系统化、科学化、规范化的施测过程。
 标准化测验的特点:
1、固定、标准的内容
2、施测和评分按标准程序进行
3、题目都经过预测:“标准化”是测验的类型,并非测验的质量

2
第二章 语言测验的规划、设计、实施
开发语言测验的三大环节:
 规划设计
 操作实施
 后效研究
一、规划设计
1、确定目标团体
(1)被试的背景个性特征、知识结构、语言水平、熟悉测验的程度
(2)被试的需求求学、求职
2、确定测验目的
(1)语言教育
(2)选拔人才
(3)改进教学
3、确定测验内容
(1)教学内容
(2)非教学内容
4、确定测验方式与卷面构成
(1)题型
(2)题量
5、确定评分方式与分数体系
(1)评分方式:客观、主观
(2)分数体系:原始分、导出分数
二、操作实施
1、编写测验说明
测验名称:汉语书面表达测验
测验对象:学过一年汉语的菲律宾中学生
测验内容:详见题目细则
测验目的:考查被试的汉语写作能力
测验的用途:为检查教学效果提供信息
测验方式:纸笔测验
测验长度:时间为 90 分钟,题数:客观题 20 个,600 字作文一篇
评分:客观题机器阅卷,主观题人工阅卷
分数报告:报告单项原始分

3
2、编写题目细则
(1)概述
(2)样题
(3)刺激的属性
(4)反应的属性
3、培训命题员
4、聘请专家审题
5、预测
6、拼卷
7、施测
三、后效研究
 信度
 效度
 后效作用研究
第三章 客观性试题的编写
一、客观性试题的类型
1、选择题
她不在家,我扑了个空儿。
A 有时间 B 空隙 C 没找着 D 绊倒
2、配伍题
一无 接物
待人 肌瘦
面黄 露宿
风餐 其实
言过 所有
3、填空题
我把书放在书桌上了。
4、听写
5、排序
A. 地震后新岛屿的产生
B. 从而引发了一场争论
C. 引起了周边国家的注意
D. 各国都宣布岛是自己的
6、是非题
我把手表放。

4
7、完形填空:
有选项、没选项(半客观题/半主观题)
1、选择题的编写
(1)组成:
题干、选项(正确答案、三个迷惑选项)
(2)需遵循的基本原则:
① 每题只有一个正确答案,不能有两个以上正确答案,也不能没有答案。
 目前还没有出现此类现象。
A. 现在 B. 看来 C. 最近 D. 眼睛前
 昨晚我挨了妈妈一( )训。
A. 次 B. 场 C.番 D. 趟
② 一题只测一个语言要素
他们都认为这是一个好主意。
A. 意思 B. 办法 C. 态度 D. 建设
这是一道词汇题,但选项超出了考查范围。A、 B、 C 是名词,D 是动词。A、C、D 不正确,不仅
仅是因为意思和“主意”不同,还有和“好”不搭配的问题,这涉及到语法问题。可以修改为“A 东西
B 办法 C 消息 D 现象”。
③ 除了考查特殊语法点的题目外,题目的选项放到题干时要符合语法。
 我( )妈妈的花瓶摔碎了。
A. 把 B. 被 C. 叫 D. 让
 快走吧,回去晚了妈妈又该说我们了。
A. 解释 B. 劝告 C. 责备 D. 表扬
“解释”放入题干不合语法,可以改为“提醒、鼓励、奖励、告诉”。
④ 题干不能太难,要适合被试水平。
语法题中,题干不能出现更难的语法点。
词汇题中,题干不能出现更难的语义问题。
学生靠题干信息判断答案,看不懂题干无法进行选择和回答。
⑤ 题目按难度排序:易——难
稳定被试情绪,激发思维能力
⑥ 语料要避免敏感性话题
性、政治、宗教
⑦ 语料要避免常识话题
乘飞机时发现丢失行李后应该:
A. 找人帮助寻找 B. 要航空公司赔偿 C. 填写申报表 D. 上飞机找
(3)题干
 作用:提出问题,使被试可以从题干中获取答题信息。

5
 原则:简明扼要(繁琐无关信息分散注意)
难易适宜(看不懂题干无法进行回答)
 形式:
他是班里最小的,学习( )是班里最好的。
他爱人带孩子回老家了。
这段话告诉我们什么?
 注意:
 选项中有重复的词,应尽量放到题干里。
这段话告诉我们: → 这段话告诉我们,肥胖威胁了什么人的健康?
A. 肥胖威胁儿童的健康 A. 儿童
B. 肥胖威胁妇女的健康 B. 妇女
C. 肥胖威胁青年的健康 C. 青年
D. 肥胖威胁老年的健康 D. 老年
 尽量避免否定式题干,如不可避免,需特别标注。
关于中国的东京城,下列说法不正确的是:
A. 就是日本的东京市
B. 战争后变成了废墟
C. 地震后消失不见了
D. 是一个落后的城市
(4)选项编写原则:
 正确答案是唯一的
 每个干扰项都要有干扰作用
(干扰水平不高的被试,若无人选,则无效,题目猜测率变大)
 干扰项的难度不能比正确选项难
(干扰了水平不高的被试,题目区分度降低)
 选项简明扼要
 长短尽量相同(整齐美观、降低猜测率)
(做法:先编写出正确答案,以它的数字编写干扰项。)
 若长短不同,按先短后长排序
 答案分布均匀
2、完形填空的编写
 典型的完形填空:在文本中每隔若干个词删掉一个词,请被试填空或者选择。
 汉语水平考试采取不等距的填空。
 文本的第一句和最后一句保持完整,不出题。(降低难度,给被试完整的信息)
 有选项容易,没选项难。

6
3、配伍题的编写
 同一栏内的项目必须是同类的
 答案应该是唯一的
 栏内字数不宜过多,一行为限
4、半客观性试题
 半客观性试题:题目的答案是唯一的,但答案不能由机器来判断,需要阅卷人判断
 感谢《读者》杂志社的全体工作人员,为中国广 1 的文化市场 2 造出一份好的精神食粮,相 3 你
们会做得更好。
二、适用于不同技能的客观选择题
1、听力理解试题
2、阅读理解试题
3、语法试题
4、词汇试题
1、听力理解试题
(1)语料的选择:
口语材料,避免句子长、句式复杂的、敏感性材料
(2)编题的原则:
 问题要用完整、简洁的句子。
女:金光辉被那家公司录取了吗?
男:别提了。论专业知识、身体条件、工作能力,都没说的,就是没有汉语水平考试 6 级证书。
问:金光辉在哪一点上不符合公司的条件?
提问难度大,改为“金光辉为什么没有被录用”。
 选项要简洁完整(低水平,母语、图画)
 尽量避免过多记忆(数字、地点、名字)
 尽量避免计算题(考查听力而非考查算术)
 如果是长段叙述或对话的语料, 后面往往有几道题。提问的顺序要和叙述、对话的发展顺序一致。
2、阅读理解试题
编写原则:
 语料范围越广越好(避免敏感话题),但要适合被试水平
 尽量不修改原文,但原文有误必须修改
 200 - 400 字为宜
 吃透语料,再着手命题
 问题按照文章发展脉络依次提出
 可以就作者的言外之意提问,也可以就某个比较难的词提问
 题目之间不能有暗示(一对全对,一错全错)

7
3、语法试题
(1)语法:语言教师、语言学家的语法;语言学习者的语法。汉语水平考试考查语言学习者的语法。
(2)编写原则:
 考虑汉语语法的特点:语序、虚词、量词
 考虑学习者的特点:正确答案是汉语的正确表达,干扰项应该是学习者在母语干扰下可能出现
的错误,学习过程中出现的错误,不要人为编造。
(3)形式:
 昨天我买了一( )雨伞。
A. 把 B. 根 C. 支 D. 个
 她打算 A 吃 B 饭 C 就去 D 超市。 了
A 我们都是广西大学的留学生。
B 都我们是广西大学的留学生。
C 我们是广西大学的留学生都。
D 广西大学的留学生都我们是。
 他想 又 吃 一个包子。
A B C D
4、词汇试题
 我昨天去买了张写字台。
A. 桌子 B. 椅子 C. 箱子 D. 柜子
编写原则:
 选项和划线词属同一词类。
 选项的搭配习惯应与划线词的搭配习惯一致。
 选项难度相当。
 考查词汇量,不要把文化知识、搭配习惯放到词汇题里。
第四章 主观性试题的编写
一、口试
1、口试的方式
 面试:主考和被试面对面交谈,主考问,被试答。主考根据被试答题情况打分。
 优点:直接交流得到直接印象。小规模
 缺点:大规模施测费时费力。
 录音:把题目印制成试卷,被试集中在有录音设备的考场,根据试卷指令,把该回答的问题录
在磁带上。评分员根据录音评分。
 优点:提高效率,大批被试同时施测。
 缺点:内向被试缺乏激励无话可说。根据录音评分需要大量评分员。
2、口试的题型
 朗读

8
 复述
 问答
 看图说话
 讲述
 角色扮演
 讨论
 口试的题型: 朗读
 对初学者,可以使用单词、单句。
 对中高水平学习者,使用成段的文章。
 水平测验,选择一般性语料,避免特别专业的内容。
 成绩测验,选择特定的词汇和句子或文章段落。
 语料应容易上口,尽量避免冷僻的字词。
 段落长度在 200—300 字为宜,朗读时间控制在 1—2 分钟
 口试的题型: 复述
 准备一段语料,让被试听或读后马上进行复述。
 语料不应太长,也不要太难。
 选择有情节线索的故事。
 口试的题型: 问答
 选择被试熟悉的话题,避免专业、敏感话题
 以一个话题为中心展开
 话题难度、广度逐步展开
 不适于录音方式,采取面试方式为好
谈汉语学习
1、你学了几年汉语了?
2、你觉得汉语难吗?
3、汉语的发音、汉字、语法,哪个最难?
4、你为什么要学习汉语?
5、你喜欢汉语吗?
6、你喜欢汉语还是喜欢其它课程?
7、你认为哪门课程对学习汉语最有帮助?
8、你读过汉语报纸或者小说吗?
9、你听说过哪本汉语小说?
10、读汉语小说影响学习吗?如果影响,你会怎么办?
 口试的题型: 看图说话
 让被试叙述图画的内容
 单幅图画:描绘场景
 连环图画:叙述事件的发展过程,4 幅
 口试的题型: 讲述
 讲述:介绍家庭、家乡、学校的情况和印象,讲一件经历过的事情
 讲解:说明某东西的使用方法、办事程序
 口试的题型: 角色扮演
 提供交际场景,根据场景的要求,被试用符合身份的表达方式进行场景模拟。
 多准备几个场景,让被试就熟悉的进行回答。
 你去市场上买水果,你认为价格高了,如何跟小贩讨价还价?

9
 你买了一件衣服,回家后发现衣服小了,你想退掉衣服,你怎么跟售货员商量?
 在路上,有人向你问路,你怎么给他指路?
 口试的题型: 讨论
 对水平高的被试,可以采用讨论题。
 给被试提供准备时间。
 发言 2—3 分钟为宜。
 男女平等问题
 吸烟有害健康
 大城市发展公共交通,还是应该鼓励私人汽车
二、写作
 单句写作
 成段写作
 成篇写作
1、单句写作
(1)适合于初级水平的被试。
(2)形式:
 组句:把顺序混乱的词组合成一个合乎语法的句子。选取句子后,按词(不是按字)打乱顺序。
都 参加 去 大家 他 的 生日 晚会
 改写句子:用指定的句式改写句子。考查特定句式的掌握程度。
一阵风吹来,墙上的画掉了下来。(用“把”字句)
我喜欢看电视的时候吃饭。(一边……一边……)
 完成句子:给出一句话的前半句或后半句,让被试补出后半句或前半句。
只要你努力学习,( )。 (就不愁……)
( ),原来他已经学过了。 (难怪)
2、成段写作
 常采用排句序的形式。
 选择意思相对完整的段落,包含 4 个句子,随机打乱顺序,编出正确的选项和干扰选项。
 注意:原句的顺序是必须不可改变的。
① 为了保证全家人的生活
② 决定把房子租出去一间
③ 我和全家人商量了以后
④ 单位里这两年效益不好
A. ④①③② B. ②③①④ C. ①③②④ D. ④②①③
3、成篇写作
 成篇写作的体裁:记叙文、应用文、议论文。
 记叙文:经历过的事情
 应用文:书信、申请书、说明文
 议论文:谈对一件事情的看法

10
 给被试设置情境,情境是被试熟悉的
 规定作文的格式、字数、内容
 假设你正在上高中,马上要放寒假了,你想在寒假期间补习汉语。你从报纸上得知广西大学在
寒假期间要开办短期汉语进修班。现在你要给负责报名的李老师写信,向她了解相关的情况。
 你的信要包括下列内容:
1、你是怎么知道汉语进修班的情况的;
2、你为什么要参加进修;
3、有关你的一些必要信息:年龄、性别、国籍、汉语学习的经历、水平
4、向李老师进一步了解进修班的情况
 要求:用书信格式书写;300 字左右。
第五章 预测、题目分析、正式施测
一、预测
 命题完成→专家审题
 专家审题的范围:题目内容是否在规定的范围之内,出题角度是否合理,题干是否准确,答案
是否唯一,是否包含敏感性话题(外在)
 题目的内在属性必须通过试验才能显现出来。
 命题完成→专家审题→预测
 定义:在真实的测验环境中,让被试把题目做一遍。我们根据被试的答题情况做分析,分析出
题目的内在属性,决定题目的去留。
 要求:
(1)预测样本太小,分析数据不可靠。预测样本越大越好。不少于 100 人。
(2)预测样本与目标样本同质。
(3)卷面设计、答题要求、答题时限与正式施测相同。(在相同条件下才能做出同样的反应,预
测结果才可靠)
 方式:
(1)集中预测:把所有需要预测的题目编成一份试卷,选好一个被试样本,在选定的时间内让被
试样本集中预测。
(2)分散预测:把需要预测的题目放到正式的试卷里,在正式测验的同时进行预测。预测题的得
分不能计入被试总分,因为预测题没有质量保证。
二、题目分析
• 预测→题目分析
• 题目分析的目的:难易度、区分度、选项的分布
• 难易度:难度,答对率。
某题的难度 P=答对人数/总人数
题目 A 的难度是 0.5,题目 B 的难度是 0.2,B 比 A 难
全卷的难度=所有题目难度的总和/题数
难度为 0.5 的题目最佳,全卷难度为 0.5 左右为最佳

11
• 区分度:题目对被试的区分能力。
• 水平不同的被试对题目的反应是否有差异,表现为区分度。区分度高的题目,被试水平越高,
答对该题的可能性就越大。
• 区分度的计算:专门的计算软件
• 区分度的取值范围在-1 到+1 之间,越接近+1 区分度越高,越接近-1 区分度越低。
• 选项的分布:将学习者容易犯的错误编写成干扰选项,如果每个干扰选项都能迷惑住水平低的
被试,水平高的被试不被干扰,则该题区分度高。
• 坏题的两种表现:
1、被试对选项的选择分布不均,有的选项无人选择
2、选对和选错的被试在水平上没有差别,甚至高水平的被试多数选错,低水平的被试多数选对。
三、选题、组卷、施测
 预测→题目分析→选题、组卷→施测
 选题的标准:
1、内容:根据题目细则、教学大纲来检验题目内容是否在规定范围之内。是否包含敏感性问题。
2、难度:题目难度呈正态分布
3、区分度:水平测验尽量选取区分度高的题目,成绩测验可采用“教学敏感性”选取题目。
* 教学敏感性
• 成绩测验中,要求有较高的通过率。当通过率高到 70%~90%时,题目的区分度将大幅下降。
• 水平测验中计算区分度的方法不适合于成绩测验。
• 教学敏感性:教学前被试答对题目的可能性小,教学后被试答对题目的可能性变大。
教学后题目的答对率—教学前题目的答对率
• 教学敏感性的取值也在-1 到+1 之间,越接近+1,题目的教学敏感性越高。
• 组卷:将选好的题目按一定顺序排列,加上指导语。
组卷的原则:
1、容易的题放前面,难题放后面。
2、调整正确答案的分布。
• 专家审查→印刷试卷和答卷→制作标准答案→布置考务工作→正式施测
第六章 测验的信度
一、信度的基本概念
 信度:测验分数的可靠信,测验分数的稳定性和一致性程度。
 用一个测验(平行测验)对同一组被试反复施测,得到的分数一致,信度高。(理想状态)
 被试和测验都含有不稳定因素
 误差:测试中的不稳定因素。
 误差来源:
1、被试:情绪波动、疲劳程度、记忆效应
2、测验:质量不高的题目,答案不明确,平行测验难度不等

12
3、测验环境
4、评分方法:误判、主观影响
• 真分数:反映被试真实水平的分数。
被试的分数=真实能力分数+误差分数
• 信度研究就是研究真分数的大小,确定测验分数的稳定程度。
• 三个基本假设:
1、观测分数中包含了真分数和误差分数
2、误差分数是随机的,和真分数之间没有相关
3、误差作用有正有反,误差分数平均分为零。
二、信度的种类
1、再测信度:同一组被试在相隔不长的时间里把同一个测验做两次,计算两个分数之间的相关。(排
除学习、记忆效应)
2、复本信度:
复本即平行试卷(除了题目的具体内容不同外,试卷的各项指标都是一致的)。
同一组被试在相隔不长的时间里,把两个平行试卷都做一遍,计算两个分数之间的相关。
3、分半信度:是复本信度的变式。把一个测验按单双号分半,计算两半之间的相关,再根据公式修正。
三、HSK 信度
 标准化测验的信度系数要求在 0.9 以上,自编测验的信度系数可以低一些。
 一个测验由几个分测验组成,每个分测验分别计分,用α系数。
 HSK 信度主要报告α系数。
四、影响信度的因素
1、被试的同质性:被试能力越接近,信度越低。
2、测验的时间限制:被试的答题速度对分数有明显影响。
3、题数:题目越多,信度越高。
4、难度:全卷难度保持 0.5 左右,信度高
所有人得满分或零分→同质→信度低
5、区分度:每题区分度都高,信度高
第七章 分数与等值
一、分数
 原始分→计算标准差→转换
 原始分数:每个题目的得分相加。意义不明确。
 标准差 SD
标准差是离平均分的平均差距。
 原始分转换成标准分数: x− 𝑥 ∑(𝑥 − 𝑥)2
𝑧= = √
SD 𝑁

13
 标准分数有小数、负数,转换成导出分数。
 常用的导出分数:
1、T=10(z)+50
2、ETS=100(z)+500
3、HSK=60(z)+200
二、等值
 平行试卷根据一个测验细则编写,在内容上涵盖的范围是相同的,所测的能力是相同的,统计
特征也大体上是相似的。但在难度上仍存在一定的差异,需要用等值的办法消除。
 测验的等值是一个统计过程,我们通过这个程序来调节测验分数,使得平行试卷的相同分数都
具有相同的价值。
 如果一个被试去年考了一次 HSK,今年又考了一次。两次试卷不同,第二次得分高于第一次。
→被试汉语水平提高?第二次考试比第一次容易?
 如果两个被试同时参加 HSK,使用不同的试卷,A 比 B 得分高。→A 比 B 水平高?A 卷比 B 卷
容易?
 如果试卷不经过等值处理,难以回答。如果试卷经过等值处理,在不同试卷上得出的同一个分
数,具有相同的价值。
 水平等值:在平行试卷之间进行等值,使平行试卷的分数之间具有可比性。
 垂直等值:使不同的试卷(不同年级的试卷、HSK 三个等级)之间具有可比性和换算关系。
(如二年级的 100 分,相当于三年级的 40 分)
 等值的过程是一个复杂的统计过程,只需大致了解等值的含义,了解等值的作用。在教师自编
的试卷中,此过程一般不需进行。
第八章 测验的效度
一、效度的基本概念
 效度:测验的有效性。测验在何种程度上测出了它要测的东西。
 研究测验的效度,就是要研究“我们编写的测验测到了我们要测的东西了吗?如果测到了,程
度如何?”
二、内容效度
 内容效度的检验,就是确定测验的题目对一个内容范围是否具有很好的代表性。
 检验内容效度的步骤:
1、定义内容范围
2、聘请语言测验和语言教学的资深专家
3、制订测验题目和内容范围的匹配原则
4、根据匹配原则进行检验(让专家标出测验题目和哪个项目匹配,或判断一个题目与内容范围
匹配与否)
三、效标关联效度
 我们制造了一把尺子,为了证明自制的尺子是否有效,可以找一把已经得到公认的尺子(其可
靠性有效性已得到证明)作为标准。如果自制的尺子与标准尺效果一样,那么自制的尺子是有
效的。

14
 公认的尺子——效标,用自制的尺子与公认的尺子比较,建立了一种关系——关联。
 证明测验的效标关联效度,就是用效标的有效性去证明测验的有效性。
 检验效标关联效度的步骤:
1、确定一个适用的效标
2、确定一组适当的被试
3、施测并记录被试的分数
4、用作为效标的测验对同一组被试进行施测,或收集被试的标准行为数据(如大学的成绩)
5、计算测验分数和效标之间的关联程度
* 共时效度
 假设我们编写了一个测验,我们可以让同一组被试做自编的测验和 HSK,然后看这组被试在两
个测验上得分的关系。
 效标——HSK,如果自编的测验与 HSK 有较高的相关,说明这两个测验所测的东西在很大程度
上是相同的。HSK 已被证明有效,自编的测验也是有效的。
* 预测效度
 有时我们希望通过测验分数预测被试将来的情况(高考,用来推断被试的大学学习情况),要
证明的就是测验的预测效度。
 我们用被试的大学学习情况作为标准,来研究高考分数和大学学习的关系,看看高考成绩是否
有效地预测大学的成绩。——效标关联效度的研究
第九章 决策和后效研究
一、决策研究
 决策:制订分数线
 测量和决策的区别:
测量是对人能力的描写,不涉及价值判断;
决策涉及价值判断。
 决策的制订分为教学外和教学内两种。
* 教学外决策
 教学外决策:典型例子——根据高考分数决定录取人数。
 决策正确率=正确接受+正确拒绝/正确接受+错误接受+正确拒绝+错误拒绝
 录取正确率=正确接受/正确接受+错误接受
 对大多数语言教师来说,教学外决策极少,经常处理的是教学内决策。
 学生学了一个学期,达到什么标准算合格?60 分及格如何制订出来的?
 60 分及格不科学,我们应该针对一门具体的课程和测验,制订出符合实际的标准:边缘组法、
对照组法。
教学内决策:边缘组法
 边缘组:测验表现处于合格与不合格边缘的被试。(表现不突出但又不是最差劲)
 操作步骤:
1、聘请熟悉被试学习情况的教师、专家。

15
2、请专家就最低可接受水平进行讨论,达到对这组被试水平的全面把握。
3、根据讨论,挑选出处在边缘状态的被试。
4、对边缘组施测,计算被试成绩的中数,把该中数定为测验的合格标准。
 人数要求:不少于 100 人。
教学内决策:对照组法
 操作步骤:
1、让边缘组外的两组(掌握组、未掌握组),做同一个测验。
2、分别计算两组得分,将得分的分布情况画在同一个坐标上,得到两条分数曲线。
3、将两条曲线交叉点定为标准。
 使用对照组法,我们可以制订出三种宽严不同的标准:
1、将交叉点定为标准;
2、如果标准的制定者要减少错误接受的可能性,可以制订严格一些的标准,以未掌握组的最高
分定为标准。
3、如果标准的制订者要减少错误拒绝的可能性,可以制订宽松一些的标准,以掌握组的最低分
定为标准。
 制订标准应该注意:
1、标准不是一成不变的,可以修改。
2、修改标准是从低到高易,从高到低难。
3、标准是人为的价值判断,带有主观性。
4、标准以测验为基础,不能脱离测验。
5、制订标准不可仓促。
6、开发测验、使用测验、制订标准是不同的活动。
二、后效研究
 后效:是决策产生的效应。
 所谓的测验的后效,实际是决策的后效。
 真正产生良好或不良社会效应的,不是测验,而是决策本身。
 后效是决策产生的效应,那么研究后效就是研究决策,而不是研究测验。
 测验研究:如何制造出科学精确的测量工具。
 决策研究:如何提高决策质量,发挥决策的积极作用,避免消极作用。
汉语考试介绍
 汉语水平考试 HSK
 商务汉语考试 BCT
 少儿汉语考试 YCT
一、汉语水平考试 HSK
 中国汉语水平考试(HSK)是为测试母语非汉语者(包括外国人、华侨和中国少数民族考生)
的汉语水平而设立的国家级标准化考试。

16
 包括 HSK(基础),HSK(初、中等)、HSK(高等)。中国汉语水平考试(HSK)每年定期
在中国国内和海外举办,凡考试成绩达到规定标准者,可获得相应等级的《汉语水平证书》。
 《汉语水平证书》的效力是:
(1)作为达到进中国高等院校入系学习专业或报考研究生所要求的实际汉语水平的证明。
(2)作为汉语水平达到某种等级或免修相应级别汉语课程的证明。
(3)作为聘用机构录用汉语人员的依据。
 HSK 的主要依据
(1)中国对外汉语教学学会编制、国家对外汉语教学领导小组办公室审定的《汉语水平等级标
准和等级大纲》。
(2)国家对外汉语教学领导小组办公室汉语水平考试部编制的《汉语水平词汇与汉字等级大
纲》。
(3)国家对外汉语教学领导小组办公室汉语水平考试部编制的《汉语水平考试(HSK)大纲》。
 HSK(基础)适用于具有基础汉语水平的汉语学习者,也就是接受过 100-800 学时现代汉语正规
教育的学习者(包括具有同等学历者)。
 HSK(初、中等)适用于具有初等和中等汉语水平的汉语学习者,也就是接受过 400-2000 学时
现代汉语正规教育的学习者(包括具有同等学历者)。
 HSK(高等)适用于具有高等汉语水平的汉语学习者,也就是接受过 3000 学时和 3000 学时以上
的现代汉语正规教育的学习者(包括具有同等学历者)。
* 汉语水平考试 HSK(基础)
基础汉语水平考试是为母语非汉语的汉语初学者而设计的一种标准化考试。HSK(基础)的考
试对象是接受过 100-800 个学时现代汉语正规教育(或相当于这一水平)的汉语学习者。
一、考试依据
(1)《汉语水平词汇与汉字等级大纲》(1992)国家对外汉语教学领导小组办公室汉语水平考
试部编制。HSK(基础)词汇和汉字的考试依据是甲级词汇 1033 个,乙级词汇 2018 个。共计
3051 个。汉字的依据是甲级汉字 800 个,乙级汉字 804 个,共计 1604 个。
(2)《汉语水平等级标准与语法大纲》(1995)国家对外汉语教学领导小组办公室汉语水平考
试部编制。HSK(基础)语法的考试依据是甲级语法项目 129 项,乙级语法项目 123 项,共计
252 项。
二、试卷结构
HSK(基础)试卷共分三大部分:听力理解、语法结构、阅读理解。试卷构成如下表所示。
 HSK 基础考试分为 3 个部分,结构如下:

考试项目 试题数量 考试时间

听力理解 1-50 约 35 分钟

语法结构 51-90 40 分钟

阅读理解 91-140 60 分钟

17
第一项:听力理解(50 题,约 35 分钟)
 第一部分(15 题):这部分试题,每一道题考生都会听到一个陈述性或描述性的句子,在试卷
上会看到四幅图画,考生应选出跟听到的句子内容一致的那一幅,在答卷上找到那一题,在相
应的字母上画一横道。这部分试题每句话听两遍。
 例如:第 2 题,你听到:
2.他正在写信
你在试卷上看到四张画:(略)
 第二部分(15 题):这部分试题,每题都是一个人问一句话,试卷上有四种回答。考生应根
据问话从四个供选择的回答中选出唯一正确的回答。在答卷上找到那一题,在相应的字母上画
一横道。这部分试题每句话听两遍。
例如:第 18 题,你听到:
18.你从来没有听过这个故事吗?
18.你从来没有听过这个故事吗?
你在试卷上看到四个回答:
A.不讲这个故事 B. 不听这个故事 C.从来没有听过 D. 故事很好听
 第三部分(20 题):这部分试题,是两个人的对话或一段话,根据对话或那段话提出一个或几
个问题,在试卷上每道题都有四个可供选择的答案。考生每听完一个问题,应迅速从四个备选
答案中选出最恰当的答案,并在答卷上相应的字母上画一横道。这部分试题只听一遍。
例如:第 35 题,你听到:
35.女:小王现在在哪儿?
男:我找过他,哪儿都没找到。
问:根据对话可以知道什么?
你在试卷上看到四个答案:
A. 男的刚见过小王 B.男的没找着小王 C.小王哪儿都没去 D.男的没去找小王
 HSK(基础)听力录音材料语速较正常语速稍慢。每题后有 16-20 秒的答题时间。
 听力理解这项试题,主要是测量考生能否听懂用普通话所进行的对话、问话或对事物的描述;
能否进行初步的社会交际,如一般的会见、谈话、介绍、祝贺、告别等。具体要求是:
(1)基本听懂日常生活中的简单谈话(语速大体为每分钟 120 一 170 字);
(2)能听懂一般的问话,了解问话的目的;
(3)能听懂对某一事情叙述的主要内容;掌握最基本的信息;
(4)能基本理解说话人的不同语气和感情态度。
第二项:语法结构(40 题,40 分钟)
 第一部分(20 题):这一部分试题,每道题都有四个词语排列顺序不同的句子,考生应从中找
出唯一正确的句子,在答卷相应的字母上画一横道。
这一部分题主要从汉语词序的角度,考查对语义搭配和语法规则的理解与掌握。
 第二部分(20 题):这部分试题,每一题给出一句话,每句话中都有个或两个空儿,考生应从
四个备选答案中选出唯一正确的答案。在答卷相应的字母上画一横道。
这一部分试题主要是考查对常用虚词的掌握情况。

18
语法结构这部分试题,主要测试应试者对汉语语法结构的掌握。具体要求是:
(1)掌握常用的量词、副词、介词、连词、助词等;
(2)掌握主语、谓语、宾语、定语、状语和补语的基本用法;
(3)掌握最甚本的语序规则;
(4)掌握一般常用句型;
(5)掌握“把”字句、“被”字句、连动式和兼语式等特殊句式。
语法部分样题
 51. A. 那是一个好天 B. 那是真好一个天
C. 那是真一个好天 D. 那真是一个好天
 52. A. 我买了一幅画寄给他 B.我寄给他一幅买了画
C. 我寄一幅买了画给他 D.我买了寄给他一幅画
 53. A. 我要学继续下去 B.我要继续学下去
C. 我要学下去继续 D.我继续要学下去
 54. A.我就下课回宿舍了 B.我就回了宿舍下课
C.我下了课就回宿舍 D. 我就下课回了宿舍
 55. A.我让打电话她也来参加晚会 B.我打电话让她也来参加晚会
C.我打电话她也来让参加晚会 D.我打电话让她也参加来晚会
 56. A.这个问题可以是解决的 B.这个问题是可以解决的
C.是可以这个问题解决的 D.是这个问题可以解决的
 71. 我住北京饭店 1124____房间。
A. 层 B.个 C.号 D.间
 72. 我们俩____认识到现在已经两年多了。
A. 离 B.从 C.当 D. 在
 73.他从我面前走____去。
A.过 B.来 C.了 D. 着
 74.他刚从上海回____,住在我家。
A. 到 B.了 C.过 D. 来
 75.这本书我____看了三遍。
A. 至少 B.很少 C.很多 D.许多
 76. 我最近很忙,____晚上都上课。
A. 在 B.就 C. 连 D.当
 77.那个梨他吃了一口____不吃了。
A. 都 B.并 C.还 D.就

19
第三项:阅读理解(50 题,60 分钟)
 第一部分(20 题):这部分试题都是长短不等的几段文字,每段文字中都留有几个空儿,每个
空儿都有四个可供选择的词语,考生应根据上下文的意思,从中选出正确的答案,在答卷上相
应的字母上画一横道。
这一部分填空题,所给的四个可供选择的词语,联系上下文从语义和语用上看,只有一个词语
是最恰当的。通过这种选择填空,来考查在阅读中对句子或语段的意义的正确理解。
 第二部分(30 题):这部分试题是几段长度不等、题材和体裁不同的阅读材料,每一段材料后
都有几个问题,每个问题给出四个不同的答案,考生应根据自己的理解选出正确的答案。
这部分试题主要是考察考生对文章的整体阅读理解能力。具体要求是:
(1)掌握文章大意;
(2)了解文章的主要内容和具体信息;
(3)能够跳跃非关键性文字障碍,寻找所需信息;
(4)根据文章中提供的材料进行正确推断;
(5)领会作者的态度。
阅读理解(一)样题
 91-93
今年二月份,又到了爸爸的生日了。我想家中什么也不缺,爸爸是个 91,要是我给他寄几本
他喜欢的书去,也许他会高兴。于是我就买了一套《鲁迅全集》寄去。果然跟我 92 一样,爸爸
收到我寄去的书后,回信说对我的礼物十分 93。
91.A.足球迷 B.读书迷 C.电影迷 D. 棋迷
92.A.做的 B.说的 C.想的 D. 寄的
93.A.满足 B. 舒服 C. 热情 D. 满意
 94-98
现在大部分家庭中,94 教育孩子的常常是妈妈。比如,到深开家长会的大部分是母亲;平常
和老师保持 95、检查孩子作业、关心孩子学习的也大都是母亲;更不用说 96 孩子生活了。有关
教育专家严肃地指出:这是目前家庭教育中存在的一个重大问题。从心理学角度看,儿童健康
地成长,既需要母亲也需要 97。两者只能互相补充而不能互相 98,在这个问题上做父母的不该
有什么分工。
94. A.负责 B.服务 C.包括 D. 完成
95. A. 联系 B. 联合 C. 交际 D. 结合
96. A. 影响 B. 提高 C.改变 D.照顾
97. A.兄弟 B.姐妹 C.老师 D. 父亲
98. A.代表 B. 代替 C.替 D.换
阅读理解(二)样题
 111-112
现在差不多家家有冰箱。有些人为了方便,也有些人为了好看,把冰箱放进了睡觉的房间。
据研究,冰箱放在房间里会产生三种污染:一是声音污染;二是电子污染;三是化学污染。因此,
如果可能,最好把冰箱请出睡觉的房间。

20
111. 这段话主要谈冰箱:
A.使用中应注意的问题 B.在生活中的作用 C.哪儿最容易坏 D. 有什么优点
112. 到应把冰箱从睡觉的房间里搬出去是因为:
A.地方太小 B.使用方便 C.为了身体健康 D.为了房间好看
 113-114
在西山生活着 100 多只猴子,它们经常到附近的地里偷吃土豆和萝卜。今年这些猴子又有了新行动。
它们带着塑料口袋去果园偷吃苹果。猴子们到了果园先大吃一顿,吃饱了拣好的装进袋里带着跑回山
上。
果树的主人赶走猴子的方法是用力敲打竹子或者播放有枪声的录音带。
113.果树主人是怎么对付猴子的?
A.用枪打 B.大声放音乐 C.用竹子打 D. 用枪声吓
114.猴子偷吃苹果:
A.以前常这样干 B.又吃又拿 C.摘下苹果拿着就跑 D. 还偷果园的口袋
* 汉语水平考试 HSK(基础)
 HSK(基础)的分数等级共分 3 级,分数等级说明如下:
1 级:具有基础(低)汉语能力,能理解简单的语句,表达简单的意思,可进行日常生活、学
习方面的初步语言交际。掌握 600 左右汉语常用词和与之相应的语法项目的汉语学习者可达到这
一标准,也是获取基础 C 级《汉语水平证书》的标准。
2 级:具有基础(中)汉语能力,可满足基本的日常生活、一定范围的社会交际和一定程度的学
习需要。是获取基础 B 级《汉语水平证书》的标准。
3 级:具有基础(高)汉语能力,是入中国高等院校理、工、农、西医类本科学习的最低汉语能
力标准,也是获取基础 A 级《汉语水平证书》的标准。相当于 HSK 初等 C 级水平。
* HSK(基础)命题的基本原则
 选择语料的一般原则
(一)来源合理,避免抄袭。
 应从国内公开出版的各种图书、杂志、报刊、正规网络媒体当中选取语料,避免与某些汉语教
科书、HSK 辅导材料、HSK 考试题集中的语料雷同。
(二)格调高雅。
 选取的语料内容要积极向上,格调要高雅。不要选取那些反映社会阴暗面的语料,例如,对社
会的不满,一些政治历史问题,也不要选取那些趣味低俗的东西。比如像吵架骂街式、痞子式
的语料。例如:“瞧你这德行”“得得,你烦不烦人”,等等。
(三)语言要规范。
 用于命制试题的语料,无论是口头语言或是书面语言都必须规范。命题人员要认真地推敲所选
用的语料,合理地修改文字中句子不通、用词不准、标点符号不当等等不规范地方。
(四)题材、体裁要多样。
 语料的题材要多样,不要局限于命题人员熟悉喜爱的内容。这样一是命题内容的涉及面窄,二
是不符合标准化考试的公平性原则。一般而言,命题员所选择的语料可涉及经济、历史、文学
文化、科技、教育、文艺、体育等方面。

21
 体裁形式要多样化。对于 HSK(基础)考试来说,主要是叙述性的、说明性的文字。不宜选取
一些论述性的、描写性的文字。
 此外语料的文字还应生动有趣。HSK(基础)考试从语言能力上说虽然是最初级的,但考试对
象不一定都是小孩子,更多的是成年人,所以语料不宜太儿童化,校园化。
(五)语料信息量大,内容丰富,且长短适宜。
 语料信息量大,内容丰富才能为各种选择项提供比较充分的语境和情景,这样便于从中出题,
同时语料的长短同样要适宜,不能过短或过长。应根据题型设计要求,进行适当的删减。
(六)不同题型的语料要根据其特点而有所区别
 听力理解的语料和阅读理解的语料在语体色彩上要有所不同。听力题的语料要口语化,不要有
生僻字词和文言成份,不要有太多的记忆成份。如:“因其处置不当而造成事故。”应 改成
“因为他处置不妥当而……”。阅读题的语料要内涵丰富一些,文字可以适当地书面化一些,因
为考生可以反复推敲。
* HSK(基础)命题的基本原则
(一)考查范围广泛
 应合理设计考查内容,不要重复考查某一内容。可参考 HSK(基础)常用词汇、HSK(基础)
常用汉字及 HSK(基础)常用语法项目,考查内容应尽量广泛。
(二)难度适宜
 应对 HSK(基础)考试的难度有所把握。所命制的试题难题、易题都应包含。一般而言,中等
难度的题目占大多数,较难或较易的题目也应占有一定数目。

(三)从主要信息方面选题,从重要细节方面选题
 命制试题时应尽量吸收语料中的重要信息,并找出语料中的重要细节,从主要信息,重要细节
方面来设计题目。
(四)提问设计合理
 1.提问的目的在于考查语言能力而非其他。
HSK 考查的是学生的语言能力,所命制的题目应与语言能力密切相关。有些题目虽然貌似考查
语言能力实际上考查的是考生的其他能力。比较常见的是出现一些数字方面的题。例如:
去年有 100 人参加,今年增加了 10%,
问:今年参加的是多少人?
这道题目考的就不是语言能力,而是数学计算能力。如果是考查学生听数字的能力,就可以问
今年增加了多少。数字题主要应考查考生对汉语的一些有关数字的表示法掌握得怎么样。如百、
千、万、一点钟、一刻钟、概数等,在听力中对数字的辨别能力等等,而不是数字计算。
 2.提问应简洁、清晰、明了。
考生应能清楚、准确地理解提问的语言表述,从而理解题意。
 3.提问应从多方面、多角度进行。
无论是听力理解或者阅读理解中的提问,应使提问的方式多样化。应根据题型、语料的特点、
考查内容等方面综合考虑,多方面、多角度地提出问题。
 4.提问应减少逆向题的数量。

22
逆向题,就是从否定的角度来提出问题。不是问有(是)什么,而是问没有(不是)什么。在
一些标准化考试里也有这种逆向题。但是不能太多,只能偶尔一两道。虽然逆向题容易出,但
不能为了自己图省事而给考生增加负担。
一旦出现逆向题,需在题干中将否定部分加粗,给予考生一定的提示,避免考生错误理解题意。
如,“下列不正确的是:”;“哪项不符合作者的意思?”
 5.提问要避免常识性的问题。
在命制试题时,要真正考查考生的语言水平。避免出现考生不必理解题意,也可以作答的情况
发生。
 6.提问要避免直接使用语料中的原句,应尽量改写、重述。
 7.命制一组题目时,题目数量与语料长短成比例。
命制一段语料带多个题目的组题时,题目数量要合理,考查点在语料中分布要均匀。同时题目
的顺序也应按照考查点语料中的顺序排列。
 8.前后提问不可相互提示。
不论是一组题目,还是多个单个题目,各个题目之间相互应具有独立性,不会从提问内容、考
查内容等方面相互提示。
(五)选项设计要合理
 主要包括以下几个方面:
 1.正确答案要有唯一性,错误选项要有一定的迷惑性,答案分布要合理。
命题中出现的问题常常是正确答案不是唯一的,有两个甚至三个都可以。除了正确答案外,其
余选项要有迷惑性。不能让考生不用理解语料的内容,只凭常识就可判断对错。
干扰项应具备一定的合理性。避免主观臆造,而应根据考生在学习过程中一些有规律的偏误来
设计。
此外,一套卷子中正确答案的分布应均匀,避免出现答案 ABCD 中,某一选项过多的情况。如,
有时答案中的 D 项较多就不太合理。
 2.选项的文字明晰规范,简单易懂,
选项表述要清晰,让考生一看就懂。有时选项中有相同的词语,可以将这些词语放至题干中,
减少选项的字数。
 3.选项的长短、句式等应尽量一致。
四个选项的长短要尽量一致,一定要避免正确选项是最长,或最短。四个选项采用的句式要一
致。如可以两个肯定句,两个否定句。
 4.选项的排列应遵守一定的规律。
可以按逻辑次序排列,如数字由小到大排列。也可以时间顺序,如日期由早到晚排列。
如果没有逻辑次序或时间顺序可以遵循,可按照选项由短至长进行排列。
 5.各个选项不能相互提示
命题员在命题的时候要避免选项之间相互矛盾、或者相似。此外,上下题目之间不应出现相同
的选项,或类似的考查内容,避免给考生提示。
 6.选项要避免直接使用语料中的原句,应尽量改写、重述。

23
(六)几个命题技术规范
 1.阅读理解部分的填空题第一个句子不要出题。
这里所谓“第一个句子”,是指第一个标点符号前的那部分,不管这个标点符号是逗号、分号、
惊叹号还是句号。
 2.听力题的问句要完整。
例如,不能用“上面的这段对话的意思是”这种方式。
 3.以甲级词为主,约占 80%,超纲词控制在 5%左右。
个别的事物名字是超纲的生僻字,可加注拼音,以提示考生这个词只是物名,不需要理解。如
“狐狸(húli)”“蝴蝶(húdié)”
 4.字数控制
试卷总字数的控制,一般在 6500 字左右,听力理解是 1500 左右(包括试题说明和备选答案),
语法结构是 1500 字左右(包括试题说明和备选答案),阅读理解是 3000 字左右(包括试题说
明、阅读语料和备选答案)。另外录音材料为 1000-1200 字左右(不包括试题说明)。
* HSK(基础)各题型的设计原则和命题注意事项
一、关于听力理解部分
在基础汉语阶段,学生的听力水平还比较低,听力材料多数是在句子这个层面上,少部分是语
段;语速也较正常语速略慢,每分钟约 180-200 字。主要考查考生对主要信息的反应能力,对近
似的语音语调的辨别能力。
听力理解分为三部分,考试时间为 35 分钟。
(一)第一部分
 共 15 题。在这一部分部分中,考生会听到一个陈述性或者描述性的句子,在试卷上会看到四幅
图画,考生需要选出跟这句话内容一致的那一幅。这部分试题考生每句话可以听两遍。
 命题时应注意两点:1.题干要用陈述句。2.备选项的四幅画,文字说明要细致准确。命题员
需考虑所给的选项是否容易通过画面表达出来。这部分试题好坏的关键常常不是题干怎样,而
是这四幅画设计和画得怎样。比如下面的题目也不好:
 妈妈习惯于早起锻炼。
A. 妈妈习惯于早起买菜
B. 妈妈习惯于早起做饭
C. 妈妈习惯于早起锻炼
D. 爸爸习惯于早起看报
 这道题四个选项都强调了“习惯于”,可“习惯于”并无法用图画来表达。
(二)第二部分
 共 15 题。这部分试题,每题都是一个人问一句话,给考生四个供选择的回答,考生可以听两遍。
这种试题的设计思想是,不仅考查考生能否听懂,而且考查考生能否正确回答这个问题,这里
考查的也是考生的语言交际能力。例如样卷第 21 题:
 问:已经 7 点了,现在去晚不晚?
A. 还来得及
B. 已经完了

24
C. 一定是七点
D. 还不到一点
 正确的回答应该是“还来得及”。其中 B 和 D 两个选项是考查对近似音(“晚”和“完”,
“七”和“一”)的辨别能力。
 这部分试题命题时要注意:1.在备选项中,应尽量避免那种简单的肯定或否定的答案,以免考生
随意猜测。如果上题的正确答案给的是“晚了”或“不晚”,则很容易使考生猜中。2.备选项中
的错误答案只能是错在答非所问,而不是语法上有错误。例如下面的试题:
 为避免迟到,你是不是应该早点来学校?
A. 来学校吃早点
B. 来学校早点
C. 不是应该
D. 是的
“B 来学校早点”和“C 不是应该”在语法上就不太通,这类选项要尽量避免。
(三) 第三部分
 共 20 题。这部分试题是两个人的对话或一段话,根据这段对话或这段话提出一个或几个问题,
给考生四个可供选择的答案。这一部分属于较难一点的题型,形式多样,题材、内容广,但都
属于日常生活中的场景。主要考查考生对别人谈话的理解能力:能否听懂谈话的主要内容,能
否理解谈话人的态度和语气。
 命题时需要注意的是:对话的文字要规范,不要“太口语化”甚至是用一些土语,如“那还用
说(表示很肯定,当然)”、“看不上眼”、“还是的(表示很肯定)”这些很口语化的词语,
对母语是汉语的人来说觉得很简单、很常用,但是对于外国人尤其是初学者(特别是没有来过
中国的人)来说,是很难的。语段的文字要尽量口语化,不要书面色彩太浓。下面这段语料就
不适宜用在听力,一是超纲词太多,从语体色彩来看,也太书面语了(如画线的词语)。
 “太极拳尤其适合老年人,因为它的动作有刚有柔 ,可快可慢。作为一种运动,太极拳既能健身,
又具有娱乐性,是一项很好的运动。”
 语法结构部分:这部分主要考查的是汉语语法中词序的变化和虚词的运用,所以语法结构项目
分为排序和虚词填空两部分,主要是在句子层面上来考查考生的语言能力和语法知识。语法结
构共两部分,40 题,考试时间为 40 分钟。
(一)第一部分
 共 20 题。每一题给出由同一组词语按不同顺序组织成的四个句子,让考生选出其中唯一正确的
那个句子。这一部分试题主要考查考生对汉语词序变化的掌握情况,如各种句子成分的顺序和
位置、趋向补语的运用、多重状语和定语的组织等,即怎样才能把一组词语正确地组织成句子。
 在命题时需要注意的是,要把一个正确的句子是当地分成几个板块,让考生粗略一看能够知道
这个句子说的是什么内容,然后把它组织成语序正确的句子。要避免把句子拆分得太零碎,甚
至把一个词拆成字分离开来的情况,这会让考生不能理解句子,例如:
A.那家饭店还是好的吃菜
B.菜还是好吃那家饭店的
C.还是那家饭店的菜好吃
D.好吃菜还是那家的饭店

25
其中的“A.那家饭店还是好的吃菜”,把“好吃”一词拆开,就让人不知所云了。“D.好吃
菜还是那家的饭店”把“那家饭店”拆开了,也不合适。
还有一个问题是,把施事和受事调换,主语和宾语调换。这样会使得句子虽然不怎么合乎情理,
但语法上是不错的。例如:
A. 他被那个仪器移动了一下。
B. 那个仪器被他移动一下了。
C. 那个仪器被他移动了一下。
D. 他那个仪器被移动了一下。
C 是命题者的正确答案,但是“D 他那个仪器被移动了一下”也不错。“A 他被那个仪器移动了
一下”在语法上没有错误,只是情理上是不能成立的(在一般情况下),正因为如此,考生即
可从情理上来判断此句不对,而不用考虑它的顺序是不是正确了。这样就达不到我们考查的目
的了。
(二)第二部分
 共 20 题。每一题给出一句话(单句或复句),每句话中都有一个或两个空儿,由考生从四个
(组)备选答案中选择出正确的那一个(组)。这一组题主要是考查考生对副词、助词、连词、
介词等虚词以及量词的搭配规律,结果补语、趋向补语、可能补语的用法,动词、形容词的重
叠变化形式以及特殊句式如“把”字句、“被”字句、比较句等的掌握情况。
 在命题时要注意的是尽量要多涉及各个考查点,使考查点尽量分布得均匀一些。不要使得某一
类考查点太多,而其他考查点很少或者没有。
阅读理解部分:这部分试题主要是在语段层面上考查考生对常用词语的语义和语用的掌握情况,
对语段内容的整体理解能力。阅读理解共两部分,50 题,考试时间为 60 分钟。
(一)第一部分
 共 20 题,是长短不等的几段文字,每段文字中都有几个空儿,每个空儿都有四个可供选择的词
语,它们的语法属性基本上都是相同的,意义上相似或相类,由考生根据上下文的理解,从中
选出唯一正确的词语。这部分的填空题,考查的是考生对实词(名、动、形)的运用以及词汇
量的掌握情况。
 在命题时,这部分的填空题,都要用实词,不要用虚词。这是与语法部分的填空题的不同,是
在词语考查方面跟语法部分的不同分工。
(二)第二部分
 共 30 题,也是长短不等、题材和体裁不同的几段文字。每段文字后根据文字内容提出几个问题,
每个问题给出四个不同的答案,让考生根据自己的理解选出正确的答案。这部分主要是考查考
生对文章的整体理解能力。可在原始语料中保留少量的超纲词,目的是考查应试者排除非关键
性文字障碍而抓住主要信息的阅读能力。
 这部分命题时注意,1.要选择重要的内容或重要的细节出题;2.对于整个语段主要内容的理
解,可以出例如:这段文字的主要意思是什么,主要内容是什么,主要说明了什么问题,等等,
一般不宜出诸如“哪一项适宜做本文的题目”之类的题目。因为这类题目不适于基础的水平,
且由于确定文章题目的因素是多方面的,没有唯一性。3.对于比较难以理解的词语或句子(包
括含有超纲字词的),如可以根据上下文能够理解的,可以出对这类词语或句子理解、判断的
题,以考查考生对语段整体理解和跨越障碍理解的能力。4.尤其注意不要使前后的题目相互提
示。

26
* 汉语水平考试 HSK(初中等)
 HSK 初中等考试分为 3 个部分,结构如下:

考试项目 试题数量 考试时间

听力理解 1-50 约 35 分钟

语法结构 51-80 20 分钟

阅读理解 81-130 60 分钟

综合填空 131-170 30 分钟

第一项:听力理解(50 题,约 35 分钟)


这一项试题由三部分组成:
• 第一部分(15 题):这部分试题,都是一个人说一句话,第二个人根据这句话提一个问题,听完
后考生应在试卷上的四个选择项中选择最恰当的答案(在答卷上划出相应的字母)。
• 第二部分(20 题):这部分试题,都是两个人的简短对话,第三个人根据对话提出一个问题,
听完后考生应在试卷上的四个选择项中选择最恰当的答案(在答卷上划出相应的字母)。
• 第三部分(15 题):这部分试题,是几段较长的对话或讲话。每段话之后,第二个人或第三个
人根据对话或讲话提若干个问题,每听完一个问题,考生应在试卷上的四个选择项中选择最恰
当的答案(在答卷上划出相应的字母)。
第一项:听力理解(50 题,约 35 分钟)
这一项试题由三部分组成:
• 第一部分(15 题):这部分试题,都是一个人说一句话,第二个人根据这句话提一个问题,听完
后考生应在试卷上的四个选择项中选择最恰当的答案(在答卷上划出相应的字母)。
• 第二部分(20 题):这部分试题,都是两个人的简短对话,第三个人根据对话提出一个问题,
听完后考生应在试卷上的四个选择项中选择最恰当的答案(在答卷上划出相应的字母)。
• 第三部分(15 题):这部分试题,是几段较长的对话或讲话。每段话之后,第二个人或第三个
人根据对话或讲话提若干个问题,每听完一个问题,考生应在试卷上的四个选择项中选择最恰
当的答案(在答卷上划出相应的字母)。
• 听力理解这项试题,主要测试考生能否听懂正常语速的句子、对话和一般性题材的讲话。具体
要求是:
(1)了解所听到的句子、简要的对话和讲话的基本大意。
(2)跳跃障碍,抓住其中的主要信息或某些重要细节。
(3)根据所听到的材料进行推理和判断。
(4)理解说话人的目的和态度。
• 这项试题的考试方法是:首先听基本为正常语速(17-220 字/分钟)的录音材料(注意:只听
一遍);每一问题后有 15-20 秒的答题时间,要求考生迅速在试卷上所提供的四个选择项中选
择最恰当的答案,然后在答卷上找到相应的题号并划出代表最恰当答案的字母。

27
第二项:语法结构(30 题, 20 分钟)
• 这一项试题由两部分组成:
• 第一部分(10 题):这部分试题,每题是一个不完整的句子,在每一个句子下面都有一个“指
定词语”,句中 A.B.C.D 是供选择的四个不同位置,要求考生判断上述“指定词语”放在
句中哪个位置上最恰当。
• 第二部分(20 题):这部分试题,每一个句子中有一个或两个空儿,要求考生在下边的四个选
择项中挑选一个最恰当的填空(在答卷上划出字母)。
• 语法结构这项试题,主要测试考生对汉语普通话语法结构的掌握程度。测试重点是:
(1)常见的量词、方位词、能愿动词、副词、介词、连词及助词等的用法。
(2)动词、形容词和名词重迭。
(3)几种主要补语、定语、状语的用法。
(4)语序。
(5)比较的方式。
(6)提问的方式。
(7)常用词组和习用语。
(8)常用复句。
• 这项试题每一道题的平均答题时间为 40 秒左右。
第三项:阅读理解(50 题,60 分钟)
这一项试题由两部分组成:
第一部分:词汇(20 题)
• 这一部分试题,每题为一个句子,每一个句子中都有一个划线的词语,要求考生从句子下面的
四个选择项中挑选最接近该划线词语的一种解释(在答卷上划出字母)。
• 这部分试题主要考查考生对词义(包括一部分词组和习用语)的掌握程度,同时也考查其词汇
量能否适应阅读一定难度文章的需要。
第二部分:阅读(30 题)
• 这一部分试题,分别选择若干篇题材、体裁、长度、难易程度不同的阅读材料,每一篇材料后
提出若干个问题,每题有四个选择项,要求考生选择最恰当的答案。
• 这部分试题主要测试考生的阅读能力和速度。具体要求是:
• (1)掌握所读材料的主要用意和大意。
• (2)了解所读材料的主要事实和信息。
• (3)跳跃障碍,捕捉所需的某些细节。
• (4)根据所读材料进行引伸和推断。
• (5)领会作者的态度和情绪。
• 请考生注意这部分试题的阅读速度,一般性文章 150 字/分钟,较为复杂的文章 120 字/分钟。
• 阅读理解这一项试题每题的平均答题时间为 70 秒左右。

28
第四项:综合填空(40 题,30 分钟)
第一部分:词语填空(24 题)
• 这一部分试题,选取多种不同用途的综合材料,每段材料中都留有若干个空儿(空儿中标有题
目序号),每个空儿右边都有四个供选择的词语,要求考生根据上下文的意思从中选择最恰当
的词语(在答卷上划出字母)。
• 这部分试题,主要测试考生综合运用语言的能力。
第二部分:汉字填空(16 题)
• 这部分试题,主要从考生常见的应用文中选取语料;每段语料中都有若干个空儿(空儿中标有
题目序号),要求考生根据上下文的意思在答卷上的每一空格中各填写一个最恰当的汉字(注
意:每个空格中只能写一个汉字)。
• 这部分试题,主要测试考生在理解语篇的基础上,书写汉字的能力。
• 综合填空这一项试题,每题的答题时间为 45 秒左右。
* HSK(初中等)语法样题
第一部分
 说明:51-60 题,在每一个句子下面都有一个指定词语,句中 A B C D 是供选择的四个不同位
置,请判断这一词语放在句中哪个位置上恰当。
例如:
 55.我们 A 一起 B 去上海 C 旅游 D 过。
没有
“没有”只有放在句中 A 的位置上,使全句变为“我们没有一起去上海旅游过”,才合乎语法。所以
第 55 题唯一恰当的答案是 A,你应在答卷上找到号码 55,在字母 A 上画一横道。横道一定要画
得粗一些,重一些。
51.A 你能 B 那块残骨判断 C 死者的劳动和营养状况 D 吗?
根据
52.A 我 B 也不敢开 C 汽车 D 那玩意儿了。

53.会修 A 录音机 B 就他 C 一个人 D。

54.A 那是一次 B 我 C 终生 D 难忘的旅行。

55.A 鸣凤的注意力正 B 集中 C 那技 D 梅花上面。

56. 他伸展 A 睡 B 了一夜雨变得 C 麻木 D 的腿脚。

第二部分
 说明:61-80 题,每个句子中有一个或两个空儿,请在 A B C D 四个答案中选择唯一恰当的填
上(在答卷上的字母上画一横道)。
例如:

29
 67.我昨天买了一__钢笔。
A.件 B.块 C.支 D.条
 我们只能说:“我昨天买了一支钢笔”,所以第 67 题唯一恰当的答案是 C,你应在答卷找到号码
67,在字母 C 上画一横道。横道一定要画得粗一些,重一些。
 61.他随身带了一__橡皮泥。
A.张 B.只 C.块 D.棵
 62.我茫然望着这张__笑非笑的脸。
A.似 B.像 C.是 D.又
 63.三毛的到来,__张家原先宁静的午休时间也变得热闹起来。
A.被 B.给 C.愿 D.使
 64.人活__要有志气有追求。
A.了 B.完 C.着 D.过
 65.__疾病、药物和营养缺乏引起的头发变白,经治疗可以恢复原色。
A.由 B.凭 C.以 D.据
 73.家里静得__一只鸟落到房顶上__能听见。
A.既然……就……
B.只有……才……
C.连……都……
D.既……也……
 74.他的突出表现__使其对手们,__使运动医学专家们感到惊讶。
A.固然……但是……
B.即使……那么……
C.因为……所以……
D. 不仅……而且……
 78.山里的孩子__。
A.不容易就是读起书来
B.读起书来就是不容易
C.读书起来就是不容易
D.读起来书就是不容易
 79.弟弟穿了__略显得肥大的旧罩衣。
A.哥哥穿过的去年那件
B.去年哥哥穿过的那件
C.哥哥去年穿过那件的
D.穿过的去年哥哥那件

30
* HSK(初中等)阅读理解样题
第一部分
 说明:81-100 题,每个句子中都有一个划线的词语, A B C D 四个答案是对这一划线的词语的
不同解释,请选择最接近该词语的一种解释(在答卷上的字母上画一横道)。
 84.孙子进不了幼儿园,我就自己教他。我自信,这点本事是有的。
A.志气 B.感情 C.觉悟 D.能力
 88.我丈夫读了那本杂志,看出了你写的那个人就是我。
A.期刊 B.报纸 C.小说 D.剧本
 89.今年来,拍电视片的经费是很紧张的。
A.人员 B.时间 C.预算 D.道具
 100.前不久,一位朋友赴日本留学,临行前,最放心不下的是年近 70 的父母。
A.担心 B.想念 C.原谅 D.感动
第二部分
 说明:101-130 题,每段文字后都有若干个问题,每个问题都有 A B C D 四个答案,请快速阅
读并根据它的内容 选择唯一恰当的答案(在答卷上的字母上画一横道)。
101-102
 无论如何,名人总是名人,名人的形象名誉总是比平常百姓的值钱,因而也更需要保护。但是,
既是名人,就不能拒绝社会公众舆论的监督,也没有拒绝公众舆论批评的权利。因为,名人的
公众形象并不完全是属于他们自己的,他们是社会精神财富的一部分。至少,就像名人拥有捍
卫自己名誉不受侵犯的权利一样,公众则拥有对这种权利品头论足的权利。这种权利也是应当
予以尊重并加以特别保护的。
 【101】本文特别强调了下列哪种权利?
A.百姓名誉不受侵犯的权利 B.公众评论批评名人的权利
C.名人使用自己财富的权利 D.名人保护自己名誉的权利
 【102】作者认为,名人不接受舆论批评:
A.是没有道理的 B.公众也应理解 C.只是个别现象 D.百姓也没办法
131-140
阅览规则
一、凡入室阅览者,一律凭 131 身份证领取座位号 132 入座。
二、本室所有报刊只准在 133 阅览,134 不向外借阅;135 没有管理人员许可而 136 本室者,137
伍元。
三、要爱护报刊 138,不准圈划、剪裁。
四、注意室内安静和 139。不准大声喧哗,不准吸烟,不准随地吐痰。
五、凡来本室阅读者,必须 140 本馆制度,尊重和服从工作人员的管理。
××图书馆
×年×月

31
 131.A.别人 B.本人 C.人们 D.大人
 132.A.找到 B.相对 C.自愿 D.对号
 133.A.桌子 B.屋里 C.室内 D.室外
 134.A.一律 B.所有 C.其他 D.到处
 135.A.向 B.对 C.被 D.为
 136.A.带走 B.带去 C.带来 D.带出
 137.A.处置 B.处分 C.罚款 D.惩罚
 138.A.资料 B.资产 C.资格 D.资源
 139.A.生活 B.卫生 C.保卫 D.保护
 140.A.遵守 B.违反 C.按照 D.遵命
* 汉语水平考试 HSK(初中等)
HSK (初、中等)等级分数说明
 3 级 具有初级(低)汉语能力,可以获取初等《汉语水平证书》 C 级。这是中国国家教育部规
定的外国留学生入中国理、工、农、西医类院、系学习的最低汉语能力标准。
 4 级 具有初级(中)汉语能力,可以获取初等《汉语水平证书》B 级。
 5 级 具有初级(高)汉语能力,可以获取初等《汉语水平证书》A 级。
 6 级 具有中级(低)汉语能力,可以获取中等《汉语水平证书 C 级。这是中国国家教育部规定
的外国留学生入中国文、史、中医类院、系学习的最低汉语能力标准。
 7 级 具有中级(中)汉语能力,可以获取中等《汉语水平证书》B 级。
 8 级 具有中级(高)汉语能力,可以获取中等《汉语水平证书》A 级。
* 汉语水平考试 HSK(高等)
 高等汉语水平考试由相对独立的三套试卷构成:①120 题笔试;②作文考试;③口语考试。 120
题笔试分为 3 个部分,结构如下:

考试项目 试题数量 考试时间

听力理解 1-40 30

41-55 15
阅读理解
56-80 25

综合表达 81-120 40

 前部分考试结束之后休息 10 分钟,开始作文考试和口语考试。
 作文考试时间 30 分钟,完成字数 400–600 字的作文。
 口语考试时间 20 分钟,其中准备 10 分钟,考试 10 分钟。考试共有两项内容:〈1〉朗读一段文
章,时间约用 2 分钟。〈2〉口头回答指定的两个问题,每个问题可用 3 分钟。

32
 9 级 具有高等(低)汉语能力,接受过 3000 学时和 3000 学时以上现代汉语正规教育的学习者
(包括具有同等学历或同等水平的汉语学习者)可达到这一级标准。这是从事以汉语为交际工
具的一般性工作的合格(低)标准。这一标准同时又是获取高等《汉语水平证书》 C 级的标准。
 10 级 具有高等(中)汉语能力,这是从事以汉语为交际工具的一般性工作的合格(中)标准。
这一标准同时又是获取高等《汉语水平证书》 B 级的标准。
 11 级 具有高等(高)汉语能力,这是从事以汉语为交际工具的一般性工作的合格(高)标准,
亦可视作达到中级翻译水平。这一标准同时又是获取高等《汉语水平证书》 A 级的标准。
* 新汉语水平考试 HSK
 为使汉语水平考试(HSK)更好地满足于海外不断增长的汉语学习者对汉语考试的新的要求,
中国国家汉办组织中外汉语教学、语言学、心理学和教育测量学等领域的专家,在充分调查、
了解海外实际汉语教学情况的基础上,借鉴近年来国际语言测试研究最新成果,重新研发并将
于 2009 年 11 月起逐步推出新汉语水平考试(HSK)。
 新 HSK 是一项国际汉语能力标准化考试,重点考查汉语非第一语言的考生在生活、学习和工作
中运用汉语进行交际的能力。新 HSK 分笔试和口试两部分,笔试和口试是相互独立的。笔试包
括 HSK(一级)、HSK(二级)、HSK(三级)、HSK(四级)、HSK(五级)和 HSK(六
级);口试包括 HSK(初级)、HSK(中级)和 HSK(高级),口试采用录音形式。

笔试 口试
HSK 六级
HSK 高级
HSK 五级
HSK 四级
HSK 中级
HSK 三级
HSK 二级
HSK 初级
HSK 一级

新 HSK 各等级与《国际汉语能力标准》《欧洲语言共同参考框架(CEF/CEFR = Common European


Framework of Reference for Languages: Learning, Teaching, Assessment)》的对应关系如下表所示:

新 HSK 词汇量 国际汉语能力标准 欧洲语言框架


HSK 六级 5000 及以上 五级 C2

HSK 五级 2500 五级 C1

HSK 四级 1200 四级 B2

HSK 三级 600 三级 B1

HSK 二级 300 二级 A1

HSK 一级 150 一级 A1

 通过 HSK(一级)的考生可以理解并使用一些非常简单的汉语词语和句子,满足具体的交际
需求,具备进一步学习汉语的能力。
 通过 HSK(二级)的考生可以用汉语就熟悉的日常话题进行简单而直接的交流,达到初级汉
语优等水平。

33
 通过 HSK(三级)的考生可以用汉语完成生活、学习、工作等方面的基本交际任务,在中国
旅游时,可应对遇到的大部分交际任务。
 通过 HSK(四级)的考生可以用汉语就较广泛领域的话题进行谈论,比较流利地与汉语为母
语者进行交流。
 通过 HSK(五级)的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整
的演讲。
 通过 HSK(六级)的考生可以轻松地理解听到或读到的汉语信息,以口头或书面的形式用汉
语流利地表达自己的见解。
新 HSK 延续原有 HSK 汉语能力考试的定位,面向成人汉语学习者。其成绩可以满足多元需求:
 1.为院校招生、分班授课、课程免修、学分授予提供参考依据。
 2.为用人机构录用、培训、晋升工作人员提供参考依据。
 3.为汉语学习者了解、提高自己的汉语应用能力提供参考依据。
 4.为相关汉语教学单位、培训机构评价教学或培训成效提供参考依据。
* 商务汉语考试 BCT (Tham khảo: http://www.chinesetest.cn/userfiles/file/BCT/BCTB0001.pdf )
 商务汉语考试是为测试第一语言非汉语者从事商务汉语的汉语水平而设立的国家级标准化考试,
英文名称为 Business Chinese Test,简称 BCT。
 BCT 考查的是考生在与商务有关的广泛的职业场合、日常生活、社会交往中用汉语交际的能力。
 BCT 每年定期在中国国内和海外举办,凡考试成绩达到规定标准者,可获得相应的《商务汉语
考试证书》。
 中国国家汉办全权领导商务汉语考试,并颁发《商务汉语考试证书》。
 考试对象:第一语言非汉语者。从能用汉语进行最基本的交流到能用汉语进行熟练交流的人都
适合参加。
 考试对象:第一语言非汉语者。从能用汉语进行最基本的交流到能用汉语进行熟练交流的人都
适合参加。
 考试用途:
1、为用人单位在人员招聘、选拔、安置、晋级等决策过程中评价相关人员的商务汉语水平提供
参考依据。
2、帮助有关教学、培训机构在招生、入学分班等过程中认定学生的商务汉语水平。
3、评价有关教学单位、培训机构的教学、培训成效。
4、为那些求职、应聘、或希望提升职位的人士提供商务汉语水平的证明。
5、帮助汉语学习者了解、发展自己的商务汉语水平。
 BCT 的等级标准:
1 级:尚未具备在商务汉语中运用汉语进行交流的能力。
2 级:在商务活动中可以运用汉语进行基本的交流。
3 级:在商务活动中可以比较有效地运用汉语进行交流。
4 级:在商务活动中可以比较熟练地运用汉语进行交流。
5 级:在商务活动中可以自如、得体地运用汉语进行交流。

34
 试卷构成:由 BCT 听读和 BCT 说写两种相对独立的考试组成。

考试项目 试题数量 答题时间

听力 50 40

阅读 50 60

合计 100 100

考试项目 试题数量 答题时间

写作 2 40

口语 2 10

合计 4 50

 BCT 等级分数表

等级 单项分 总分

1 0-100 0-200

2 101-200 201-400

3 201-300 401-600

4 301-400 601-800

5 401-500 801-1000

* 少儿汉语考试 YCT (Tham khảo: http://www.chinesetest.cn/userfiles/file/dagang/YCT1.pdf )


 少儿汉语考试是为测试第一语言非汉语少年儿童所具有的汉语水平而设立的标准化考试,由中
国国家汉语国际推广领导小组办公室领导开发,英文名称为 Chinese Test for Young Learners,简
称 YCT。
 考查应试者在日常生活及学习中应用汉语的实际能力。实用性、趣味性、知识性是考试的主要
特色。
 YCT 每年定期在中国国内和海外举办,凡考试成绩达到规定标准者,可获得相应的《少儿汉语
考试证书》。
 中国国家汉办全权领导少儿汉语考试,并颁发《少儿汉语考试证书》。
 考试对象:第一语言非汉语少年儿童,年龄 15 岁以下(含 15 岁)。

35
 少儿汉语考试面向全球,服务于需要评估少年儿童的汉语水平的各类单位、家庭及个人。其主
要用途包括:
(1) 为有关单位在学生选拔、出国学习、出国旅游等过程中评估该学生的汉语水平提供参考依
据;
(2) 为相关教学、培训机构在招生、入学分班等过程中评估学生的汉语水平提供参考依据;
(3) 为家庭及汉语学习者本人了解、提高自己的汉语水平提供参考依据;
(4) 为评估相关教学单位、培训机构的教学或培训成效提供参考依据。
 少儿汉语考试用 3 个等级描述应试者的汉语水平 :
1 级 : 具备最基本的汉语交际能力,能够运用最简单的词语或句子进行最简单的交际,如介绍、
询问、问候和道别、感谢和道歉、表达想法和态度等。
2 级 : 具备基本的汉语交际能力,能用简单的词语和句子进行交际,如介绍、询问、比较、问候
和道别、感谢和道歉、提议和许可、描述人和事物、说明时间和地点、表达自己的态度和感情
等。
3 级 : 具备一般的汉语交际能力,能够运用常用词语或句子进行交际,如简单地陈述意愿、叙述
事情、说明理由、表达感情与态度等。

 第一级:经过 80 个课时的汉语学习、掌握 300 个左右的汉语词汇或具有相同水平的学习者可以


参加。
 第二级:经过 150 个课时的汉语学习、掌握 600 个左右的汉语词汇或具有相同水平的学习者可以
参加。
 第三级:经过 250 个课时的汉语学习、掌握 900 个左右的汉语词汇或具有相同水平的学习者可以
参加。

36
对外汉语教学的测试和评估
课后思考题
一、相关概念
水平测试 成绩测试 诊断测试 潜能测试
效度 信度 区分度
二、思考题
1、简述标准化试题与非标准化试题。
2、简述主观性试题和客观性试题。
3、分立式试题和综合性试题。
对外汉语教学的测试和评估
一、测试的类别
(一)水平测试:测量测试对象的第二语言水平。 Proficiency Test 的结果也可以作为新生入学编班的
依据。
(二)成绩测试:课程或课型的测试,也称课程测试。 Achievement Test
(三)诊断测试:就某一具体内容的测试,目的是了解教与学中存在的问题 Diagnostic Test
(四)潜能测试:检查测试对象学习第二语言的潜在能力,也称素质测试。Aptitude Test
二、试卷设计
(一)卷面构成 : 一次考试中的一种试卷叫一个卷面。
卷面的种类有:单项卷面、双项卷面、多项卷面
(二)题类 是试题总体性质的类别。
1、标准化试题和非标准化试题: 命题过程及试题的可靠性程度

2、主观性试题和客观性试题: 阅卷评分

3、分立式试题和综合性试题: 试题 包含的测试内容的特点
(三)题型
(1)卷面构成
• 卷面的种类:单项、双项、多项卷面
• 只测验一个项目的叫单项卷面,测验两个项目的叫双项卷面,测验三个或四个项目的叫多项卷
面.
单项四种:听力、说话(口语)、阅读、写作(写话);
双项六种:听和说、听和读、听和写、读和说、说和写、读和写;
多项四种:听读说、读写说、听读写、听读说写。
(2)题类
• (1)标准化试题和非标准化试题。这是从命题过程和试题的可靠性程度的角度划分出来的类。
标准化试题是经过反复试测和筛选确定下来的试题.具有较高的可靠性和相对稳定性.
非标准化试题一般是任课教师自己准备的试题,没有经过反复试测和筛选。

37
• (2)主观性试题和客观性试题.这是从阅卷评分的角度划分出来的类。
评分时需要阅卷人做出主观判断的叫主观性试题;
有固定的客观评分标准、不需要阅卷人做出主观判断的叫客观性试题.
例如,说话,写作(写话)等方面的试题部属于主观性试题,多项选择题属于客现性试题,这两类试题都
有各自的优点和缺点。
• (3)分立式试题和综合性试题。这是根据试题所包含的测试内容的特点划分出来的类。
对有关的语言点分别进行测验的试题叫分立式试题,
对有关的言语技能和相应的言语交际技能进行综合测验的试题叫综合性试题。
例如,填空、改错,多项选择等题型都属于分立式试题,听力理解,说话,阅读理解以及写作
(写话)等方面的试题都属于综合性试题。
有些综合性试题中往往要包含分立式试题。例如,听力理解和阅读理解方面的试题往往要通过填空,
多项选择等方式来完成。
* 常用的综合性试题的题型
• 听力理解测试试题的常用题型:
(1)听后选择正确答案(双项、三项或多项选择)
(2)听后填空
(3)听后填表
• 阅读理解测试试题的常用题型:
(1)读后选择正确答案(双项、三项或多项选择)
(2)读后填空
(3)读后填表
• 说话(口语)测试试题的常用题型:
(1)回答问题
(2)看图说话或回答问题
(3)根据指定的题目自由表达
• 写作(写话)测试试题的常用题型:
(1)连句成段(把所给的几句话连成一段话并加标点符号,或用序号排定几句话的顺序)
(2)看图回答问题,或写话,或作文
(3)写应用文或填表
(4)命题作文
• 由于各项言语技能之间有一定的连带关系,也可以出同时测试双项或多项技能的试题。常用的
双项或多项技能测试试题的题型有:
(1)听写(同时测验听和写的能力)
(2)听后回答问题(口头回答 同时测验听和说的能力;笔头回答 同时测验听和写的能力)
(3)听后口头复述(同时测验听和说的能力)
(4)听后写大意(同时测验听和写的能力)

38
(5)]听课记笔记(测验边听边记的能力)
(6)读后回答问题(口头回答—一同时测验读和说的能力:笔头回答――同时测验读和写的能力)
(7)读后口头复述(同时测验读和说的能力)
(8)读后写大意(同时测验读和写的能力)
双项或多项技能试题的主要缺点是不容易判断某一项技能的成绩或水平是否受到其他技能的影
响,因此难以做到测量的精密化,也难以实现标准化。大规模的正式测试不宜采用这类试题。
• 语音测试试题的常用题型;
[1]听写音节
[2]听时填声母.韵母
[3]听时标调号
[4]听时时标句重音和语调
[5]朗读音节、词组,注意声、韵、调
[6]朗读句子、短文,注意句重音和语调
以上[1 4]是辨别音调能力的测验,[5 6]是语音表达能力的测验。
• 汉字测试试题的常用题型:
[1]给汉字注音
[2]在—组词、词组或句子中标出同音字
[3]在包含形同音异的一组词、词组或句子中给同形字注音
[4]在一组字,词,词组或句于中标出相同的偏旁、部首
[5]在所给的汉字中选择唯一恰当的填空(双项、三项或多项选择)
[6]改正错别字
[7]根据拼音写汉字
[8]听写汉字、词、词组、句子、短文
[9]用汉字填空(用汉字完成词、词组,句子、短文)
以上[1—5]是认字能力的测验,[6]是认字和写字能力的测验, [7—9]是写字能力的测验。
• 词汇测试试题的常用题型:
[1]给学过的词注音
[2]选择适当的近义词填空
[3]选词填空(双项、三项或多项选择.检验词形和词义识别)
[4]用汉语解释词义(口头或笔头)
• 语法测试试题的常用题型:
[1]改正错句
[2]把指定的词语放在可供选择的位置上(双项、三项或多项选择)
[3]从所给的词语中选择适当的词语填空(双项、三项或多项选择)
[4]综合填空

39
三、试卷质量的衡量标准
1、效度:也叫有效性,是指是否达到测试目的。
保证高效度应注意:试题内容的覆盖面要全;试题量与测试时间要协调;避免试题间相互暗示答案。
2、信度:指测试结果的可靠程度和稳定性。
保证高信度应注意:题量要适中,题量越少,偶然性越大,信度越低;
主观性试题信度较低,客观性试题信度较高。
3、区分度:指测试区分受试者水平差异的性能。
保证高区分度应注意:试题的难度要保证一定的比例和跨度。
(1)效度(validity)
• 保证卷面效度的关键是卷面的测试项目和测试内容要与测试目的相一致。也就是说,该测的一
定要测到,不该测的不要涉及。
• 例如,如果要全面测量阅读理解能力,就必须设计含有有关的汉字、词汇、语法、文化、语用
等方面的知识的综合性阅读试题,而不应当设计只含有某一两个方面的知识的分立式试题。
• 阅读理解必须有—定的速度,因此卷面的长度必须与测试的时间相一致,如果卷面太短,就测
不出阅读速度。这就是该测的一定要测到。
• 又如,测量阅读理解能力只能设计测量阅读能力的单项卷面,如果试卷上既有阅读方面的试题,
又有写作方面的试题,就不能精确地测量出阅读理解能力。
• 阅读理解既需要一定的语言知识,又需要一定的文化知识,如果文化知识太专,超过了多数测
试对象的知识范围,也达不到测试目的,因为难以判断是语言能力方面的问题,还是文化能力
方面的问题。这就是不该测的不要涉及。
(2)信度(reliability)
• 信度也叫可靠性,是指同一个卷面和难易程度相同的试题用于水平基本相同的测试对象,测试
结果是否基本相同。
• 讲求信度的目的是保证试卷的稳定性,这对不同类型的测试有不同的意义。
• 对水平测试来说,试卷的稳定性可以保证达到同一分数线的测试对象具有基本相同的水平;
• 对成绩测试来说,试卷的稳定性除了可以保证达到同一分数线的测试对象具有基本相同的水平
以外,还可以反映教学的变化情况,如果这一届学生的成绩比上一届普遍提高了,就说明教学
质量提高了;如果这—届学生的成绩比上一届普遍降低了,就说明教学质量降低了。
• 卷面信度是由多方面的因素决定的:
• 一是卷面构成,对卷面构成的基本要求是测试项目安排合理,测试内容有一定的覆盖面和代表
性。
• 二是题数。难易程度相当的同类题型的题效越多,信度也越高。
• 三是评分标准和评分办法。评分标准越客观,评分办法越科学,信度越高。与此有关的是题型。
一般说来,主观性试题的信度较低,客观性试题的信度较高。
(3)区分度
• 这是指试卷能不能客现地反映测试对象的水平差异。
• 水平测试的目的是测量测试对象的语言水平,要用同—个卷面去测试水平相差悬殊的测试对象,
所以试卷必须有相应的区分度。
• 成绩测试最好也有一定的区分度。
• 形成区分度的关键是卷面试题的难易程度有一定的跨度,卷面长度适度,卷面试题的排列由易
到难逐渐过渡。
• 如果难易程度跨度太小,就难以区分不同的水平;

40
• 如果卷面太短或太长,应试者就难以得到充分发挥,水平较高者尤其难以得到充分发挥;
• 如果不是由易到难逐渐过渡,应试者就不能正常发挥,水平较低者更不能正常发挥。
中国汉语水平考试(HSK)介绍
• 中国汉语水平考试(HSK)是为测试母语非汉语者(包括外国人、华侨和中国少数民族考生)
的汉语水平而设立的国家级标准化考试。
• 中国汉语水平考试(HSK)由北京语言大学汉语水平考试中心设计研制,包括基础汉语水平考
试〔简写为 HSK(基础)〕,初、中等汉语水平考试〔简写为 HSK(初、中等)和高等汉语水
平考试〔简写为 HSK(高等)〕。
• 中国汉语水平考试(HSK)每年定期在中国国内和海外举办,凡考试成绩达到规定标准者,可
获得相应等级的《汉语水平证书》。
1. HSK 的适用对象
• HSK(基础)适用于具有基础汉语水平的汉语学习者,也就是接受过 100-800 学时现代汉语正规
教育的学习者(包括具有同等学历者)。
• HSK(初、中等)适用于具有初等和中等汉语水平的汉语学习者,也就是接受过 400-2000 学时
现代汉语正规教育的学习者(包括具有同等学历者)。
• HSK(高等)适用于具有高等汉语水平的汉语学习者,也就是接受过 3000 学时和 3000 学时以上
的现代汉语正规教育的学习者(包括具有同等学历者)。
2. 《汉语水平证书》的效力
(1)作为达到进中国高等院校入系学习专业或报考研究生所要求的实际汉语水平的证明。
(2)作为汉语水平达到某种等级或免修相应级别汉语课程的证明。
(3)作为聘用机构录用人员时评价其汉语水平的依据。
3. 主办单位和发证机关
HSK 的主办单位是国家汉语水平考试委员会,具体事务由国家汉语水平考试委员会办公室和北
京语言大学汉语水平考试中心负责。
4. 考试时间和考点
 中国大陆地区,每年固定举办 HSK 考试。
 港澳台地区,以及国外考点,根据当地具体情况安排考试。
 汉语水平考试每年定期在中国国内和海外同步举办。从 2010 年起,新 HSK 将会全面取代 HSK。
 新 HSK 分笔试和口试两部分,笔试和口试是相互独立的。
 笔试共 6 级,新 HSK 一、二、三级为汉语入门测试,四级将与原 HSK(基础)相对应,新
HSK 的五级将与原 HSK(初中等)相对应,六级将与原 HSK(高等)相对应。
 口试则采用录音形式,分为初级、中级和高级三个级别。
 凡考试成绩达到规定标准者,可获得相应等级的《汉语水平考试成绩报告》,亦有机会获得
中国国家留学基金管理委员会颁发的“HSK 优胜者奖学金”。
 通过 HSK 一级的考生可以理解并使用一些非常简单的汉语词语和句子,满足具体的交际需求,
具备进一步学习汉语的能力。
 通过 HSK 二级的考生可以用汉语就熟悉的日常话题进行简单而直接的交流,达到初级汉语优
等水平。
 通过 HSK 三级的考生可以用汉语完成生活、学习、工作等方面的基本交际任务,在中国旅游
时,可应对遇到的大部分交际任务。

41
 通过 HSK 四级的考生可以用汉语就较广泛领域的话题进行谈论,比较流利地与汉语为母语者
进行交流。
 通过 HSK 五级的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演
讲。
 通过 HSK 六级的考生可以轻松地理解听到或读到的汉语信息,以口头或书面的形式用汉语流
利地表达自己的见解。
考试用途
 新 HSK 延续原有 HSK 一般(或通用)汉语能力考试的定位,面向成人汉语学习者。其成绩
可以满足多元需求:
1.为院校招生、分班授课、课程免修、学分授予提供参考依据。
2.为用人机构录用、培训、晋升工作人员提供参考依据。
3.为汉语学习者了解、提高自己的汉语应用能力提供参考依据。
4.为相关汉语教学单位、培训机构评价教学或培训成效提供参考依据。

42

También podría gustarte