1672-8505

CN 51-1675/C

对外汉语界汉字书写偏误分析的实证研究

牛士伟

牛士伟. 对外汉语界汉字书写偏误分析的实证研究[J]. 西华大学学报(哲学社会科学版), 2017, 36(5): 33-38, 86.
引用本文: 牛士伟. 对外汉语界汉字书写偏误分析的实证研究[J]. 西华大学学报(哲学社会科学版), 2017, 36(5): 33-38, 86.
NIU Shi-wei. An Empirical Research on Errors for Chinese Character Writing in the Field of Chinese as a Foreign Language[J]. Journal of Xihua University (Philosophy & Social Sciences) , 2017, 36(5): 33-38, 86.
Citation: NIU Shi-wei. An Empirical Research on Errors for Chinese Character Writing in the Field of Chinese as a Foreign Language[J]. Journal of Xihua University (Philosophy & Social Sciences) , 2017, 36(5): 33-38, 86.

对外汉语界汉字书写偏误分析的实证研究

作者简介: 牛士伟(1982—),男,国家汉办孔子学院专职讲师,天津外国语大学教师,研究方向为心理语言学

中图分类号: H08;H195

An Empirical Research on Errors for Chinese Character Writing in the Field of Chinese as a Foreign Language

  • 摘要: 文章统计了1990—2016年175篇关于汉字书写偏误研究的文献,在Corder(1974)的偏误分析步骤的基础上,从确定研究对象、搜集语料、鉴别偏误、描述偏误、评估偏误和解释偏误六方面梳理了汉字偏误的研究情况。文章通过对以往的研究进行反思,得出结论:未来研究应在被试的选择上更加多元;在搜集语料上,应充分考虑语料的自然性和真实性、语言的获取途径及数据统计的便捷性;在偏误鉴别上,应综合考虑使用频率和生成者能否自行纠正两个标准,分别在个体层面和群体层面上鉴别偏误等。
    Abstract: Based on the statistics of 175 articles about Chinese character written from 1990 to 2016, this paper elaborates the research situation of errors of Chinese character writing from determining the object of study, collecting corpus, identifying errors, describing errors, evaluating errors and interpreting errors on basis of error analysis put forward by Corder in 1974. Through reflecting on past research, this paper got conclusions as followed: The research in future should cover three aspects: a) more multivariate choices on participants, b) considerate naturalness and authenticity, the way that language acquirement and the convenience for statistics when collecting corpus, c) comprehensively considerate two standards including the frequency for using and whether corrected by learners themselves, and identify errors on individual and group level respectively and so on.
  • 鲁健骥于1984年将二语习得的中介语理论引入到对外汉语教学中来,在随后的几十年里,陆续出现了很多关于汉语词汇、语音、篇章和语法等各类偏误研究的文献,而针对汉字书写偏误的研究始于20世纪90年代[1]。截止到2017年4月1日,在中国知网上以“篇名”为筛选字段,分别以“汉字偏误”和“书写偏误”为检索词,共检索到298篇文献,剔除少数民族研究、语音偏误研究和其他无关研究后,同时加上其他检索词如“汉字习得”和“汉字书写”的相关文献9篇,文章共搜集到175篇关于汉字书写偏误研究的文献。2011年以前仅有27篇文献,2011年的文献数量骤增,2011—2013年与2014—2016年的文献数量差别不大,根据文献数量变化的情况,本文将偏误研究分为早期(1990—2010)、中期(2011—2013)和近期(2014—2016)三个阶段。因此,文章以175篇文献中的数据为依据,从上述三个阶段讨论汉字书写偏误的发展情况。此外,Corder(1974)提出了偏误分析的5个步骤:搜集语料、鉴别偏误、描写偏误、解释偏误和评估偏误(于红英,2015)[2]14。在汉字书写偏误研究中,不同年龄层次的研究对象的语料搜集方式并不相同(滕凤,2012)[3]。研究对象的个人信息如国别、汉语水平及个性特征等还会影响到研究结论的适用性。因此,文章在Corder(1974)的偏误分析步骤的基础上,从确定研究对象、搜集语料、鉴别偏误、描述偏误、评估偏误和解释偏误六方面来阐述汉字书写偏误的研究过程。

    确定研究对象是汉字书写偏误分析的第一步。研究对象制约着语料的搜集方式,影响着研究结果的推广与应用。文章统计了175篇文献的研究对象,详见表 1。从母语背景上看,主要分为汉字文化圈的学习者和非汉字文化圈的学习者;从区域分布上看,主要分为亚洲地区(除日韩外)的学习者、日韩地区的学习者、欧美地区的学习者、非洲地区的学习者和南美地区的学习者;从汉语水平上看,主要分为初级学习者、中级学习者、高级学习者和混合级别的学习者(同时包括初级、中级或高级两个及以上级别的学习者)和不同年级水平的学习者(按学习年限划分学习者);从年龄层次上看,主要分为小学生、中学生、大学生(不包括留学生)、留学生和社会成人;从国别构成上看,主要分为单一国别的学习者和混合国别的学习者(单一国别的学习者涵盖27个国家,以泰国、韩国、日本和俄罗斯为主);从被试性质上看,主要分为在华留学生和本土学生。

    表  1  175篇文献研究对象的基本情况 (单位:%)
    参数 母语背景 区域分布 国家分布
    汉字圈 非汉字圈 亚洲(除日韩) 日韩 欧美 非洲 南美 泰国 韩国 日本 俄罗斯
    百分比 18.9 61.7 41.1 14.3 12 4 1.7 19.8 15.1 10.4 10.4
    总和 80.6 73.1 55.7
    总占比 32.6
    参数 国别构成 汉语水平
    1990-2010单一国别 2011-2013单一国别 2014-2016单一国别 1990-2010混合国别 2011-2013混合国别 2014-2016混合国别 初级 中级 高级 混合 年级
    百分比 33.3 61.4 69.2 66.7 38.6 30.8 32.6 7.4 12 21.1 8
    总和 81.8
    总占比
    参数 年龄层次 被试性质
    小学生 中学生 大学生 留学生 社会人士 1990-2010留学生 2011-2013留学生 2014-2016留学生 1990-2010本土学生 2011-2013本土学生 2014-2016本土学生
    百分比 6.9 14.3 11.4 48 2.3 81.5 41.4 42.3 14.8 31.4 37.2
    总和 82.9
    总占比
    下载: 导出CSV 
    | 显示表格

    表 1体现了研究对象的三个特征和两个趋势。三个特征,一是研究对象在母语背景、区域分布和国家分布上呈现出不均衡性。主要表现在非汉字文化圈的研究显著多于汉字文化圈的研究,亚洲地区(除日韩外)的研究显著多于其他地区的研究,仅泰、韩、日、俄四国的研究就占国别研究的55.7%,占全部研究的32.6%:这些都表明研究对象在母语背景、区域分布和国家分布上失衡。二是研究对象在汉语水平上以初级阶段的学习者为主。三是研究对象在年龄层次上以留学生为主。大学生(含留学生)研究占全部研究的59.4%,而留学生研究占大学生研究的81.8%,因此,研究对象实际上是以在华留学生为主。两个趋势,一是国别化研究的倾向。在国别构成上,单一国别的研究呈递增的趋势,体现出国别化研究的倾向。二是以留学生为被试的研究和以本土学生为被试的研究趋于平衡。在被试性质上,对留学生的研究和对本土学生的研究差距逐渐缩小,表明对留学生的研究与对本土学生的研究趋于平衡。

    自然条件下产生的语言素材是材料搜集的目标(蒋祖康,1999)[4]26。此外,张瑞朋(2012)认为还应选取反映学生真实水平的语料[5]132。因此,语料的自然性和真实性决定了研究的有效性。自然性指的是学生运用语言的常态程度。真实性指的是语料反映学生当前语言水平的程度。文章统计了175篇文献语料的搜集方式,共有七类:第一类是以课堂笔记、练习或课后作业为语料,这类语料具有自然性强而真实性弱的特点;第二类是以考试试卷为语料,这类语料具有真实性强而自然性弱的特点;第三类是以课堂笔记、练习或课后作业加考试试卷为语料,这类语料具有自然性和真实性都强的特点;第四类是以课堂笔记、练习或课后作业加考试试卷再加听写材料为语料,这类语料不仅兼顾到自然性和真实性,而且还考虑到语言的获取途径;第五类是通过问卷方式搜集语料,由于调查形式、回收方式不同,因此这类语料同样存在自然性和真实性不确定的问题,但由于这类语料通常限定了考查内容,因此适合进行数据分析;第六类是通过听写方式搜集语料,这种方式主要见于早期研究中,并被认为是偏误产生的主要来源(和平海,2013;郁文卿,2014)[6][7];第七类是通过多种方式(除第三、四类方式外)搜集语料,这种方式更好地平衡了语料的自然性和真实性,突出了语料来源的多样性,主要见于新近研究中。依据上述分类,175篇文献语料搜集方式详见表 2

    表  2  175篇文献语料的搜集方式(单位:%)
    作业 试卷 作+试 作+试+听 问卷 听写 混合 总和
    1990—2010 14.8 3.7 7.4 18.5 3.7 7.4 7.4 62.9
    2011—2013 5.7 21.4 17.1 25.7 8.6 2.9 7.1 88.5
    2014—2016 14.1 16.7 14.1 23.1 9.0 1.3 10.3 88.6
    1990—2016 10.9 16.6 14.3 23.4 8.0 2.9 8.6 84.7
    下载: 导出CSV 
    | 显示表格

    表 2可知:横向来看,无论哪个时期,“作+试+听”都是最主要的语料搜集方式,这可能与语料的性质密切相关。纵向来看,首先,以问卷方式搜集语料的研究呈递增的趋势。可能是由于这种方式限定了考查内容,便于统计分析,因此逐渐受到研究者的青睐。其次,以混合方式搜集语料的研究呈增长的趋势(2011—2013年略有下滑)。可能是由于这种方式更加注重平衡语料的自然性和真实性,同时突显了语料来源的多样性,因此也越来越受到研究者的重视。再次,通过听写方式搜集语料的研究呈递减的趋势。可能是由于语料的搜集方式倾向于多样化,数据分析倾向于精细化,因此势必压缩早期传统以听写方式搜集语料的研究。最后,整体上看,上述七类搜集方式之和呈递增的趋势,表明语料的搜集方式有向上述七类方式集中的倾向。

    在汉字书写偏误研究中,鉴别偏误指的是辨别学习者的书写错误属于偏误还是失误。偏误是系统的、有规律性的错误,是二语习得中的普遍现象,主要是由学习者没掌握目的语的语言规律而造成的偏误,而失误是非系统的、无规律性的错误,主要是由学习者的疲劳、紧张、注意力不集中等偶然性因素引起的错误(段科慧,2015)[8]。鉴别偏误之于偏误研究如同源头之于活水,是偏误研究存在的前提。遗憾的是,在众多的汉字书写偏误研究中,很少有人意识到这个问题。本文统计了175篇文献鉴别偏误的情况,见表 3

    表  3  175篇文献鉴别偏误的情况(单位:%)
    时间 鉴别偏误 真/有
    无鉴别 有鉴别(真鉴别)
    1990—2010 81.5 18.5(11.1) 60
    2011—2013 72.9 27.1(8.6) 31.7
    2014—2016 65.4 34.6(14.1) 40.8
    1990—2016 70.9 29.1(10.9) 37.5
    下载: 导出CSV 
    | 显示表格

    首先,纵向来看,有鉴别偏误的研究呈递增的趋势,表明鉴别偏误越来越受到研究者的重视。其次,整体上看,只有29.1%的文献中有偏误鉴别,但由于鉴别的标准各不相同,因此不同研究的结论也不相同。文章认为,偏误鉴别需包含两个层面。一是个体层面上的鉴别,即如何判定个体出现的错误。具体体现在同一人对同一字的相同错误只记一次,表明这个人在这个字上存在某类偏误;同一人对同一字的不同错误分别记录,表明这个人在这个字上有不同类型的错误,可视为个体层面上的类偏误。类偏误是指介于错误和偏误之间,从错误类型上看属于错误,而从错误对象上看则属于偏误。二是群体层面上的鉴别。即如何从个体上的错误来判定群体的偏误。具体体现在不同人对同一字的相同偏误按人次记,表明不同人在这个字上存在某类偏误;不同人对同一字的不同偏误分别记录,表明不同人在这个字上有不同类型的错误,可视为群体层面上的类偏误(同上)。将同时满足个体层面和群体层面鉴别要求的研究视为真鉴别研究。从整体上看,只有10.9%的研究采用了真鉴别方式,占有鉴别的37.5%,表明汉字书写偏误研究的鉴别方式混乱;从不同时期上看,1990—2010年真鉴别占有鉴别的60%,表明早期研究的鉴别方式相对集中,主要以真鉴别为主;2011—2013年真鉴别占有鉴别的31.7%,表明该时期鉴别方式多样化,出现了不同形式的鉴别方法(钟宝娟,2011;刘树苓,2013)[9][10]12;2014—2016年真鉴别占有鉴别的40.8%,表明近年来鉴别方式稳中有变,一方面延续传统的真鉴别方式,另一方面也在尝试新的鉴别方法(张信强,2015;杨丽娟,2015)[11][12]

    描述偏误指的是以目的语为基准,对学习者偏误进行语言表面特征的描述(蒋祖康,1999)[4]27。在描述汉字书写偏误时,目前沿用的方法还是以学习者语言操作策略的表层策略分类法为主。排除21篇针对特定偏误类别如笔顺、笔画和部件的研究,文章统计了154篇文献偏误分类的方式,发现有四类。一是将偏误汉字分为错字和别字,错字从笔画、部件和整字上划分,别字从形近、音近或义近上分类,记为“错别字”,该类又细化为三个小类:第一,将错字在笔画、部件上划分,别字在音近、形近上分类,记为“错1”;第二,将错字在笔画、部件和结构上划分,别字在音近、形近上分类,记为“错2”;第三,将偏误汉字在笔画、部件和结构上划分,记为“错3”。二是在错别字的基础上,进一步将错字分为非字和假字,从非字、假字和别字的角度归类,记为“非假别”。三是从汉字音、形、义的角度归类,记为“音形义”。四是综合运用汉字的音形义、笔画、部件和整字、独体字和合体字等特征归类,记为“混合”,见表 4

    表  4  154篇文献偏误分类的情况(单位:%)
    错别字 非假别 音形义 混合 总和
    错1 错2 错3 总和 总占比
    1990—2010 54.5 0 18.2 72.7 29.6 22.2 5.6 11.1 68.5
    2011—2013 25.9 24.1 3.7 53.7 41.4 3.1 9.2 4.6 58.3
    2014—2016 19.7 18.2 16.7 54.6 46.2 0 1.4 5.6 53.2
    1990—2016 25.2 19.1 11.5 55.8 41.7 3.9 5.2 5.8 56.6
    下载: 导出CSV 
    | 显示表格

    表 4可知,横向来看,首先,1990—2010年“错1”“错2”和“错3”之和占错别字的72.7%,表明早期错别字下的偏误主要集中在上述三种分类上。另外,该时期所有分类之和为68.5%,表明早期的偏误分类相对集中,主要集中在“错1”和“非假别”上。其次,从整体上看,与错别字相比,其他偏误分类方式的比例很小,表明汉字书写偏误主要集中在“错1”“错2”和“错3”三种分类上。纵向来看,首先,“错1”“错2”和“错3”之和在不同时期均占到错别字的一半以上,表明上述三种偏误是错别字的主要形式。其次,“错1”“错2”和“错3”之和的总占比呈递增的趋势,而从整体上看,各分类占全部的比例呈递减的趋势,表明在上述三种偏误增多的趋势下,其他分类有削弱的倾向,这可能与不断创新研究方法而导致归类方式的变化有关。横纵交叉来看,尽管“错1”随时间推移递减,但始终是错别字下的首要分类方式。结合2014—2016年“错1”“错2”和“错3”的比例来看,近年来上述三种分类方式在错别字下的分布相对均衡。

    文章将评估偏误放在描述偏误之后,这与研究的实际情况相一致(大多文献都是在描述偏误的结尾评估偏误),同时也可以促使研究者对偏误的解释更深刻、更全面(于红英,2015)[2]14。评估偏误关注的是读者或听者对偏误的反应,而在汉字书写偏误研究中,评估偏误指的是读者对偏误汉字影响到交际的严重程度做出的判断,即是否有些偏误比其他偏误更严重。文章统计的175篇文献评估偏误的方式分为两大类。一是没有偏误评估,其中含两个小类:第一小类是既没有统计出各偏误类别的比例,也没有评估偏误,记为“无1”;第二小类是仅统计出各偏误类别的比例,但没有评估偏误,记为“无2”。二是有偏误评估,其中含三个小类:第一小类是在各偏误类别间评估偏误,记为“有1”;第二小类是就各偏误类别在不同等级或年级间评估偏误,记为“有2”;第三小类是既在各偏误类别间评估偏误,也就各类偏误在不同等级或年级间评估偏误,记为“有3”。见表 5

    表  5  175篇文献评估偏误的情况(单位:%)
    无评估 有评估
    无1 无2 总和 有1 有2 有3 总和
    1990—2010 48.2 7.4 55.6 37.0 7.4 0 44.4
    2011—2013 37.2 20.0 57.2 31.4 11.4 0 42.8
    2014—2016 29.5 12.8 42.3 42.3 9.0 6.4 57.7
    1990—2016 35.4 14.9 50.3 37.1 9.7 2.9 49.7
    下载: 导出CSV 
    | 显示表格

    表 5可知,第一,整体上看,有评估的研究与无评估的研究基本持平,各占一半。第二,无论哪个时期,“无1”都是无评估下的主要评估方式,表明汉字书写偏误研究在偏误评估方面亟待加强。第三,有评估的研究呈增长的趋势(2011—2013年略有下滑),表明偏误评估越来越受到研究者的重视。第四,“有3”在前两个时期都没有相关研究,只在近期才发现了5篇文献,表明这种纵横交错的新型评估方式正在兴起。第五,无论哪个时期,“有1”都是有评估下的主要评估方式,其次是“有2”和“有3”,这可能与研究对象和研究目的有关,更多的研究只进行了横向分析,而缺乏历时性追踪。第六,“无1”的研究呈递减的趋势,表明近年来汉字书写偏误研究中有定量分析的倾向。

    偏误分析的主要目的就是要找出学习者产生偏误的原因,通过分析原因找到解决问题的办法。目前,解释偏误的方法一般有两类:一是在描写偏误的基础上通过理性分析得出偏误原因,尽管通过理性分析得出的原因无可厚非,但缺少与研究对象的核实也实属问题;二是在描写偏误的基础上结合问卷调查或个案访谈来了解被试产生偏误的原因,也叫三角测定法(安然、单韵鸣,2007)[13],这种方法减少了由单纯的理性分析得出结论的片面性,更能接近偏误原因的本来面貌。当然,有些研究尽管在方法上采用了三角测定法,但在具体实践中并没有就学习者的偏误与其讨论相关原因,文章认为这是有折扣的三角测定法,与此对应的是真三角测定法。排除没有涉及偏误原因的19篇文献,文章统计了156篇文献的偏误原因,发现有三大类:一是与汉字特点相关的因素,二是与学习者特征相关的因素,三是与教师教材相关的因素。详见表 6表 7

    表  6  156篇文献偏误解释情况(单位:%)
    时间 偏误解释
    理性 三角(真三角)
    1990-2010 94.7 5.3(5.3)
    2011-2013 71.4 28.6(15.9)
    2014-2016 71.6 28.4(13.5)
    1990-2016 74.4 25.6(13.5)
    下载: 导出CSV 
    | 显示表格
    表  7  156篇文献偏误原因情况(单位:%)
    分类 百分比
    汉字 字形 34
    字音 26.9
    结构 23.1
    笔画 18.6
    部件 14.1
    学习者 母语迁移 67.3
    学习策略 37.8
    学习动机 30.8
    正字法 25.6
    部件意义 19.2
    教师教材 教学方法 39.7
    汉字教材 32.7
    书写技能 18.6
    汉字教学 16.0
    课程设置 14.1
    下载: 导出CSV 
    | 显示表格

    表 6可知,在偏误解释方面,从横向上看,不同时期的解释方法都是以理性分析为主,三角测定为辅。从整体上看,理性分析与三角测定的比例约为3比1,而真三角约为三角测定的一半,表明汉字书写偏误研究在偏误解释上普遍存在主观性过强而客观性不足的特点。由表 7可知,在偏误原因方面,与汉字特点相关的因素依次为形似、音近、结构复杂、笔画多和部件多,这与上文描述偏误中错别字下的分类是一致的;与学习者特征相关的因素依次为母语负迁移、学习策略失当、学习动机不足、缺乏正字法认知和部件表义混淆,表明学习者的个性特征也是偏误产生的重要因素;与教师教材相关的因素依次是教法陈旧、缺乏汉字教材、忽视书写技能的训练、轻视汉字教学和课程设置不合理,与教材相比,教师因素是偏误原因的重要来源。此外,目的语的泛化(19.2%)、学习者的认知心理(16.7%)以及教师书写习惯的误导(10.9%)等因素也应得到关注。

    汉字书写偏误研究始于上世纪90年代,至今已近三十年。目前基本形成了以确定研究对象、搜集语料、鉴别偏误、描述偏误、评估偏误和解释偏误为核心的研究框架。文章统计了175篇汉字书写偏误文献,发现各环节中都存在一些问题。为今后更好地开展汉字偏误研究、促进对外汉语教学,文章认为有必要对以往的研究进行反思。

    第一,在确定研究对象时,除研究对象在母语背景、地区分布和国家分布上表现出不均衡性外,整体上看,约一半的汉字偏误研究都是以在华留学生为研究对象,缺少不同年龄段学生间的对比,研究结论具有狭隘性。未来研究应考虑在不同母语背景、地区、国家、年龄层次、汉语水平和被试性质的选择上更加多元,扩大研究结论的适用性。第二,在搜集语料时,语料的自然性与真实性、语言的获取途径是语料搜集时的基本问题,这与上文“作+试+听”作为最主要的语料搜集方式是一致的。鉴于近年来问卷方式在数据统计方面显示出的便捷性,未来研究应将语料的自然性与真实性、语言的获取途径以及数据统计的便捷性作为搜集语料时的基本考量,以期搜集到更加可靠的语言素材。第三,在鉴别偏误时,Ellis(1994)提出了两条标准:一看使用频率,二看生成者能否自行纠正(刘树苓,2013)[10]12。以往的研究大都以第一条标准为依据,刘树苓(2013)同时考虑到两条标准:“同一篇书写材料中同一个字出现三次以上,书写错误至少两次以上才能界定为偏误。”[10]12另外,七成研究中没有鉴别偏误,而在三成鉴别研究中仅有一成是真鉴别研究,即分别在个体层面和群体层面上鉴别偏误。未来研究应综合上述两条鉴别标准,分别从个体层面和群体层面上鉴别偏误。第四,在描述偏误时,近年来,随着其他学科理论的介入,呈现出一些特有的分类方式,如张瑞朋(2012)[5]134(2014)[14]撇开错字和别字的分类,从笔画、部件和整字三个层级上,根据标准数学范畴如遗漏、误加、误代、错位和杂糅对各个层级的偏误进行分类。张军(2015)[15]从朴素的二维图形的角度出发,以笔画为基本单位,从时间和空间的维度上构建汉字偏误的描述体系。未来研究应借鉴其他学科理论的研究成果,创新偏误分类方法,使偏误描述更全面、细致和科学。第五,在评估偏误时,大多研究都将评估偏误作为描述偏误中的一部分,仅在描述偏误的结尾根据偏误比例进行简单评估。此外,由于近期历时性研究的增加,纵横交错的新型评估方式为评估偏误提供了新思路。未来研究应在重视偏误评估的基础上尝试纵横交错的评估方法,使研究者对学习者的偏误做出更全面、准确的判断。第六,在解释偏误时,目前的研究仍是以理性分析为主,三角测定尤其是真三角测定的研究还很欠缺。汉字特点、学习者特征和教师教材因素是偏误产生的主要来源,然而每个因素对偏误的贡献率还不得而知,仅从偏误原因的比例来看,学习者的母语负迁移、学习策略不当、教师的教法陈旧及汉字的形似似乎对偏误的产生起到了重要作用。未来研究除了要强化三角测定法的应用,还要探索不同因素对偏误产生的贡献率,以便更有针对性地进行教改。

    汉字书写偏误研究为对外汉语教学中的汉字教学提供了理论依据和实践保障。为更好地推动汉字书写偏误研究,在被试选择上,未来研究应在母语背景、地区、国家、年龄层次、汉语水平和被试性质的选择上更加多元;在语料搜集上,应充分考虑语料的自然性与真实性、语言的获取途径以及数据统计的便捷性;在偏误鉴别上,应综合考虑使用频率和生成者能否自行纠正这两个标准,分别在个体层面和群体层面上鉴别偏误;在偏误描述上,应借鉴其他学科理论的研究成果,创新偏误分类方法;在偏误评估上,应重视偏误评估,借鉴纵横交错的新型评估方式;在偏误解释上,应与学习者探讨偏误产生的原因,同时探索不同因素对偏误产生的贡献率。只有不断推动汉字书写偏误的理论研究,汉字教改才能做到有的放矢。

    注释:

    ① 由于一些文献在某些变量上缺失,而某些变量内部又存在交叉现象,因此变量总和并非100%;在国家分布上,“总和”指的是泰、韩、日、俄四国文献数之和占单一国别研究文献数的比例,“总占比”指的是泰、韩、日、俄四国文献数之和占全部175篇文献数的比例。

    ② 错别字下的“总和”指的是“错1”“错2”和“错3”的文献数之和占错别字文献数的比例,错别字下的“总占比”指的是“错2”和“错3”的文献数之和占全部154篇文献数的比例,表中最后一栏“总和”指的是“错1”“错2”“错3”、非假别、音形义和混合的文献数之和占全部154篇文献数的比例。

    ③ 由于每篇文献中的偏误原因不止一种,因此每类偏误原因之和并非100%,计算公式=某个偏误原因的文献数/文献总数*100%。

  • 表  1   175篇文献研究对象的基本情况 (单位:%)

    参数 母语背景 区域分布 国家分布
    汉字圈 非汉字圈 亚洲(除日韩) 日韩 欧美 非洲 南美 泰国 韩国 日本 俄罗斯
    百分比 18.9 61.7 41.1 14.3 12 4 1.7 19.8 15.1 10.4 10.4
    总和 80.6 73.1 55.7
    总占比 32.6
    参数 国别构成 汉语水平
    1990-2010单一国别 2011-2013单一国别 2014-2016单一国别 1990-2010混合国别 2011-2013混合国别 2014-2016混合国别 初级 中级 高级 混合 年级
    百分比 33.3 61.4 69.2 66.7 38.6 30.8 32.6 7.4 12 21.1 8
    总和 81.8
    总占比
    参数 年龄层次 被试性质
    小学生 中学生 大学生 留学生 社会人士 1990-2010留学生 2011-2013留学生 2014-2016留学生 1990-2010本土学生 2011-2013本土学生 2014-2016本土学生
    百分比 6.9 14.3 11.4 48 2.3 81.5 41.4 42.3 14.8 31.4 37.2
    总和 82.9
    总占比
    下载: 导出CSV

    表  2   175篇文献语料的搜集方式(单位:%)

    作业 试卷 作+试 作+试+听 问卷 听写 混合 总和
    1990—2010 14.8 3.7 7.4 18.5 3.7 7.4 7.4 62.9
    2011—2013 5.7 21.4 17.1 25.7 8.6 2.9 7.1 88.5
    2014—2016 14.1 16.7 14.1 23.1 9.0 1.3 10.3 88.6
    1990—2016 10.9 16.6 14.3 23.4 8.0 2.9 8.6 84.7
    下载: 导出CSV

    表  3   175篇文献鉴别偏误的情况(单位:%)

    时间 鉴别偏误 真/有
    无鉴别 有鉴别(真鉴别)
    1990—2010 81.5 18.5(11.1) 60
    2011—2013 72.9 27.1(8.6) 31.7
    2014—2016 65.4 34.6(14.1) 40.8
    1990—2016 70.9 29.1(10.9) 37.5
    下载: 导出CSV

    表  4   154篇文献偏误分类的情况(单位:%)

    错别字 非假别 音形义 混合 总和
    错1 错2 错3 总和 总占比
    1990—2010 54.5 0 18.2 72.7 29.6 22.2 5.6 11.1 68.5
    2011—2013 25.9 24.1 3.7 53.7 41.4 3.1 9.2 4.6 58.3
    2014—2016 19.7 18.2 16.7 54.6 46.2 0 1.4 5.6 53.2
    1990—2016 25.2 19.1 11.5 55.8 41.7 3.9 5.2 5.8 56.6
    下载: 导出CSV

    表  5   175篇文献评估偏误的情况(单位:%)

    无评估 有评估
    无1 无2 总和 有1 有2 有3 总和
    1990—2010 48.2 7.4 55.6 37.0 7.4 0 44.4
    2011—2013 37.2 20.0 57.2 31.4 11.4 0 42.8
    2014—2016 29.5 12.8 42.3 42.3 9.0 6.4 57.7
    1990—2016 35.4 14.9 50.3 37.1 9.7 2.9 49.7
    下载: 导出CSV

    表  6   156篇文献偏误解释情况(单位:%)

    时间 偏误解释
    理性 三角(真三角)
    1990-2010 94.7 5.3(5.3)
    2011-2013 71.4 28.6(15.9)
    2014-2016 71.6 28.4(13.5)
    1990-2016 74.4 25.6(13.5)
    下载: 导出CSV

    表  7   156篇文献偏误原因情况(单位:%)

    分类 百分比
    汉字 字形 34
    字音 26.9
    结构 23.1
    笔画 18.6
    部件 14.1
    学习者 母语迁移 67.3
    学习策略 37.8
    学习动机 30.8
    正字法 25.6
    部件意义 19.2
    教师教材 教学方法 39.7
    汉字教材 32.7
    书写技能 18.6
    汉字教学 16.0
    课程设置 14.1
    下载: 导出CSV
  • [1] 鲁健骥.中介语理论与外国人学习汉语的语音偏误分析[J].语言教学与研究, 1984(3).
    [2] 于红英.中级阶段俄罗斯留学生汉字书写偏误研究[D].哈尔滨: 黑龙江大学, 2015.
    [3] 滕凤.广州裕达隆国际学校小学生汉字偏误分析及教学对策[D].广州: 中山大学, 2012.
    [4] 蒋祖康.第二语言习得研究[M].北京:外语教学与研究出版社, 1999.
    [5] 张瑞朋.留学生汉语中介语语料库建设若干问题探讨——以中山大学汉字偏误总结与语料库为例[J].语言文字应用, 2012(2).
    [6] 和平海.俄罗斯学生汉字偏误调查报告——以库班国立大学为例[D].大连: 大连外国语大学, 2013.
    [7] 郁文卿.美国学生汉字习得偏误分析及教学策略[D].兰州: 兰州大学, 2014.
    [8] 段科慧.基于HSK动态作文语料库的日本学生汉语习得偏误分析[D].济南: 山东大学, 2015.
    [9] 钟宝娟.泰国中学生汉字书写偏误分析[D].昆明: 云南大学, 2011.
    [10] 刘树苓.汉字书写偏误研究及其与学习策略的相关性分析[D].福州: 福建师范大学, 2013.
    [11] 张信强.基于HSK动态作文语料库的韩国学生汉字书写的偏误研究[D].烟台: 鲁东大学, 2015.
    [12] 杨丽娟.留学生汉字书写偏误调查分析及汉字纠偏策略[D].哈尔滨: 黑龙江大学, 2015.
    [13] 安然, 单韵鸣.非汉字圈学生的笔顺问题——从书写汉字的个案分析谈起[J].语言文字应用, 2007(3).
    [14] 张瑞朋.语料库汉字偏误分类和标注体系研究[J].云南师范大学学报(对外汉语教学与研究版), 2014(1).
    [15] 张军.留学生书写行为偏误类型体系的建构[J].海外华文教育, 2015(2).
  • 期刊类型引用(0)

    其他类型引用(12)

表(7)
计量
  • 文章访问数:  2944
  • HTML全文浏览量:  1636
  • PDF下载量:  94
  • 被引次数: 12
出版历程
  • 收稿日期:  2017-05-13
  • 刊出日期:  2017-09-09

目录

/

返回文章
返回