韵律模式和语素位置概率对汉语学习者切分歧义词的影响

时间：2024-07-24 14:45:01 来源：网友投稿

鹿士义黄韵

［关键词］词语切分；
韵律模式；
语素位置概率；
基本加工单位

［摘要］在中文文本阅读过程中，读者如何对词语进行分词和识别，基本加工单位是什么，一直存在着争论。本文采用线上词汇命名任务，以汉语母语者和高级水平的二语者为被试，研究韵律模式和语素位置概率对汉语词语切分和识别的影响，并在此基础上探讨基本加工单位的大小问题。研究发现：韵律因素和语素位置概率显著影响词语的切分和识别；
汉语母语者和二语者最大的差异在于二语者加工单位的长度小于母语者，这可能是由于二语者的知觉广度范围较窄导致的。汉语的基本加工单位大小基本遵循“长词优先”原则，同时受韵律特征、语素特征、语言水平等因素的影响。

［中图分类号］H195.3 ［文献标识码］A ［文章编号］1674-8174（2023）01-0043-09

1. 引言

由于汉语的书写系统缺乏词间空格，词边界不清晰，词语的识别与切分会导致以下三种情况：一、词语的识别和切分是同时进行的，是统一的过程（Li等，2009）；
二、由于缺乏词间空格等低水平视觉信息，需要更多地运用高水平的语言特征进行词语切分和识别；
三、在汉语文本中，汉字比詞更加突显。在汉语的基本加工单位这个问题上，学界暂未形成一致看法。因此，本文暂且跳过加工单位是什么的问题，从加工单位的大小切入，探讨汉语词语切分和识别过程会受到哪些高水平的语言特征的影响。

关于汉语基本加工单位的大小问题，目前已有的模型均预测更大的词汇单位更容易被识别出来，即长词优先（Inhoff et al，2005；
Li et al，2009）。在知觉广度范围内，长词（如ABC）优先被选择和识别，内嵌词（即AB）的激活程度较弱。也就是说，人们更加倾向于切分出较大的单位作为基本加工单位。

Zhou等（2018）采用了长度为三个字符的组合型歧义材料进行实验，如“艺术家”，发现内嵌词（艺术）先于整词（艺术家）激活。这一结果可能表明，即使存在长词（多于两音节的词汇），读者可能仍会将两音节相结合并首先激活和识别，不一定存在长词优先激活的现象。相应地，Perfetti等（1999）则提出另一种预测——汉语母语者在阅读时会采用“二字结合策略”，加工单位的大小默认为两个音节的长度。“二字结合策略”得到来自于韵律的支持。冯胜利（2002：78）认为双音节音步是汉语最基本的“标准音步”，双音节化是现代汉语的主要节奏倾向（周有光，1961）。因此，“二字结合策略”是具有理论基础的。

值得注意的是，“二字结合策略”采用的实验材料是长度为三字符、链长为1的歧义字符串，如“照顾客”，因为ABC不成词，在切分上仅存在两字结合的可能性。因此，虽然不能否认“二字结合”策略的运用，但也同样不能否认，只要条件允许，也可能做出三字、四字结合的切分选择。Zang等（2015）的研究结果和“二字结合策略”的预测不一致。当语素A独立成词时，读者更少地把A和其右侧的B结合在一起加工。这意味着二字结合策略的运用会受到语素特性的调节。在一定条件下，汉语的基本加工单位可能小于两个音节。

总的来说，在现有的实验中，歧义字符串长度较小，切分可能性不多，不能很好地验证汉语基本加工单位的大小问题。而出现不同研究结论相左的情况，可能是由于影响加工单位大小的因素尚未厘清，如上文提到的韵律因素和语素特征信息。因此，为了更好地探究汉语基本加工单位的大小及其影响因素，本文拟以歧义字符串ABC和ABCD为材料进行实验，其中AB成词，ABC亦成词，后者CD亦成词。这一类型的歧义字符串存在多种切分的可能性，切分后单位大小不一，能够更充分地考察汉语词语的识别和切分以及切分后加工单位的大小。

2. 影响因素

影响词语切分和识别的因素众多，主要分为低水平视觉信息和高水平语言因素等，前者包括词间空格、词长等，后者包括词频、熟悉度、可预测性等。但本文主要关注韵律信息和语素特征，因为这两个因素关系着“二字结合策略”的应用，影响词语的识别和切分，从而影响基本加工单位的大小。

韵律（prosody），指的是语流中的超音段成分，在声学上表现为基频、时长、强度等（Wagner & Watson，2010）。在汉语中，双音节化是现代汉语的主要韵律节奏倾向（周有光， 1961），汉语韵律对单双音节的组合搭配有特殊要求。汉语的四音节序列绝大多数是按［2+2］这种节奏形式来切分直接成分的（Chao，1975）。四字字符串的自然韵律是［2+2］（冯胜利，2002：101）。［2+2］的韵律组配模式可能影响汉语母语者的词语识别和切分，但汉语学习者是否习得［2+2］的韵律模式，并利用这一模式进行词语的识别和切分还有待进一步探讨。

语素特征同样影响汉语阅读中词汇识别和切分。在众多的语素特征中，位置概率在词语识别和切分中有着非常重要的作用（Kasisopa 等，2013、2016；
Sainio等，2007；
Yen等，2012；
Liang等，2017；
高淇，2018）。在以汉语二语者为对象的研究中，同样发现语素位置对其词汇的识别和切分造成影响（洪炜等， 2010；

陈琳等， 2016；

邢滨钰等， 2018）。但是，语素位置概率对汉语二语者词汇识别或切分影响的研究目前还很少见到。因此，本研究拟操纵语素位于不同位置的概率大小，探究其对汉语学习者词语加工的影响。

本研究拟以歧义词组ABC和ABCD为实验材料，采用线上词汇命名任务，探讨二语者能否利用韵律信息和语素位置概率信息进行词语识别和切分，从而探究汉语加工单位的大小问题。其中，韵律信息具体指［2+2］组配模式，语素位置概率指的是一个语素在词中位于词首或词尾的概率。研究的具体问题如下：

第一，汉语学习者是否受韵律模式的影响，将歧义四字字符串ABCD按照［2+2］的组配模式进行加工，切分出较小的单位——双音节词语，而非“长词”三音节词语？而未有优势韵律模式的歧义词语ABC会出现怎样的切分结果呢？两类歧义词语的切分结果是否不同？

第二，汉语学习者在加工字符串ABC和ABCD时，C的语素位置概率是否会影响切分结果？即，学习者是否会根据C位于词首或词尾的位置概率高低，做出不同的切分呢？

3. 实证研究

3.1 实验设计

本实验采用三因素混合设计。三因素分别为：（1）母语背景：汉语母语者和母语非汉语的二语者；
（2）歧义字符串ABC和ABCD中第三个字符C的语素位置概率；
（3）歧义字符串的韵律组配模式：字符串ABCD存在［2+2］优势韵律模式，而ABC缺乏优势韵律模式。其中母语背景为被试间因素，后两者为被试内因素。

本实验采用词汇命名任务，要求被试在字符串呈现后快速报告第一个看到的包含在歧义字符串的词语，因变量为被试所报告的双音节词或三音节词的情况。

3.2 被试

被试为汉语母语者和汉语二语者各18名。其中，汉语母语者被试中，男、女各9人，均为在校学生；
二语被试中，男7人，女11人，平均年龄为25岁，HSK等级为五级到六级，汉语学习的平均时长为6.1年。

3.3 实验材料

本实验以歧义字符串ABC和ABCD为实验材料。从《汉语水平词汇与汉字等级大纲》挑选AB且ABC成词的词语，并根据C挑选词语CD。所选取的词语大多属于甲级词或乙级词。邀请未参与实验的高级水平汉语学习者15名，采用4点量表对歧义词组中所包含的词AB、ABC、CD进行熟悉度评定。共得到32组歧义词组ABCD和32组歧义词组ABC，熟悉度平均值为3.60。

词AB的平均词频约为6.62万（SD = 1.07），词ABC的平均词频为5.56万（SD = 0.83），词CD的词频为7.63万（SD = 1.88）。方差分析表明，三者的平均词频没有显著差异，F（2，93） = 0.195 （p > 0.05），事后分析表明，词AB和词ABC之间（p = 0.752 > 0.05）、词AB和词CD（p = 0.759 > 0.05）、词ABC和词CD （p = 0.534 > 0.05）之间均没有显著差异。

词AB的平均笔画数为6.569（SD = 1.84），词ABC的平均笔画数为6.64（SD = 1.73），詞CD的平均笔画数为6.88（SD = 2.12）。方差分析表明，三者的平均笔画数不存在显著性差异，F（2，93） = 0.236，p > 0.05），词AB和词ABC（p = 0.878 > 0，05）、词AB和词CD（p = 0.513 > 0.05）、词ABC和词CD（p = 0.616 > 0.05）之间均没有显著差异。

在两类歧义字符串中，第三个汉字C作为词首或词尾的位置概率在BCC语料库《汉语常用词词频表》（荀恩东等，2016）中计算。C位于词首的位置概率P （CI）等于C位于词首的词数除以首尾包含语素C的所有词数（Yen et al，2012），公式为：P（CI） = N（Cinitial） / N（Cinitial + Cending） ×100%。同理，C位于词尾的位置概率P （CE）计算公式为：
P （CE） = N（Cending）/N（Cinitial+Cending）×100%或P（CE） = 100%-N（Cinitial）/N（Cinitial+Cending） × 100%。

本实验材料中，汉字C位于词首的概率范围为2.72%至78.35%，平均值为30.92%（SD = 15.09）。

将64组材料分为两个版本，每个版本32组材料。每个版本中，同一个语素C所对应的歧义字符串的韵律组配模式只出现一次，即被试只阅读ABCD和其对应的ABC中的其中一个。另外加入2倍左右的填充词组，共58组。每个版本的实验材料和填充材料经过完全随机排列后分为3个板块，每个板块包含30组词语。另外挑选包含上述所有类型的词组34组，随机分为两个部分，作为练习阶段的材料。

3.4 实验仪器与程序

本文采用线上视频形式进行实验，使用E-prime 2.0软件编程，通过Bandicam软件将其录制成视频。主试将2个练习视频和3个正式实验视频发送给被试，被试在电脑上全屏播放，进行实验。实验参考Ma等（2014）的模糊词报告范式。

首先呈现注视点“+”500ms，接着呈现500ms的空屏，然后快速呈现歧义词组。之后出现一个持续3000ms的空屏，要求被试在空屏出现时又快又准确地报告第一个看到的包含在歧义词组中的词语。3000ms之后出现下一次注视点“+”。通过前测，确定汉语母语者实验时歧义词组的呈现时间为100ms，汉语二语者为600ms。视频实验结束后，汉语二语者被试需要填写两份调查问卷，分别是交际语言能力自评表和实验材料的熟悉度评定问卷，而汉语母语者仅需要完成后者。整个实验大约持续30分钟。

4. 实验结果与分析

词语命名的具体情况见表2。删去命名错误的数据50条，占全部数据的4.34%，有效数据为1102条。

实验数据在R语言（version 3.6.3）软件上分析。本实验的因变量为5个水平的类别变量，分别为单音节词、双音节词、三音节词、先二后三、先二后加一，原始数据及调整后数据均不符合正态分布，且程度上无先后顺序分布，因此本研究利用nnet数据包（version 7.3-13）中的multinom函数，即采用无序多分类logistic回归模型，分析实验数据。

本研究关注的解释变量为：被试的语言背景（母语者、汉语二语者，编码为group0和group1）、韵律组配模式（有/无优势韵律模式，即字符串ABCD和ABC，编码为type4和type3）、语素C位于词首的位置概率（编码为LP）。本文的结果变量为词汇命名情况。在对数据进行编码和整理后，采用最大似然法（Maximum Likelihood Technique）建模。最优模型包含母语背景、韵律组配模式和词首位置概率的固定效应，以及韵律和位置概率的交互效应，统计输出结果如表3所示。

4.1 词汇报告结果：单音节词/三音节词

通过模型可以得知，在单音节词和三音节词的发生概率对比上，语言背景、韵律模式和词首位置概率的主效应显著，韵律模式和位置概率的交互效应不显著。

语言背景的回归系数为7.373，即相比于母语者，二语者报告单音节词的概率增加，EXP（B）为1592.855，即二语者报告单音节词的概率约为母语者的1593倍，表明二语者比母语者更有可能报告单音节词。就韵律组配模式而言，相比于无优势韵律模式的词组ABC，词组ABCD的回归系数为2.970，优势比为19.508，即被试在面对四音节字符串时，报告单音节词的可能性更高，约是报告三音节词的19.5倍。语素C的词首位置概率对被试报告单音节词或三音节词有显著影响。词首位置概率的回归系数为0.051，优势比为1.052，表明随着词首位置概率的提高，被试报告单音节词的概率增加，具体为词首位置概率每提高1%，被试报告单音节词的概率提高5.2%。

但值得注意的是，被试产出单音节词的情况非常少，占比不到总数据的1%，而且母语者被试未报告单音节词。

4.2 词汇报告结果：双音节词/三音节词

被试报告双音节词或三音节词的结果受到语言背景、韵律模式和词首位置概率的显著影响，韵律模式和位置概率的交互作用不显著。

相比于母语者，二语者报告双音节词的概率更高，回归系数为0.631，优势比是1.880，即报告双音节词的可能性比报告三音节词增加88%。在韵律组配模式上，字符串ABCD的回归系数为1.798，即相比于歧义字符串ABC，被试在遇到ABCD时，报告双音节词的可能性更高，具体为三音节词的6.037倍。

相比于报告三音节词，语素位置概率在被试报告双音节词上同样有显著影响。位置概率的回归系数为0.023，优势比为1.023，这意味着位置概率每提高1%，相比于报告三音节词，被试报告双音节词的可能性增加2.3%。即在面对歧义字符串ABCD时，语素C位于词首的概率越高，被试报告双音节词AB或CD的概率越高。

4.3 词汇报告结果：先二后三/三音节词

以报告三音节词为参照，被试先报告双音节词再改口为三音节詞的情况，不受语言背景、韵律模式和词首位置概率等因素的固定效应和交互效应的影响，上述解释变量的显著性水平均大于0.05。

这一类的词汇报告结果不仅不是本研究关注的目的，而且是实验中应该避免出现的情况——实验正式开始前，被试都被告知应该报告自己第一个看到的词语。因此这类数据极少，仅有7条，占比0.61%。

4.4 词汇报告结果：先二后加一/三音节词

相比于三音节词，影响被试先报告双音节词再加语素C情况的因素中，语言背景、韵律模式的主效应显著。和母语者比较，二语者报告“先二后加一”的概率增加，回归系数为1.026，发生概率约为母语者的16.9倍。在存在［2+2］的优势韵律的字符串ABCD上，被试产出“先二后加一”的可能性更低，其概率仅有面对字符串ABC时的2.5%。韵律模式和语素位置概率的交互效应显著。被试在面对［2+2］韵律模式的字符串时，随着词首位置概率的提高，先报告双音节词再加语素C组成三音节词的情况发生概率增加，是报告三音节词的1.105倍；
但面对ABC字符串时，词首位置概率对被试的词汇报告结果没有显著影响。

不过同样需要注意，这也是本实验需要避免出现的情况，产出的数据非常少，仅有14条，占总数据的1.22%。

5. 讨论

从实验数据的结构来看，被试报告单音节词、“先二后三”和“先二后加一”类型的数据较少，因此下文的讨论主要基于双音节词和三音节词的统计结果，兼以上述三类数据为辅助。

5.1 语素位置概率的影响

根据表3的总模型，语素位置概率主效应显著，且和语言背景无交互效应，说明无论母语者还是二语者都能够根据语素C位于词首概率的不同，报告不同的词汇——在歧义词组ABC或ABCD中，若C位于词首的概率高，被试倾向于报告双音节词，即AB或CD。因为C位于词首概率高，C作为词n+1的起始语素的可能性更高，即词汇边界更有可能位于语素C的前面，随着语素词首概率的提高，被试将ABC和ABCD切分为AB或CD的意愿更加强烈。

在以母语者为实验对象的研究上，本实验的结果与前人的研究结果一致。无论是在有“词间空格的拼音文字”芬兰语（Bertram等，2004），还是“无词间空格的拼音文字”泰语（Kasisopa等，2013、2016），或是“无词间空格的、兼有表音文字和象形文字”的日语（Sainio等，2007），或是“无词间空格的象形文字”的汉语（Yen等，2012；
Liang等，2017；
高淇，2018），母语者都能够利用语素位于词首或词尾的概率进行词汇切分和识别。

本实验中，二语者也成功运用了语素位置概率这一特征进行词汇的切分和识别。前人的研究发现语素位置概率信息的利用程度和语言水平相关，对这一线索的熟练运用是逐渐习得的（Kasisopa等，2016；
梁菲菲，2015）。而在语素位置信息提取的研究上，邢滨钰等（2018）的研究同样表明，汉语学习者的语言水平越高，提取语素位置信息的速度越快。

5.2 韵律组配模式的影响

韵律组配模式的主效应显著，相比于歧义字符串ABC，在遇到字符串ABCD时，被试报告双音节词AB或CD的可能性更高，约为报告三音节词的6倍。在四音节词组中，存在［2+2］优势韵律模式，排斥三音节词ABC的产出；
而在三音节词组中，没有稳定的优势韵律模式，因此被试既不拒绝整词ABC的产出，也不拒绝双音节词AB的产出。所以和字符串ABC相比，在面对字符串ABCD时，报告双音节词的可能远高于三音节词。同时韵律模式与母语背景无显著的交互效应，即说明上述结果同时适用于母语者和二语者。这一实验结果与前人研究成果一致（Chao，1975；
张辉等，2012、2013）。［2+2］确实是汉语四音节词组的强势韵律模式。

根据前人的研究，三音节词语并非没有优势韵律模式。吕叔湘（1963）發现汉语三音节词语主要存在［1+2］和［2+1］两种组配模式，而且存在韵律信息和句法信息的交汇：［1+2］模式以动宾式（如“读报纸”）为主，［2+1］模式以偏正式（如“热水器”）占绝对优势。本实验中所使用的三音节歧义字符串均为偏正结构，存在较为稳定的［2+1］韵律模式。根据这一韵律模式，在词汇识别和切分过程中，双音节词AB存在优先于整词ABC产出的可能性。但实验中实际的产出结果并非如此。这可能是因为，根据汉语韵律句法理论研究的成果，汉语母语者只有在结合句法信息之后，才能判断出三音节词语的优势韵律组配模式。而汉语韵律与句法交互的眼动和ERP研究结果表明，汉语韵律信息作用于词汇加工的早期阶段，句法信息作用于中晚期（Ren等，2010；
于泽，2011；
张辉等，2013）。在本实验中，字符串ABC呈现时间仅为100ms，且被试需要尽快报告首先识别出的第一个词，因此被试可能来不及加工整个字符串的句法信息，从而得出韵律模式，再综合句法和韵律的全部信息来决定报告的词汇。而四音节词组［2+2］的韵律模式存在绝对优势，不需要考虑句法结构（Ren等， 2010；

张辉等， 2013）。所以，本文最终的实验结果仍然是两类歧义词组相比，在ABCD中报告双音节词的可能性高于三音节词。

对于本实验的研究结论，可能还存在另一种质疑，认为是对语义相对独立和相对完整的要求，而并非韵律因素，才导致现在的数据情况。从语义相对独立和相对完整的角度来说，在字符串ABC中，若切分为AB和C，那么C可能并不是独立成词语素，即C无法获得独立性；
而将其处理为ABC一个词则不会有这种担忧；
而在ABCD中，将其切分为AB+CD，那两者都是具有独立意义的词语；
若切分为ABC+D即产生D可能无法获得独立性的担忧。在其它因素一致的情况下，若是考虑语义因素，在字符串ABC中报告整词ABC（即意义相对独立）的比例，应该和在字符串ABCD中报告AB或CD（即意义相对独立）的比例相当。但是，母语者的总体数据结构并不支持这个解释，前者占比89%，后者约为41%。而且，同样地，与句法信息相同，语义信息的加工在词汇识别和切分加工的时间进程里处于中晚期（Ren等，2010；
于泽，2011），被试可能来不及加工整个字符串的语义信息。因此本实验中的词汇识别和切分，语义因素并非主要的影响因素，而是韵律因素导致这一实验结果。

对于二语者来说，统计结果显示，韵律信息同样在词汇切分和识别中具有显著作用，这表明高级水平二语者能够运用［2+2］的韵律组配模式来确定词边界，已经基本习得汉语四音节词组的［2+2］韵律模式。

5.3 母语者和二语者的加工差异

实验结果显示，加工的最大差异表现在二语者比母语者更多报告双音节词。母语者报告双音节词的比例约为25%，二语者则为33%；
从统计结果来看，与母语者相比，二语者报告双音节词是三音节词的1.88倍。这是否意味着二语者比母语者更加熟练和高效地运用［2+2］韵律组配模式呢？

一部分二语者在实验后的访谈提到，当呈现四音节词组时，无法把四个汉字全部辨认清楚，多数情况下能识别出三个汉字，有时候甚至只能识别出两个或一个汉字。这样的说法也得到实验数据的佐证：总体词汇报告情况中，有11个单音节词，均由二语者产出。汉语韵律单位的组织遵循“二常规，三可容，一四受限”的规则（王洪君，2005），单音节词的出现在韵律上受到非常多的限制。若存在韵律上更加合理的双音节词或三音节词，被试就极少会产出单音节词。母语者的词汇报告结果与这一观点是一致的。二语者报告单音节词，说明其可能无法识别音节更长的词汇单位。因此，二语者比母语者报告音节长度更短的词语可能是由于不能完全识别歧义词组ABCD导致的，而非［2+2］的韵律模式。

和母语者相比，二语者无法完整识别歧义词符串ABC或ABCD里的所有汉字，原因可能是二语者的阅读时知觉广度范围较窄。语言水平对知觉广度存在显著影响，汉语水平较低的二语者在阅读知觉广度为右侧1-2个字，比母语者的稍窄（段力令，2016；
杨朔，2019）。而且，阅读材料的难易程度对知觉广度范围存在明显影响。当材料较难时，知觉广度范围缩小一到三个汉字（闫国利等，2008；
伏干，2012）。而本文所用的歧义字符串的加工更困难。因此，汉语二语者本就较窄的知觉广度范围可能进一步缩小。

在语言水平和阅读材料的难度两个因素的共同作用下，和母语者相比，汉语二语者的知觉范围较窄，可能仅能识别歧义字符串中某部分汉字，最终产出更多的单音节词和双音节词。

5.4 基本加工单位的大小

从整体的词语报告数据结构来看，三音节词的数量最多，占比达63%，双音节词数量次之，占比29.6%。其中母语者的数据中，报告三音节词的比例更高，达到72.9%。由此看来，读者倾向识别和切分出较长的单位——三音节词，即读者在词汇识别和切分时采用“长词优先”原则。这一实验结果与Inhoff 等（2005）的单向切分假说和Li等（2009）的平行激活交互模型所预测的结果一致。

模型的预测同样可以解释本实验中被试改变报告结果的情况。在实验中，无论是母语者还是二语者，都存在改变自己初始词汇报告的情况，均为先报告双音节词再更改为三音节词，共有21例。这一词汇报告过程与模型预测一致，音节长度较短的词语首先被识别，但最终时音节长度更大的词语在竞争中胜出。

因此，一般来说，和音节数量较少的单位相比，汉语的基本单位是音节长度更大的单位。但是，这并不意味着总是遵循“长词优先”原则。Liu等（2014）和闫国利等（2016）认为汉语阅读过程中，读者并不以固定的单位进行加工，而是综合运用各种信息，随时调整自己的加工单位，以获取更多的信息。本文研究发现下列因素对读者调整加工单位产生影响。

首先是语素特征对其存在调节作用。从前文的讨论可以得出，语素位置概率信息帮助读者划分单位边界，如果语素位于词首的概率更高，则读者更有可能认为词汇边界出现在语素的前面；
反之则认为边界出现在语素的后面。其次，韵律特征也会影响阅读基本加工单位的大小。本文研究发现，在加工四音节词组时，即使存在音节长度更大的单位，汉语［2+2］的韵律组配模式让读者偏好音节长度为2的词语。即韵律信息会在一定程度上限制“长词优先”原则的运用，改变基本加工单位的大小。

总的来说，“长词优先”原则、汉语的语素特征、韵律信息和学习者的语言水平均对汉语基本加工单位的大小产生调节作用。

6. 结语

本研究采用线上词汇命名任务，研究语素位置概率和韵律组配模式对词汇识别和切分的影响，并探究了汉语基本加工单位的大小。结果发现，语素位置概率和［2+2］的韵律组配模式均对母语者和二语者的词汇识别和切分存在显著影响。和母语者相比，二语者产出更多的单音节词和双音节词，加工单位长度小于母语者，这可能是由于二语者的知觉广度范围比母语者较窄导致的。汉语的基本加工单位大小基本遵循“长词优先”原则，但同时，语素特征、韵律特征、语言水平等会影响基本加工单位的大小。

基于上述研究结论，本文对汉语作为二语教学提出以下的建议：

第一，以语素为基础的词汇教学值得重视，同时需要拓展和扩充语素教学的内容。以往语素教学可能多集中在整词拆分后各语素的意义上，但本文发现语素的位置信息在汉语阅读中也非常重要。在给汉语二语者拓展某一语素的词族（word family）时，可以引导学习者关注语素所在位置的分布情况，即倾向词首位置或词尾位置。

第二，要强化韵律教学，在课堂上针对汉语的韵律模式进行训练。无论是在口语表达还是书面语表达上，引导二语者重视音节数量上的组配形式，如四音节词组中的［2+2］形式、偏正式三音节词的［2+1］形式、动宾式三音节词的［1+2］形式等。同时冯胜利（2006）指出汉语书面语中“话要典雅必双”，要强化学习者的语体意识，引导其注意在汉语书面语中的双音节倾向。

［参考文献］

陈琳，翁斐斐，夏天生 2016 语素位置对中级汉语学习者并列式复合词识别的影响［J］. 心理学探新（4）.

段力令 2016 蒙古族大学生蒙古语和汉语阅读知觉广度的眼动研究［D］.西北民族大学硕士论文.

冯胜利 2002 汉语的韵律、词法与句法［M］.北京：北京大学出版社.

伏干 2012 材料难易度对汉语阅读活动影响的眼动研究［J］. 心理研究（5）.

高淇 2018 词素位置概率在句子阅读及词汇命名中作用的研究［D］.天津师范大学硕士论文.

洪炜，冯聪 2010 汉语二语学习者与汉语母语者的双字合成词识别过程差异研究［J］.现代外语（4）.

梁菲菲 2015 新词学习中词切分线索的运用：词素位置概率［R］.第十八届全国心理学学术会议摘要集——心理学与社会发展（天津）（10）.

吕叔湘 1963 现代汉语单双音节问题初探［J］.中国语文（1）.

王洪君 2005 普通话节律与句法语用关联之再探［R］.全国人机语音通讯学术会议（北京）（10）.

邢滨钰，江新 2018语素位置信息对汉语二语学习者阅读影响的眼动研究［R］. 第二十一届全国心理学学术会议（北京）（11）.

荀恩东，饶高琦，肖晓悦，臧娇娇 2016 大数据背景下BCC语料库的研制［J］.语料库语言学（1）.

闫国利，伏干，白学军 2008 不同难度阅读材料对阅读知觉广度影响的眼动研究［J］. 心理科学（6）.

闫国利，何立媛，宋子明 2016 中文阅读的基本信息加工单元初探［J］. 心理与行为研究（1）.

杨朔 2019 新疆维吾尔族学生汉语学习的问题及教育建议［D］.天津师范大学硕士论文.

于泽，韩玉昌 2011 书面韵律边界与语境对歧义句歧义消解的影响［J］. 心理科学（6）.

张辉，孙和涛，顾介鑫 2012 非成语四字格词组加工中韵律与句法互动的ERP研究——熟语表征和理解的认知研究之六［J］. 外语与外语教学（6）.

——— 2013 成语加工中韵律与句法互动的事件相关电位研究［J］. 外国语（1）.

周有光 1961 漢字改革概论［M］. 北京：文字改革出版社.

Bertram， R.， A. Pollatsek & J. Hy?n? 2004 Morphological parsing and the use of segmentation cues in reading Finnish compounds［J］. Journal of Memory and Language （3）.

Yuanren， Z. 1975/2006 Rhythm and structure in Chinese word conceptions［A］. 原载台湾大学考古人类学刊，中译文收录于赵元任语言学论文集［C］.北京：
商务印书馆.

Inhoff， A. W. & W. Caili 2005 Eye movements and the identification of spatially ambiguous words during Chinese sentence reading［J］. Memory & Cognition （8）.

Kasisopa， B.， R. G. Reilly， S. Luksaneeyanawin & D. Burnham 2013 Eye movements while reading an unspaced writing system：
The case of Thai［J］. Vision research （86）.

——— 2016 Child readerseye movements in reading Thai［J］. Vision Research （123）.

Li， X.， K. Rayner & K. R. Cave 2009 On the segmentation of Chinese words during reading［J］. Cognitive Psychology （4）.

Liang， F.， H. I. Blythe， X. Bai， G. Yan， C. Zang & S. Liversedge 2017 The role of character positional frequency on Chinese word learning during natural reading［J］. Plos One （11）.

Liu Y.， E. D. Reichle & L. Xingshan 2014 Parafoveal processing affects outgoing saccade length during the reading of Chinese［J］. Journal of Experimental Psychology：
Learning， Memory， and Cognition（4）.

Ma G.， X. Li， & K. Rayner 2014 Word segmentation of overlapping ambiguous strings during Chinese reading［J］. Journal of Experimental Psychology-Human Perception and Performance （3）.

Perfetti， C. A. & T. Lihai 1999 The constituency model of Chinese word identification［A］. In J. Wang & A. W. Inhoff （eds.）， Reading Chinese script：
A cognitive analysis［C］. Hillsdale， NJ：
Lawrence Erlbaum Associates.

Ren， G.， & Y. Yang 2010 Syntactic boundaries and comma placement during silent reading of Chinese text：
Evidence from eye movements［J］. Journal of Research in Reading （2）.

Sainio， M.， J. Hy?n?， K. Bingushi & R. Bertram 2007 The role of interword spacing in reading Japanese：
An eye movement study［J］. Vision Research （20）.

Wagner， M. & D. G. Watson 2010 Experimental and theoretical advances in prosody：
A review［J］. Language & Cognitive Processes （7-9）.

Yen， M. H.， R. Radach， J. L. Tzeng & J. L. 2012 Tsai Usage of statistical cues for word boundary in reading Chinese sentences［J］. Reading & Writing （5）.

Zang， L.， W. Y. Bai， X. G. Yan， D. Drieghe & S. Liversedge 2015 The use of probabilistic lexicality cues for word segmentation in Chinese reading［J］. Quarterly Journal of Experimental Psychology （3）.

Zhou， J.， G. Ma， M. Taft & X. Li 2018 The time course of incremental word processing during Chinese reading［J］. Reading & Writing （3）.

Effects of prosodic patterns and the morpheme position probability on word segmentation and recognition in overlapping ambiguous strings by learners of Chinese

LU Shiyi1.2，HUANG Yun2

（1. School of liberal Arts， Guangxi University， Nanning， Guangxi 530004， China；

2. School of Chinese as

Second Language， Peking University， Beijing 100871， China）

Key words：
word segmentation；

prosodic pattern；

morpheme position probability；

basic processing unit

Abstract：
There is an ongoing debate on how readers segment and recognize words during Chinese text reading and what the basic processing unit is. This study explores the impacts of prosodic pattern and morpheme position probability on readers word segmentation and recognition， and discusses the size of basic processing units. Using online word naming tasks， ambiguous three-character strings ABC and four-character strings ABCD are briefly shown to native Chinese speakers and learners of Chinese. We conclude that prosodic factors and the morpheme position probability significantly affect Chinese word segmentation and recognition. Importantly， the biggest difference between native Chinese speakers and learners of Chinese is that the basic processing unit of learners Chinese is shorter than that of native speakers， which is probably due to the narrower perceptual span of Chinese learners. Moreover， the size of basic processing unit in Chinese reading generally follows the principle that long words get priority， and prosody features， morpheme features and language ability will affect the size of the basic processing unit as well.

【責任编辑匡小荣】