留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

情感分析中的语法否定表达研究:加的夫模式初探

李学宁 胡自威

李学宁, 胡自威. 情感分析中的语法否定表达研究:加的夫模式初探[J]. 北京科技大学学报(社会科学版), 2024, 40(5): 74-82. doi: 10.19979/j.cnki.issn10082689.2023100061
引用本文: 李学宁, 胡自威. 情感分析中的语法否定表达研究:加的夫模式初探[J]. 北京科技大学学报(社会科学版), 2024, 40(5): 74-82. doi: 10.19979/j.cnki.issn10082689.2023100061
LI Xuening, HU Ziwei. Research on the Grammatical Negation System in English Sentiment Analysis: The Cardiff Grammar Perspective[J]. Journal of University of Science and Technology Beijing ( Social Sciences Edition), 2024, 40(5): 74-82. doi: 10.19979/j.cnki.issn10082689.2023100061
Citation: LI Xuening, HU Ziwei. Research on the Grammatical Negation System in English Sentiment Analysis: The Cardiff Grammar Perspective[J]. Journal of University of Science and Technology Beijing ( Social Sciences Edition), 2024, 40(5): 74-82. doi: 10.19979/j.cnki.issn10082689.2023100061

情感分析中的语法否定表达研究:加的夫模式初探

doi: 10.19979/j.cnki.issn10082689.2023100061
基金项目: 教育部人文社科项目“中国刑事庭审话语中的法律知识构建研究”(编号:21YJC740029)。
详细信息
    作者简介:

    李学宁(1971—),湖南湘潭人,江南大学外国语学院教授,博士生导师

    胡自威(1998—),山东日照人,江南大学外国语学院硕士研究生

  • 中图分类号: H314

Research on the Grammatical Negation System in English Sentiment Analysis: The Cardiff Grammar Perspective

  • 摘要: 文章基于系统功能语言学中的加的夫模式,使用SST影评语料库辅助研究,探讨语法否定系统not在情感分析中与情感词的搭配情况。语法否定在情感分析中主要呈现为语气否定,语法否定所在句的主语多为评价对象,该否定现象负载于动作过程、心理过程与关系过程中的属性关系。利用加的夫语法中对情感意义的界定对情感词进行分类,发现否定词not与情感意义为纯情感、感情反应类词语的搭配频率最高,与困难性、重要性类情感词的搭配频率最低。否定词对不同意义的情感词产生的否定效果不同,对于纯情感、感情反应类词语,否定词在改变极性时会削弱原词强度;而行为评判、社会评判类词语中则无削弱效果;对于消极情感词,否定词并不会改变极性。文章通过对情感词进行意义层次的标注,提高了该类词汇在常见否定表达中的准确性,对解释情感分析中否定词的复杂现象具有一定启发意义,也为后续研究提供了新的视角。

     

  • 否定极性作为语言与思维中不可或缺的范畴,已引起语言学、哲学、逻辑学等学科学者的关注。语言学的否定是指对句子意义的部分或全部反驳[1],表达与肯定意义相对立的概念。在语言学内部,不同学派的学者对其进行了多维度的研究。最早对否定极性进行研究的是以罗素为代表的形式语义学,其研究重点在于否定词与真值条件,而非否定词本身[2]。理论语言学主要从句法学、语义学、语用学的角度,对否定极性的辖域、句法结构、语义生成、否定预设、否定性语境等进行讨论;认知语言学、计算机语言学、功能语言学等学派则描述了否定的语义范畴与标记性、否定的机器识别与表达、否定的语篇功能等[2-4]。在系统功能语言学领域,否定极性与肯定极性构成了“归一性”系统,对限定小句的特征进行了阐释[5]173

    近年来,系统功能语言学视角对于否定极性的研究可概括为两方面:否定系统的构建与否定功能的探究。21世纪初,韩礼德和麦蒂森[5]23通过对否定词分类,构建了否定极性系统,后续学者对其进行细分和扩充[67]。此外,否定现象也常作为介入资源(Engagement)的语言特征出现在评价系统中[7]。对于否定极性的功能研究,国内外学者主要关注以下几个方面:否定现象的语篇功能以及语篇模式的元功能视角分析[2];否定极性的级阶与功能关系研究[8];否定极性在立场、观点表达等方面的话语功能研究,以及否定与其他资源的共现时对话语立场的影响[9]

    回顾过往研究,可以发现不同语言学流派对否定极性给予了高度关注,并从形式、功能等多个角度开展了研究。除了具备真值否定的作用外,否定词在语篇中对主观态度、意见和观点产生影响,特别是对具有观点的文本的极性产生影响,即否定词在情感词表达中也发挥了重要作用。其中,语法否定词not出现在否定语篇中的频数最高,具有代表性。由于目前国内外暂无专门研究情感话语的理论[10],而在线评论文本具有交流的功能,与系统功能语言学注重语言使用和社会因素的观点相符,因此可以采用SFL中的部分理论对情感话语开展分析。加的夫语法在语言多功能原则的基础上进行细分,将三大员功能细分为八种意义,其中对涉及情感的意义部分进行了系统性的描述,情感意义的定义可推介至情感分析中的情感词语分类。鉴于此,本文拟在加的夫语法(CG)框架下,从否定系统与情感词语的结合出发,借助语料库与情感分析方法,观察情感极性与强度在受语法否定词影响后的偏折情况。同时引入并计算语法否定词作用前后情感值的比值作为情感偏折率,考察否定极性在情感分析中的体现,并通过加的夫模式中的相关概念进行解释,为情感框架的语言学研究提供新的视角。

    极性体现了肯定与否定中的语言潜势。韩礼德与麦蒂森[5]23 发现否定可以通过多种方式来表达,并初步划分了极性系统。根据否定的类型,极性分为一般否定(generalized)与特殊否定(specialized)。一般否定指的是具有否定词not构成的小句结构,而特殊否定则是由特殊的否定词语如“never,nobody”等词语实现否定结构的小句。根据韩礼德提出“词汇—语法”连续统(continuum)定义,一般否定和特殊否定又被称为语法否定与词汇否定与半语法否定[5]67。例如语义为“不成功”的表达可由didn’t succeed和failed体现,其中前者通过对限定词did加上否定词not体现否定的功能,这一表达就属于语法否定。相较于其他否定系统,语法否定系统可概括为封闭的系统,含有固定的否定词,易于判断与归纳。

    韩礼德在创建否定系统时,主要关注于构建词汇语法连续统,没有对词汇否定和语法否定进行详细划分。国内学者在此基础上对否定系统进行了扩展。针对语法否定,学者以语气成分作为准入条件,引入了语气否定与非语气否定[6],分类讨论not的搭配情况,将not与限定词结合的情况称为语气否定,如is not,而将not与谓词结合的情况称为非语气否定,如not to follow。在系统功能语言学中,否定极性与情态、语气紧密关联[11],因此将语气作为准入条件有效处理了not分类问题。此外,否定极性系统中的其他子系统也得到了扩充与发展[8],经国内外学者扩展后的否定极性系统,详见图1[8]

    图  1  经扩展后的否定极性系统图

    情感分析指对带有情感的主观性文本进行语言处理与分析,用于舆情监测、产品调研与优化等实际应用中,已成为自然语言处理、语言学、计算机科学等领域的跨学科综合研究,吸引了众多学者的关注。在该领域内,情感被赋予了“极性”的属性,可以体现对某一观点或事物的评价,并且带有一定的主观倾向。情感信息在文本中被一些单元所承载,这一类词称为情感词。在情感词和情感修饰词方面,计算机语言学派认为,检测情感词和情感转换词的工作是基于构成性原则的[12]300。在句子、篇章或完整文本中,文本的情感是各部分的综合。某些成分对情感的影响作用大于其他成分,而有些成分可能消除或削弱情感表达,但基本前提是,各部分可以进行加减法或直接相乘,从而得出较可靠的情感得分。

    在情感分析中,携带观点和情感的词语多为形容词、名词、动词和副词[13],情感词的极性与强度与修饰词存在密切关系,而否定词是影响情感极性判断的关键因素[14]。否定词在情感分析中属于情感转换词(Sentiment shifters)[15],表示能对情感倾向与情感强度产生影响的语言单位。相较于情感词汇,情感转换词本身并不具备情感属性,而是与情感词汇相配合使用。学界对于情感分析中的语法否定现象展开了较为全面的研究。指出语法否定在情感分析中又称为显性否定词[16]382或功能否定[17]793,通过对其构建可识别与标记的语言模型,可以有效降低语言处理任务的难度。但就语法否定的表达效果即如何改变原文的情感极性上,学者产生了不同的观点。根据否定与肯定的对立关系,早期研究普遍认为否定词会完全反转小句的极性,即产生反转否定(Switch Negation)现象。例如,若“This is a good car.”这一小句的情感得分为+3,则“This is not a good car.”的情感得分即为−3。显然,这种方式忽略了语言使用中的复杂情况[18]99,将其视为完全反转小句情感极性的观点过于简单。部分学者认为,在表达强烈情感的词语中,情感词在极性反转的基础上,可能会产生转移否定(Shift Negation)现象,即情感表达被弱化[19]13,例如“This is not the best car”并不完全等同于“This is a bad car.”。在计算机规则中,这体现为在改变极性的同时削弱情感值,计算方法则是在计算结果的基础上×80%[20]。在上文提到的例句中,若按照转移否定现象阐释,则“This is not a good car.”的得分计算为(−3)×80% = −2.4,通过数值对比可以发现,二者均发生情感极性的变化,但小句经转移否定后的情感强度减弱,更符合其语义。除英语情感分析外,这一现象在汉语情感分析中也有体现[21]

    可以看出,计算机语言学的核心是将自然语言转化为计算机可识别的信号,其研究重点在于构建不同词性的词典并对元素进行赋值,从而完成计算任务[22]。否定作用的对象主要是主观态度,因其在系统功能语言中可以否定主观态度或客观预设的立场,所以语法否定极性不能作为独立的研究对象,而是需要结合表达主观的情感词共同分析。在对情感词的研究上,系统功能语言学中的加的夫语法对情感进行了较为详细的阐述与分类。加的夫模式在概念功能、人际功能和语篇功能的基础上,对每个功能进行了强调与扩展,提出了“经验、逻辑关系、人际、否定性、效度、情感、主位、信息”8类意义,各种意义分别由不同的系统体现[23]188。张德禄[24]对这8种意义进行了详细的阐释,通过使用加的夫语法中对于元功能的阐释。其中,情感意义指的是行为者对所讲事物的感觉,包括纯情感、社会评判、重要性,以及一些与经验意义合并的意义如感情反应、行为评判、困难性。情感意义主要由做补语的形容词和做修饰语的形容词实现,这与情感词的定义重合,因此可引入加的夫语法中的情感意义作为探究情感词的理论背景。本文假设,语法否定词not在与体现不同情感意义的形容词搭配时,否定效果的表达存在差异。针对其中的差异,本文将利用加的夫语法中的相关概念进行解释。

    本文采用了定量和定性结合的研究方法,对语料的选择需要满足以下要求:这些语料具有一定的主观性,需要能够体现观点持有者的情感和态度;所选取的文本应来自同一领域,避免不同领域中情感词的歧义现象。综合考虑以上因素,本文选取电影评论作为研究对象。本文的语料来自斯坦福情感数据集2014版(SSTv2),该数据集由斯坦福大学的研究人员在获取和人工过滤后整理而成,最初是专门为情感分析而构建的,因此这些文本都设有情感标签,这样可以提高情感值计算的准确性。

    本研究需要自建语料库,通过在语料库中对文本进行处理来获得所需的数据。需要注意的是,由于影评数量较多,不宜直接将其导入语料库中。此外,本研究中的研究对象需要包含否定词或情感词的文本。因此,所选取的影评需要通过筛选才能导入语料库。构建语料库所需要的软件为Antconc4.2.0。基于情感分析中的否定极性系统框架,本研究对选入语料库的文本进行以下处理:(1)使用Antconc软件中的频数统计功能,检索出所有包含否定词not和“n’t”的文本。需要注意的是,并非所有这些否定词都完全充当情感转移词[25];因此,需要人工去除不符合条件的否定词。常见的去除类型包括否定词作为连词(如“not only”和“not to say”等)的去除不符合条件的选项。(2)对于形容词词组,根据加的夫语法中对情感意义的定义,对其进行标注,并整理成形容词词表,并在情感词典中找到对应的情感值。(3)对于not与n’t词项,使用KWIC功能检索其前后搭配,对其进行统计,并分析与其搭配的情感词语属于哪一类情感意义,并进行标记。

    本文依照所述的研究方法和步骤,对所选取的语料进行了详尽的分析。在所选的语料库中,not以及其缩写形式的出现频次共计1 293次。通过筛选,我们发现not作为否定词发挥功能的情形共有1 216次。从极性角度出发,not出现在非常消极、消极、中立、积极和非常积极语境中的次数分别为159次、397次、279次、262次和63次,所占比例分别为13.7%、34.2%、24.1%、22.6%和5.4%。在原始语料中,积极评论和消极评论的数量大致相当。然而,否定词的发生频次呈现出先上升后下降的趋势。这表明,否定词在表达强烈的极性时出现的次数较少,而在表达不强烈的情感时出现的次数较多。这证明否定词并不只是完全翻转极性,而是会带有弱化一定情感强度的功能。使用Antconc进行KWIC检索,得到了not的搭配统计结果,具体如表1所示。

    表  1  否定词not发生频次前十分布表
    语气否定 频数 非语气语否定 频数
    is not 194 not + to 21
    does not 189 not + Ved 20
    can not 104 not + Ving 14
    do not 102
    it’s not 56
    will not 48
    did not 36
    may not 29
    are not 26
    has not 19
    下载: 导出CSV 
    | 显示表格

    在文本中,否定词与情感词的位置关系并不固定。通过统计可以发现,否定词not与情感词的搭配方式包括直接搭配和间接搭配。在直接搭配中,not修饰的性质词组(quality group)是它的对象,此时not位于形容词之前。这种情况下,not可以与其他成分共同出现,对情感词产生影响。而在间接搭配中,not的作用对象并不是形容词词组,而是带有情感词的名词词组[26]266。但从情感表达的角度来看,not依然会对情感产生影响。因此,这类现象需要纳入讨论。此外,在否定提前现象中,not通常出现在形式主语后,但其作用对象是小句中的其他成分。在这种情况下,否定词与情感词的位置关系较远,因此需要单独分析否定提前现象,判断否定词是否对情感词产生影响。

    根据表1可见,语料库中not作为非操作词否定的频数明显小于作为操作词否定的频数,这说明not作为否定标志时主要与限定词搭配,而与谓词的搭配较少。从否定系统的角度来看,在语法否定系统中,not作为操作词否定的概率远大于作为非操作词否定的概率,而否定词not与情感词的作用关系属于前者,这表明本文所探讨的否定系统可对情感词赋值展开深入研究。另外,从时态的角度来看,与not搭配的限定词中,现在时和将来时使用较多,其中现在时的使用频率最高,远高于其他时态。在影评中,对于现在时的使用体现了观点持有者关注的是电影的属性和性质,过去时的使用则侧重于个人的经历和体验,而将来时的否定实际上是观点持有者对于未观影人的预测。需要注意的是,在英语中,当说话人认为、相信、希望、害怕某事将会发生时通常选用will[27],因此以上文本均可反映影评的主观类叙述特征。

    在一般现在时态中,not和“is”的搭配频率最高,达到了194次,其次是与“does”的搭配,频率为189次。另外,“it’s”中的“is”作为缩写形式,被单独统计,其使用频率为54次。本文还利用KWIC检索其他人称与否定词的搭配情况。第一人称“I”与not的搭配频率为24次,第二人称“you”与not的搭配频率为17次。这表明在影评评价中,当涉及否定形式时,大多数主语成分由单数名词构成,而非观点持有者直接作为主语。从加的夫语法视角来看,作为经验意义的主要表达方式的及物性系统包括六种主要过程:动作过程(action)、关系过程(relational)、心理过程(mental)、环境过程(environmental)、影响过程(influential)和事件相关过程(event-relating)[28]。在影评中,通过检索否定词not并进行进一步分析可知,not作为否定词主要负载于动作过程、关系过程与心理过程。当not负载于否定动作过程中时,通常是对电影中的元素进行描述,详见例1。

    例1:[246] The film doesn’t end up having much that is fresh to say about growing up Catholic or, really, anything.

    [8083]: The movie doesn’t generate a lot of energy.

    心理过程的主要参与者角色包括情感表现者、感知者、认知者、现象[28]。在影评语篇中,观点持有者除对电影元素的评价外,还会表达个人对于电影的直接看法。在情感层面,观点持有者倾向使用喜欢、享受等词汇表达自己的情感;在认知层面,观点持有者则会针对电影元素表达理解、思索等心理过程。

    关系过程子系统包括属性(48%)、位置(20%)、方向(20%)、所有(2%)以及搭配(2%),通过对属于关系过程的语句进行分析,可以发现本语料库中否定属性关系句的比例大于语法中给定的比例,这表明在影评语篇中,对于影评中的关系过程主要体现了关系的属性这一特点。由于属性词与情感词关联度高,因此在影评中需要探究否定词与情感词搭配并探究对于情感词的影响关系,详见例2。

    例2:[6976] This isn’t a terrible film by any means, but it’s also far from being a realized work.

    [1172] The movie is not as terrible as the synergistic impulse that created it.

    否定词与情感词的作用关系是情感分析中的研究重点。在使用情感词典进行分析时,利用标记的情感词汇与短语,可以确定对某一属性的倾向与强度。由于大多数词语的极性是确定的,在文本中具有固定特征,所以相对于其他情感分析的方法,利用情感词典可以更好地完成跨领域之间的情感分析。本文基于情感词强度标注与加的夫语法中情感意义的阐释,根据词语意义进行分类,详见表2。六类情感意义在语义上各自承载着不同的情感和评价维度。纯情感词体现事物本身带给说话者的感受,而不涉及对事物的评价或判断。社会评判词的分类依据是情感表达与社会认同和价值观的关联,特点是情感表达不仅仅基于个人情感,而是包含了对事物在社会文化背景下的评价。重要性词强调了事物的价值、紧迫性或对个体或集体的重要性。感情反应词基于事物或事件引起的个人情感反应,这一类别的情感意义与情境紧密相关,体现了人们对于环境刺激的情感体验。行为评判词基于对个体行为的评价,这种评判参照行为的结果或过程,同时蕴含道德判断与社会期望。困难性词评估完成特定任务或面对某情境的难度,其特点是评价的客观性较强。

    表  2  情感词类型分布表
    纯情感 社会评判 重要性 感情反应 行为评判 困难性
    awful
    bad
    brilliant
    fresh
    good
    great
    horrible
    outrageous
    palatable
    perfect
    scary
    terrible
    thrilling
    worst
    classical
    new
    original
    important amusing
    compelling
    disappointed
    engaging
    entertaining
    funny
    interesting
    well-conceived
    effective
    informative
    sharp
    smart
    difficult
    easy
    下载: 导出CSV 
    | 显示表格

    表2数据显示,在语料库中积极评论与消极评论数量大致相等的情况下,与not直接搭配的积极情感词汇频次为22,消极情感词汇频次为10。这表明观点持有者在表达消极情感时,倾向于通过否定积极的方式来表达,从而体现了否定作为肯定观点对立面的概念。例3选取了上述六类情感意义在语料库中的对应语句。

    例3:[2313] Enough is not a bad movie. (纯情感)

    [4140] Isn’t as sharp as the original ... (社会评判)

    [5056] Waydowntown may not be an important movie, or even a good one ... (重要性)

    [4686] Human Nature, in short, isn’t nearly as funny as it thinks it is. (感情反应)

    [4868] It’s just not very smart. (行为评判)

    [2323] It’s not difficult to spot the culprit early-on in this predictable thriller. (困难性)

    通过分析表2中的词汇以及例3,可以发现纯情感词汇和感情反应类词汇主要表达了观点持有者的直接情绪,行为评判类和社会评判类情感词则体现了电影本身所具备的特点,这些特点可归因于社会发展角度或电影本身的特定属性。困难性主要体现在观众对于电影理解的难易程度以及对于电影制作的评价。重要性情感词通常在语料中描述为电影的意义。例如,在编号[5056]的例句中,观点持有者使用“important”一词,表达出对电影Way Down Town缺乏影响力的否定,传达出对该电影的消极情感,因此该句中的情感值为负。值得注意的是,“or even a good movie”这一短语进一步强调了情感词“important”的情感强度高于“good”,这与情感词典中“important”(+0.875)与“good”(+0.75)的差异相吻合。总体来看,在电影评论中,纯情感词汇的出现频数最高(14),其次是感情反应(9),然后是行为评判(4)、社会评判(3)、困难性(2)和重要性(1)。这种区分度受到语篇特征、词语解释和语言习惯等多种因素的影响。电影评论作为观点持有者对一部或多部影片从多个维度进行的评价,除了表达个人情感外,还可能涉及导演、演员、塑造手法、时代意义等内容[29]。当否定词与情感词直接或间接共现时,倾向于否定情感而不是否定观点,这一现象与刘英[6]在学术文本研究中的发现有所不同,体现了不同语篇类型的特征。此外,本文还发现困难性词语“hard”在经过处理的语料库中未出现,即影评中not与“hard”直接搭配的概率极低。然而在原始数据集中,“hard”以106的高频出现。这一现象说明人们的语言使用习惯同样影响情感意义与否定词的搭配。

    在多数情况下,情感词本身具有固定的极性值,因此在面对情感词出现否定、修饰等情况时,通常在固定值的基础上进行处理。当情感形容词前出现修饰词时,可以将词语按照一定的百分比值来扩大或减小强度得分[20]。针对否定词,解决的方法是将它视为减弱情感的词而非反转词。例如,“excellent”是情感值为+5的情感词,则“not excellent”在−5的基础上移动一个单位的固定值,使其成为−4,变成一个极性和强度同时变化的表达式。此外,学者发现在程序处理过程中,文本的极性偏向积极情感,并通过制定额外的加权赋值规则以消除误差[14]。但是这一方法并不适用于所有情感词汇。在对数据进行处理时,本文发现由于情感词本身强度不同,在受否定词作用时,其改变的数值并不能反映变化幅度。例如excellent在文本中发生完全翻转,则从+5改变为−5,偏折值为10;而一个情感值为+1的词语若完全翻转,偏折值仅为2。因此如果只比较情感词的偏折值,会产生较大的误差。本文进而提出了偏折率的定义,偏折率为情感词经否定后的强度与原强度之比,可反映情感词的变化程度而非数值,避免了词语本身强度带来的影响。我们对比了情感词在词典中的情感值与其在文本中受否定词not作用后的得分,并计算出了情感偏折率,详见表3

    表  3  情感词强度偏移分布表
    情感词 文本情感值 所在句得分 情感偏折率 情感意义
    (very)amusing +0.65 −0.68 −1.05 感情反应
    awful −0.875 −0.25 0.29 纯情感
    bad −0.625 −0.28 0.45 纯情感
    brilliant +0.875 −0.63 −0.72 纯情感
    classical +0.5 −0.42 −0.84 社会评判
    compelling +0.5 −0.28 −0.56 感情反应
    difficult −0.7 −0.18 0.26 困难性
    disappointed −0.5 +0.32 −1.00 感情反应
    easy +0.375 −0.24 −0.64 困难性
    (very)effective +0.325 −0.54 −1.66 行为评判
    engaging +0.875 −0.48 −0.55 感情反应
    entertaining +0.625 −0.36 −0.58 感情反应
    fresh +0.375 −0.16 −0.43 纯情感
    funny +0.5 −0.30 −0.96 感情反应
    (very)good +0.975 −0.62 −0.64 纯情感
    great +0.875 −0.54 −0.62 纯情感
    horrible −0.625 −0.40 0.64 纯情感
    (very)interesting +0.488 −0.38 −0.50 感情反应
    (very)informative +0.163 −0.318 −1.95 行为评判
    important +0.875 −0.44 −0.78 重要性
    new +0.125 −0.34 −2.72 社会评判
    (very)original +0.325 −0.6 −1.85 社会评判
    outrageous −0.875 −0.48 0.55 纯情感
    palatable +0.375 −0.12 −0.32 纯情感
    perfect +0.625 −0.33 −0.53 纯情感
    scary −0.75 −0.28 0.37 纯情感
    sharp +0.5 −0.59 −1.18 行为评判
    smart +0.5 −0.61 −1.22 行为评判
    terrible −0.625 −0.34 0.54 纯情感
    thrilling −0.5 −0.32 0.64 纯情感
    well-conceived +0.625 −0.5 −0.80 感情反应
    worst −0.75 −0.2 0.27 纯情感
    下载: 导出CSV 
    | 显示表格

    分析表3中的数据,可以发现在情感词汇与否定词not搭配时,情感值的变化并非简单地取其相反数。结合否定词not在不同情感强度中的分布频数,进一步说明在情感分析中,否定词not作为否定词时承担转移否定的频数多于翻转否定。然而,积极词汇和消极词汇在与否定词作用时,其作用效果存在明显的差异。当消极情感词与否定词not搭配时,其倾向并不会发生改变,只会在原极性内发生偏折,且偏折数普遍偏小。这表明否定词not的转移否定功能与情感词汇的语义相关。当情感词为消极时,原语义体现了观点持有者对某一属性的消极或不期待状态。当not对此类语句进行否定时,并不能说明持有者对某一属性表现为期待;相反,语义中仍带有对该属性的消极态度,但语势上得到削弱。因此,在情感分析中需要考虑对否定词not的偏折效果进行深入讨论。与消极情感词搭配时,转移否定效果可能只表现为转移强度而不改变极性。对于积极情感词,本语料库中所有与not搭配的情感词,其极性均发生改变,但偏折率存在差异。按照移动固定值的极性计算方法,得到的情感偏移率为−0.8。经计算,有七个词的偏折率超过了0.8:new、informative、original、effective、smart、sharp和classical。这些词语全部属于社会评判与行为评判类情感词,这说明否定词not作用在情感意义为评判类的词汇后,极性改变的同时情感强度得到加强,并不表达为转移否定。在偏折率未超过−0.8的情感词汇中,情感强度与情感意义同时对偏折率产生影响。在情感意义为纯情感和感情反应的词汇中,情感强度与偏折率基本呈正比关系,即情感强度高的词汇,否定词not对其语气弱化的作用较小。对于情感意义为重要性和困难性的词汇,由于样本数量较少,无法观察到明显的线性关系。加的夫语法基于情感意义和经验意义,对情感词语进行分类,其中纯情感、感情反应主观性最强,完全表达个人心理层面对于评价对象的看法;社会评判、行为评判则是观点持有者结合社会以及行为比较、评判来表达情感,该类表达的主观情绪程度小于前者。可以看出,当情感词的主观情绪度高时,否定词的转移否定效果明显,反之亦然。因此,基于加的夫语法的情感意义分类对否定词not与情感词搭配进行了更细致的区分,为情感词与否定词搭配赋值提供了新的思路。

    本文对否定词在情感分析中的影响进行了深入研究,基于否定极性系统,将否定词not单独进行分析。通过采用SST语料库并结合加的夫语法中的情感意义与经验意义对电影评论的分析,探究了否定词与情感词搭配的情况。结果表明,在电影评语领域内,not所在句的主语成分主要由单数名词构成,这些名词承担动作过程、关系过程和心理过程等不同的语法角色。在关系过程中,not主要负载于否定属性类。在情感词研究上,本文引入了系统功能语言学中的加的夫语法,该模式对词汇语法的研究以及语言多功能性的解释与悉尼语法存在差异,将元功能进行细分[30]。本文根据情感意义的定义,将情感词分为六个类别,并发现纯情感与感情反应类情感词出现频数较高,而困难性、重要性类情感词频数较低。不同类别的词语受到not的影响后,情感强度变化不同。除了这些类别之外,其他类别的词语在极性改变后强度也会减弱,这种现象被称为转移否定现象。然而,行为评判和社会评判类情感词在极性改变的同时,情感强度没有明显变化,属于翻转否定现象。借助加的夫语法对情感意义的界定有助于解释否定词在情感分析中的复杂表现,同时也为情感词的意义层次标注提供了重要的参考依据,从而增加了情感词识别与处理的准确性,为后续规则制定提供了新的思路。同时,本研究选取的语料集中于电影评论,后续研究亦可关注其他领域文本,探究不同文本特征中语法否定词与情感词搭配效果的异同。

  • 图  1  经扩展后的否定极性系统图

    表  1  否定词not发生频次前十分布表

    语气否定 频数 非语气语否定 频数
    is not 194 not + to 21
    does not 189 not + Ved 20
    can not 104 not + Ving 14
    do not 102
    it’s not 56
    will not 48
    did not 36
    may not 29
    are not 26
    has not 19
    下载: 导出CSV

    表  2  情感词类型分布表

    纯情感 社会评判 重要性 感情反应 行为评判 困难性
    awful
    bad
    brilliant
    fresh
    good
    great
    horrible
    outrageous
    palatable
    perfect
    scary
    terrible
    thrilling
    worst
    classical
    new
    original
    important amusing
    compelling
    disappointed
    engaging
    entertaining
    funny
    interesting
    well-conceived
    effective
    informative
    sharp
    smart
    difficult
    easy
    下载: 导出CSV

    表  3  情感词强度偏移分布表

    情感词 文本情感值 所在句得分 情感偏折率 情感意义
    (very)amusing +0.65 −0.68 −1.05 感情反应
    awful −0.875 −0.25 0.29 纯情感
    bad −0.625 −0.28 0.45 纯情感
    brilliant +0.875 −0.63 −0.72 纯情感
    classical +0.5 −0.42 −0.84 社会评判
    compelling +0.5 −0.28 −0.56 感情反应
    difficult −0.7 −0.18 0.26 困难性
    disappointed −0.5 +0.32 −1.00 感情反应
    easy +0.375 −0.24 −0.64 困难性
    (very)effective +0.325 −0.54 −1.66 行为评判
    engaging +0.875 −0.48 −0.55 感情反应
    entertaining +0.625 −0.36 −0.58 感情反应
    fresh +0.375 −0.16 −0.43 纯情感
    funny +0.5 −0.30 −0.96 感情反应
    (very)good +0.975 −0.62 −0.64 纯情感
    great +0.875 −0.54 −0.62 纯情感
    horrible −0.625 −0.40 0.64 纯情感
    (very)interesting +0.488 −0.38 −0.50 感情反应
    (very)informative +0.163 −0.318 −1.95 行为评判
    important +0.875 −0.44 −0.78 重要性
    new +0.125 −0.34 −2.72 社会评判
    (very)original +0.325 −0.6 −1.85 社会评判
    outrageous −0.875 −0.48 0.55 纯情感
    palatable +0.375 −0.12 −0.32 纯情感
    perfect +0.625 −0.33 −0.53 纯情感
    scary −0.75 −0.28 0.37 纯情感
    sharp +0.5 −0.59 −1.18 行为评判
    smart +0.5 −0.61 −1.22 行为评判
    terrible −0.625 −0.34 0.54 纯情感
    thrilling −0.5 −0.32 0.64 纯情感
    well-conceived +0.625 −0.5 −0.80 感情反应
    worst −0.75 −0.2 0.27 纯情感
    下载: 导出CSV
  • [1] 戴维. 现代语言学词典 [Z]. 沈家煊,译. 北京:商务印书馆,2000.
    [2] 苗兴伟. 否定结构的语篇功能[J]. 外语教学与研究,2011,43(2):220-229,230.
    [3] 梁晓波. 否定的认知分析[J]. 外语研究,2004(5):12-18,80. doi: 10.3969/j.issn.1005-7242.2004.05.003
    [4] PANG B,LEE L & VAITHYANATHAN S. Thumbs up? Sentiment classification using machine learning techniques [J/OL]. (2002-05-07)[2023-01-02]. https://arxiv.org/pdf/cs.CL/0205070.
    [5] HALLIDAY M A K & MATTHIESSEN C M I M. An Introduction to Functional Grammar [M]. London:Edward Arnold,2004.
    [6] 刘英. 否定系统与语类变体——一项基于英语学术语篇的否定概率研究[J]. 外语与外语教学,2013(1):27-30.
    [7] MARTIN J R & WHITE P R R. The Language of Evaluation:Appraisal in English [M]. London:Palgrave Macmillan,2005.
    [8] 包兴佳,罗载兵. 英语否定极性的学术语篇发生研究:系统功能语言学视角[J]. 北京科技大学(社会科学版),2022,38(5):533-542.
    [9] SUN S A & CROSTHWAITE P. 'Establish a niche’ via negation:A corpus-based study of Move 2 in Ph. D. thesis introductions across disciplines [J]. Open Linguis tics,2022,8(1):189-208. doi: 10.1515/opli-2022-0190
    [10] 张宇. 语言学视角下的国内外情感研究现状与趋势分析(2011—2020)[J]. 外国语,2022,45(1):67-68. doi: 10.3969/j.issn.1004-5139.2022.01.007
    [11] 王品. 系统功能类型学视阈下的语法描写范式——以语气系统为例[J]. 外国语(上海外国语大学学报),2022,45(5):53-64.
    [12] HATZIVASSILOGLOU V & WIEBE J M. Effects of adjective orientation and gradability on sentence subjectivity [C]// HITOSHI IIDA. Association for Computational Linguistics. Hong Kong; Stroudsburg:ACL,2000:299-305.
    [13] 张成功,刘培玉,朱振方,等. 一种基于极性词典的情感分析方法[J]. 山东大学学报(理学版),2012,47(3):47-50.
    [14] KENNEDY A & INKPEN D. Sentiment classification of movie reviews using contextual valence shifters [J]. Computational Intelligence,2006,22(2):110-125. doi: 10.1111/j.1467-8640.2006.00277.x
    [15] POLANYI L,ZAENEN A. Contextual valence shifters [J]. Computing attitude and affect in text:Theory and applications,2006,20(1):1-10.
    [16] MOILANEN K & PULMAN S. Sentiment composition [C]// RUSLAN MITKOV. International Conference Recent Advances in Natural Language Processing. Borovets:John Benjamin,2007:378–382.
    [17] CHOI Y & CARDIE C. Learning with Compositional Semantics as Structural Inference for Subsentential Sentiment Analysis [C]// ALLEN J. Association for Computational Linguistics. Columbus:ACL,2008:793-801.
    [18] SAURI R. A factuality profiler for eventualities in text [D]. Waltham:Brandeis University,2008.
    [19] BENAMARA F,CHARDON B,MATHIEU Y et al. How do negation and modality impact on opinions? [C]// MORANTE R & SPORLEDER C. Proceedings of the Workshop on Extra-Propositional Aspects of Meaning in Computational Linguistics. Korea:ACL,2012:10-18.
    [20] TABOADA M. Sentiment Analysis:An overview from linguistics [J]. Linguistics,2016(2):1-52.
    [21] 姚天昉,娄德成. 汉语语句主题语义倾向分析方法的研究[J]. 中文信息学报,2007(5):73-79. doi: 10.3969/j.issn.1003-0077.2007.05.014
    [22] 钟佳娃,刘巍,王思丽,等. 文本情感分析方法及应用综述[J]. 数据分析与知识发现,2021,5(6):1-13.
    [23] 黄国文,何伟,廖楚燕. 系统功能语法入门:加的夫模式 [M]. 北京:北京大学出版社,2008.
    [24] 张德禄. 加的夫语法述评[J]. 当代语言学,2011,13(3):247-255,286.
    [25] 高胜林. 肯定形式否定句语用探析[J]. 语文研究,2012(03):15-18. doi: 10.3969/j.issn.1000-2979.2012.03.004
    [26] FAWCETT R P. A Theory of Syntax for Systemic Functional Linguistics [M]. Cardiff:John Benjamins,2000.
    [27] 张菊芬. 从功能语法理论的角度看表达将来时间的主要语法形式[J]. 解放军外国语学院学报,2001(5):29-32. doi: 10.3969/j.issn.1002-722X.2001.05.008
    [28] 何伟,张瑞杰,淡晓红,等. 汉语功能语义分析 [M]. 外语教学与研究出版社,2017.
    [29] 许智宏,于子琪,董永峰,等. 影评情感分析知识图谱构建研究[J]. 计算机仿真,2020,37(8):424-430. doi: 10.3969/j.issn.1006-9348.2020.08.091
    [30] 黄国文. 系统功能语言学中的加的夫语法[J]. 浙江外国语学院学报,2023(3):1-24. doi: 10.3969/j.issn.2095-2074.2023.03.001
  • 加载中
图(1) / 表(3)
计量
  • 文章访问数:  259
  • HTML全文浏览量:  99
  • PDF下载量:  17
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-10-22
  • 刊出日期:  2024-07-08

目录

/

返回文章
返回