基本信息
文件名称:《自然语言处理技术及应用》教案 项目8 情感分析.docx
文件大小:8.19 MB
总页数:10 页
更新时间:2025-05-26
总字数:约1.16万字
文档摘要

PAGE10

PAGE10

PAGE9

PAGE9

课题

情感分析

课时

6课时(270min)

教学目标

知识目标:

(1)了解情感分析的基本概念和主要内容

(2)掌握基于情感词典的情感分析流程

(3)掌握基于机器学习的情感分析流程

(4)掌握长短期记忆神经网络、Seq2Seq模型和Attention机制的基本原理

技能目标:

(1)能够使用基于情感词典的分析方法进行文本情感分析

(2)能够使用基于机器学习的分析方法进行文本情感分析

(3)能够使用基于长短期记忆神经网络进行文本情感分析

素养目标:

(1)掌握情感分析的方法,提高选择合适的方法解决不同问题的能力

(2)提升对情感分析领域的敏锐洞察力和批判性思维,能够从海量情感数据中筛选出关键线索,从而提出有效的解决方案

教学重难点

教学重点:情感分析的基本概念和主要内容,基于情感词典的情感分析流程,基于机器学习的情感分析流程,长短期记忆神经网络、Seq2Seq模型和Attention机制的基本原理

教学难点:能够使用基于情感词典、机器学习的分析方法进行文本情感分析,能够使用基于长短期记忆神经网络进行文本情感分析

教学方法

案例分析法、问答法、讨论法、讲授法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

课前任务

【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,收集情感分析的相关知识,并进行了解

【学生】提前上网观看相关资料,熟悉教材

考勤

【教师】使用APP进行签到

【学生】按照老师要求签到

问题导入

【教师】播放“情感分析的常见应用”视频,并提出以下问题:

问题1:情感分析是一种重要的__________技术,已经被广泛应用于多个领域。

问题2:简述情感分析的常见应用。

【学生】观看、思考、讨论、回答

传授新知

【教师】通过学生的回答,引入新知,讲解情感分析的基本概念和主要内容,基于情感词典的情感分析流程,基于机器学习的情感分析流程,长短期记忆神经网络、Seq2Seq模型和Attention机制的基本原理等知识

8.1情感分析概述

情感分析是指对具有情感倾向的文本进行分析、处理、归纳和推理的过程,它旨在从文本数据中识别和提取用户的情感倾向,如积极态度和消极态度等。

情感分析的主要内容包括主客观分类和情感极性判断两类。

(1)主客观分类:用于区分文本内容是基于主观视角还是客观事实。主观视角通常反映某个人的情感、观点和态度,而客观事实则更多地描述事实、数据和不带个人情感倾向的信息。

(2)情感极性判断:用于将文本表达的情感划分为积极、消极或中性?3?类。在这个过程中,分析者会关注文本中的词、短语和句子结构,以识别其中蕴含的情感倾向。

……(详见教材)

8.2常用的情感分析方法

8.2.1基于情感词典的分析方法

基于情感词典的分析方法是一种常见的情感分析技术,它主要依赖于预先构建的情感词典来对文本进行情感倾向的识别和分类。

情感词典主要包括情感词、否定词和程度副词。其中,情感词具有极性和强度两种属性,极性指情感词表达出的正面或负面情感,强度指情感的强弱;否定词用于表示否定含义,如可将正面情感转换为负面情感;程度副词可增强或减弱情感强度。在基于情感词典的分析方法中,情感词典至关重要,用户可根据自己的需求构建情感词典,也可使用已有的情感词典,如BosonNLP。

?【高手点拨】

BosonNLP是基于微博、新闻和论坛等数据来源构建的情感词典。在BosonNLP情感词典中,文本每行为一个情感词及其对应的情感分值,且以空格分隔。其中,情感分值为负数,表示该情感词为负面词语;情感分值为正数,表示该情感词为正面词语;情感分值的绝对值越大,表示的情感强度越高。

基于情感词典的情感分析流程如下。

(1)对文本进行分词,并删除停用词。

(2)遍历分词后的词列表,匹配情感词、程度副词和否定词。

(3)根据情感词的情感分值及其在文本中是否被否定词和程度副词修饰,来计算情感词的情感得分,然后将所有情感词的情感得分进行累加,得到文本的情感得分。

?【教师】通过例题,帮助学生掌握基于情感词典的分析方法

【例?8-1】编写程序,使用基于情感词典的分析方法(情感词典使用BosonNLP)对文本“今天天气晴朗,我非常开心地买了一束鲜艳的花”和“天阴沉沉的,荒无人烟的路边是破旧不堪的老房子”分别进行情感分析。

?【指点迷津】

例8-1所使用的停用词表文件“stopwords.txt”、情感词典文件“BosonNLP_sentiment_

score.txt”、否定词文件“否定词.txt”和程度副词文件“程度副词.txt”可在本教材配套资源“item8/data”中获取。

【参考代码】

fromcollectionsi