实验2词性标注
一、实验目的
1.熟悉基于平均感知机的中文词性标注算法。
2.熟悉基于隐马尔可夫链的中文词性标注算法。
二、实验内容
1.算法原理
1.1基本描述
词性标注(Part-of-Speechtagging或POStagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。在汉语中,词性标注比较简单,因为汉语词汇词性多变的情况比较少见,大多词语只有一个词性,或者出现频次最高的词性远远高于第二位的词性。本实验基于平均感知机的算法和基于隐马尔可夫链的算法,进行词性标注实验。
2.功能设计
2.1功能描述
AiNLP人工智能轻量化应用框架是一款面向于人工智能自然语言应用的开发框架,采用统一模型调用、统一硬件接口、统一算法封装和统一应用模板的设计模式,实现了嵌入式边缘计算环境下进行快速的应用开发和项目实施。
AiNLP为模型算法的调用提供RESTful调用接口,实时返回自然语言算法处理结果,同时通过物联网云平台的应用接口,实现与硬件的连接和互动,最终形成各色智联网产业应用。
三、实验步骤
1.工程部署
1.1硬件部署
1)准备人工智能边缘应用平台,给边缘计算网关正确连接Wi-Fi天线、电源。
2)按下电源开关上电启动边缘计算网关,将启动ubuntu操作系统。
3)系统启动后,连接局域网内的Wi-Fi网络,记录边缘计算网关的IP地址,比如:192.168.100.200。
1.2工程部署
1)运行MobaXterm工具,通过SSH登录到边缘计算网关(参考附录2)。
2)在SSH终端创建实验工作目录:
3)通过SSH将本实验工程代码和ainlp工程包(DISK-AILab\02-软件资料\02-综合应用\ainlp.zip)
上传到~/ainlp-exp目录下(文件的上传参考附录2)。
4)在SSH终端输入以下命令解压缩实验工程:
2.工程运行
1)通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关(参考附录2)。
2)在SSH终端输入以下命令运行实验工程:
3.文本信息提取
3.1平均感知机
1)点击应用左侧的菜单选择“平均感知机”,进入到实验页面。
2)在实验交互部分,下面的文本框为需要词性标注文本内容,填写好后点击“发送”按钮将会调用算法进行计算,并在上方的窗口显示返回应用需要的结果内容,同时在右边的实验结果部分会显示算法返回的所有内容。
3)修改需要词性标注的文本内容,查看算法返回的结果。
3.2隐马尔可夫链
1)点击应用左侧的菜单选择“隐马尔可夫链”,进入到实验页面。
2)在实验交互部分,下面的文本框为需要词性标注文本内容,填写好后点击“发送”按钮将会调用算法进行计算,并在上方的窗口显示返回应用需要的结果内容,同时在右边的实验结果部分会显示算法返回的所有内容。
3)修改需要词性标注的文本内容,查看算法返回的结果。