实验18短文本相似度
一、实验目的
1.熟悉百度AI云服务的基本情况。
2.熟悉百度短文本相似度接口的调用方式。
二、实验内容
1.算法原理
1.1基本描述
本实验短文本相似度采用百度的短文本相似度接口来实现,短文本相似度接口用来判断两个文本的相似度得分。短文本相似度,即求解两个短文本之间的相似程度,它是文本匹配任务或文本蕴含任务的一种特殊形式,返回文本之间相似程度的具体数值。在很多应用中都需要根据文本来检索其相似文本,需求场景非常普遍。不仅适用于纯文本检索,还可以利用标签等来检索图片、视频。
2.功能设计
2.1功能描述
AiNLP人工智能轻量化应用框架是一款面向于人工智能自然语言应用的开发框架,采用统一模型调用、统一硬件接口、统一算法封装和统一应用模板的设计模式,实现了嵌入式边缘计算环境下进行快速的应用开发和项目实施。
AiNLP为模型算法的调用提供RESTful调用接口,实时返回自然语言算法处理结果,同时通过物联网云平台的应用接口,实现与硬件的连接和互动,最终形成各色智联网产业应用。
AiNLP框架如下图所示:
三、实验步骤
1.工程部署
1.1硬件部署
1)准备人工智能边缘应用平台,给边缘计算网关正确连接Wi-Fi天线、电源。
2)按下电源开关上电启动边缘计算网关,将启动ubuntu操作系统。
3)系统启动后,连接局域网内的Wi-Fi网络,记录边缘计算网关的IP地址,比如:192.168.100.200。
1.2工程部署
1)运行MobaXterm工具,通过SSH登录到边缘计算网关。
2)在SSH终端创建实验工作目录:
3)通过SSH将本实验工程代码和ainlp工程包上传到目录下。
4)在SSH终端输入命令解压缩实验工程
2.算法测试
本实验需要登录百度智能云控制台,开通百度自然语言处理-短文本相似度服务,并领取免费资源,
然后创建百度应用。
1)修改算法文件algorithm\baidu_simnet\baidu_simnet.py内的单元测试代码,填写正确的百度账号信息。
2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关。
3)在SSH终端输入命令运行算法进行单元测试,在终端打印识别的结果:
3.工程运行
1)修改工程配置文件static\baidu_short_text_similarity\js\config.js内的百度账号信息,填写正确的百度账号信息。
2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关。
3)在SSH终端输入命令运行实验工程:
4.短文本相似度
1)点击应用左侧的菜单选择“文本相似度”,进入到实验页面。
2)在实验交互部分,下面的文本框为需要判断文本相似度的内容,填写好后点击“发送”按钮将会调用算法进行计算,并在上方的窗口显示返回应用需要的结果内容,同时在右边的实验结果部分会显示算法返回的所有内容。
3)修改需要判断文本相似度的内容,查看算法返回的结果。