实验17文本内容识别
一、实验目的
1.熟悉百度AI云服务的基本情况。
2.熟悉百度文本内容识别接口的调用方式。
二、实验内容
1.算法原理
1.1基本描述
本实验文本内容识别采用百度的地址识别接口来实现,针对快递、电商行业中客户在线提交的大量非结构化地址单据,地址识别接口可以帮助提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别(属于文本内容识别教程),生成标准规范的结构化信息,大幅提升企业处理单据的效率。
2.功能设计
2.1功能描述
AiNLP人工智能轻量化应用框架是一款面向于人工智能自然语言应用的开发框架,采用统一模型调用、统一硬件接口、统一算法封装和统一应用模板的设计模式,实现了嵌入式边缘计算环境下进行快速的应用开发和项目实施。
AiNLP为模型算法的调用提供RESTful调用接口,实时返回自然语言算法处理结果,同时通过物联网云平台的应用接口,实现与硬件的连接和互动,最终形成各色智联网产业应用。
AiNLP框架如下图所示:
三、实验步骤
1.工程部署
1.1硬件部署
1)准备人工智能边缘应用平台,给边缘计算网关正确连接Wi-Fi天线、电源。
2)按下电源开关上电启动边缘计算网关,将启动ubuntu操作系统。
3)系统启动后,连接局域网内的Wi-Fi网络,记录边缘计算网关的IP地址,比如:192.168.100.200。
1.2工程部署
1)运行MobaXterm工具,通过SSH登录到边缘计算网关。
2)在SSH终端创建实验工作目录:
3)通过SSH将本实验工程代码和ainlp工程包(DISK-AILab\02-软件资料\02-综合应用\ainlp.zip)上传到~/ainlp-exp目录下。
4)在SSH终端输入以下命令解压缩实验工程:
2.算法测试
本实验需要登录百度智能云控制台,开通百度自然语言处理-地址识别服务,并领取免费资源,然后创建百度应用。
1)修改算法文件algorithm\baidu_address_recognition\baidu_address_recognition.py内的单元测试代码,填写正确的百度账号信息。
2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关。
3)在SSH终端输入以下命令运行算法进行单元测试,在终端打印识别的结果:
3.工程运行
1)修改工程配置文件static\baidu_textcontent_recognition\js\config.js内的百度账号信息,填写正确
的百度账号信息。
2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关。
3)在SSH终端输入以下命令运行实验工程:
4.文本内容识别
1)点击应用左侧的菜单选择“文本内容识别”,进入到实验页面。
2)在实验交互部分,下面的文本框为需要识别的文本内容,填写好后点击“发送”按钮将会调用算法进行计算,并在上方的窗口显示返回应用需要的结果内容,同时在右边的实验结果部分会显示算法返回的所有内容。
3)修改需要识别的文本内容,查看算法返回的结果。