悟空考考你:识别警报器
八戒听完恍然大悟,说道:“我懂了,猴哥。也就是说声音像图像一样传入人脑中,我们的大脑对声音进行辨别,而人工智能就是模仿人脑去分析声音的信号,对吗?”
悟空点点头,说道:“你这句话说得倒是准确。不过,我还是要给你出道考题考考你。”
悟空的考题
悟空要出考题考考八戒,看看他是不是真的掌握了声音分类的技能。森林里有很多类型的警报器,如110警报器、120警报器。当触发某一种警报后,就会通知相应的人员和组织,比如触发110警报就应该通知警察,120警报应该通知医院。
如何能够自动分辨是何种警报声,并自动通知相应人员?
八戒听后,拍着胸脯说道:“这个很简单,只要我能区分出警报的类别就可以了。”
八戒的“顺风灵耳”
八戒来到EasyDL平台,说道:“看我老猪来分辨警报类型。”
实验2
识别警报器
第一步 创建模型
这个阶段的主要任务是选择平台类型,确定模型类型,配置模型基本信息(包括名称等),并记录希望模型实现的功能。
(1)打开EasyDL平台主页,网址为https://ai.baidu.com/easydl/,如图5-22所示。
点击图5-22中的按钮,显示如图5-23所示的“快速开始”选择框。训练平台选择,模型类型选择,点击按钮,显示图5-24所示的操作台页面。
图5-22 EasyDL平台主页
图5-23 选择平台版本和模型类型
图5-24 操作台页面
(2)在图5-24所示的操作台页面创建模型。
点击操作台页面中的按钮,显示的页面如图5-25所示,填写模型名称识别警报器,模型归属选择,填写联系方式、功能描述等信息,点击按钮,完成模型创建。
图5-25 创建模型
(3)模型创建成功后,可以在列表中看到刚刚创建的模型识别警报器,如图5-26所示。
图5-26 模型列表
第二步 准备数据
这个阶段的主要任务是根据具体声音分类的任务准备相应的数据集,并把数据集上传到平台,用来训练模型。
(1)准备数据集。
首先扫描封底二维码下载压缩包,在[下册-第5章-实验2]中找到模型训练所需的声音数据。对于识别警报器任务,我们准备了两种类型的警报声音,分别为110警报和120警报。
然后,需要将准备好的声音数据按照分类存放在不同的文件夹里,文件夹名称即为声音对应的类别标签(110、120)。此处要注意,声音类别名即文件夹名称,需要采用字母、数字或下划线的格式,不支持中文命名。
最后,将所有文件夹压缩,命名为jingbao.zip,压缩包的结构示意图如图5-27所示。
图5-27 压缩包结构示意图
(2)上传数据集。
点击图5-28显示的中的按钮,进行数据集创建。如图5-29所示,填写数据集名称,点击按钮,选择jingbao.zip压缩包。可以在如图5-30所示的页面中下载示例压缩包,查看数据格式要求。
选择好压缩包后,点击按钮,成功上传数据集。
(3)查看数据集。
上传成功后,可以在中看到数据的信息,如图5-31所示。数据上传后,需要一段处理时间,大约为几分钟,然后就可以看到数据上传的结果,如图5-32所示。
图5-28 创建数据集
图5-29 选择压缩包
图5-30 上传数据集
图5-31 数据集展示
图5-32 数据上传结果
点击,可以看到数据的详细情况,如图5-33所示。
图5-33 数据集详情
第三步 训练模型并校验结果
在前两步已经创建好了一个声音分类模型,并且创建了数据集。本步骤的主要任务是用上传的数据一键训练模型,并且模型训练完成后,可在线校验模型效果。
(1)训练模型。
在第二步的数据上传成功后,在中,选择之前创建的识别警报器模型,添加分类数据集,开始训练模型。训练时间与数据量有关,在训练过程中,可以设置训练完成的短信提醒并离开页面,如图5-34~图5-37所示。
图5-34 添加数据集
图5-35 选择数据集
图5-36 训练模型
图5-37 模型训练中
(2)查看模型效果。
模型训练完成后,在列表中可以看到模型效果,以及详细的模型评估报告,如图5-38和图5-39所示。从模型训练的整体情况来看,该模型的训练效果还是比较优异的。
图5-38 模型训练结果
图5-39 模型整体评估
(3)校验模型。
我们可以在中对模型的效果进行校验。
首先,点击按钮,如图5-40所示,大约需要等待5分钟。
图5-40 启动校验服务
然后,准备一条声音数据,点击按钮添加音频,如图5-41所示。
图5-41 添加音频
最后,使用训练好的模型对上传的音频进行预测,如图5-42所示,显示音频属于110警报的概率是100%。
图5-42 校验结果
这样,八戒成功识别出警报器的类型,通过了悟空的考验。