上QQ阅读APP看书,第一时间看更新
AI源码解读.数字图像处理案例:Python版
3.3.1 数据预处理
数据集链接为http://download.tensorflow.org/example_images/flower_photos.tgz,文件夹包含5个子文件,每个子文件夹的名称为一种花,代表不同类别。平均每种花有734张图片,每张图片都是RGB色彩模式,大小不同,程序将直接处理未整理过的图像数据。通过本地导入加载数据集,相关代码如下:
从数据文件夹中读取所有图片名并组织成列表的形式,按训练、验证和测试集分开。再将图片分开后,根据随机得到的一个分数值判断这个图片被分到哪一类数据。带有一定的偶然性,并不能确保有多少张图片属于某一个数据集。读取图片成功示意如图3-7所示。
图3-7 读取图片成功示意图
对图片进行预处理,例如,将图片名整理成一个字典、获得并返回图片的路径以及计算得到特征向量等。相关代码如下: