打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
深度学习实战 图像数据集预处理总结

深度学习实战 cifar数据集预处理技术分析

深度学习实战 fashion-mnist数据集预处理技术分析

深度学习实战 mnist数据集预处理技术分析

通过分析keras提供的预定义图像数据集,总结如下:

(1) mnist数据集采用numpy的npz方式以一个文件的方式存储文件,加载后就可以直接得到四个数组,非常方便。

(2) fshion-mnist数据集利用四个gz格式压缩包存储四个数组的内容,加载后利用numpy的frombuffer()方式加载数组。

(3) cifar数据集则是将训练集分为五个文件,每个一万条,测试集一个文件,利用pickle的dump()方法以字典的方式写入文件,然后通过pickle的load()方法加载字典,在字典中保存了data和labels.

三种不同的方式处理了三种数据集,各有特点,对于今后处理图像数据集具有非常好的借鉴价值。 今后在做图像分析处理任务的时候,可以将任务分为两个阶段,第一阶段为数据预处理,第二阶段为数据分析。

第一阶段的主要任务是收集有标签的图片数据,进行清洗,然后以numpy数组(x_train, y_train, x_test, y_test)格式的形式保存为npz格式的文件。

第二阶段直接读取npz文件就可以得到x_train, y_train, x_test, y_test四个数组,就可以非常方便的得到数据,建立模型,开始分析。

两个任务以pipeline的方式进行,可以极大的提升效率。

 where2go 团队


微信号:算法与编程之美          

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Pytorch读取,加载图像数据(一)
灵魂画手已上线 请注意查收您的谷歌小工具“Quick draw”
实战:基于OpenCV的人眼检测
Python Numpy数组保存
深度学习中实现PyTorch和NumPy之间的数据转换知多少?
只需10分钟即可构建您的图像分类模型!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服