打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Caffe 中LMDB接口处理多标签(Multi
userphoto

2016.09.29

关注

Caffe的数据接口主要有原始图像(ImageData), HDF5, LMDB/LevelDB。由于Caffe自带的图像转LMDB接口只支持但label,对于多label的任务,往往需要使用HDF5。

然而,Caffe对于HDF5的数据,需要预先读取整个h5文件,这对于小数据的情况不成问题,而且一次性读到内存里还节省训练中的IO开销。可是对于数据量大的情况,内存可能放不下整个h5文件,则需要划分成几个小的h5文件。可这样的实现一方面不优雅,另一方面训练中需要不停地轮流读取h5文件。一种可能的解决方案是把图像数据放到lmdb,label数据放到h5文件,prototxt里面label和data分别来自两个data layer。可是个人觉得这样的实现也不好看,毕竟代码里面要做HDF5和LMDB的存储。

最近从网上看到一种更直接的方法,大致是结合Python的LMDB库和Caffe的Python 接口 caffe.io.array_to_datum,把图像数据和label,分别存储到两个lmdb文件。而对于存储好的lmdb,又怎样写prototxt里面的datalayer来读取呢?目前caffe的datalayer, 指明了LMDB作为backend的话,默认第一个top就是存储lmdb时datum的data,第二个top就是datum的label,在下面的代码里没有指定datum的label,因此,对于data和label的lmdb,分别写一个datalayer, 每个datalayer的第一个top就是对应lmdb里的内容了。而top的blob的名字是可以自己定义的。
代码如下:

  1. def write_lmdb(image_name_list,label_array,lmdb_img_name,lmdb_label_name,resize_image = False):
  2. for lmdb_name in [lmdb_img_name, lmdb_label_name]:
  3. db_path = os.path.abspath(lmdb_name)
  4. if os.path.exists(db_path):
  5. shutil.rmtree(db_path)
  6. counter_img = 0
  7. counter_label = 0
  8. batchsz = 100
  9. fail_cnt = 0
  10. print("Processing {:d} images and labels...".format(len(image_name_list)))
  11. for i in xrange(int(np.ceil(len(image_name_list)/float(batchsz)))):
  12. image_name_batch = image_name_list[batchsz*i:batchsz*(i+1)]
  13. label_batch = label_array[batchsz*i:batchsz*(i+1),:]
  14. print label_batch[np.newaxis,np.newaxis,0].dtype
  15. raw_input('r')
  16. imgs, labels = [], []
  17. for idx,image_name in enumerate(image_name_batch):
  18. img = skimage.io.imread(image_name)
  19. if resize_image==True:
  20. img = skimage.transform.resize(img,(96,96))
  21. imgs.append(img)

  22. db_imgs = lmdb.open(lmdb_img_name, map_size=1e12)
  23. with db_imgs.begin(write=True) as txn_img:
  24. for img in imgs:
  25. datum = caffe.io.array_to_datum(np.expand_dims(img, axis=0))
  26. txn_img.put("{:0>10d}".format(counter_img), datum.SerializeToString())
  27. counter_img += 1
  28. print("Processed {:d} images".format(counter_img))
  29. db_labels = lmdb.open(lmdb_label_name, map_size=1e12)
  30. with db_labels.begin(write=True) as txn_label:
  31. for idx in range(label_batch.shape[0]):
  32. datum = caffe.io.array_to_datum(label_batch[np.newaxis,np.newaxis,idx])
  33. txn_label.put("{:0>10d}".format(counter_label), datum.SerializeToString())
  34. counter_label += 1
  35. print("Processed {:d} labels".format(counter_label))
  36. print fail_cnt,'images fail reading'
  37. db_imgs.close()
  38. db_labels.close()
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Caffe: MNIST 数据集格式转换、用 python 读写 LMDB 数据库
利用GPU和Caffe训练神经网络
从docker中运行caffe
GAN在单细胞上的应用
Caffe 深度学习框架上手教程
Caffe学习数据层及参数设置
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服