Latticesemi 莱迪思半导体

文章数:190 被阅读:40541

账号入驻

莱迪思教你做AI设计系列(一):下载谷歌开源图片和标签

2019-09-27
    阅读数:

前言

如果你想建立自己的目标检测网络但是你没有足够的数据集来做训练怎么办?你可以下载 Google Open Images Dataset,这里有600类超过15M的图片和bounding box标签(15,851,536 boxes on 600 categories)。


Step 1
谷歌开源数据集地址

网址链接如下 :https://storage.googleapis.com/openimages/web/index.html

600类图片:

这里可以通过Explore 查看各种分类图片,在category tab里选择要查看的种类,例如选择Coffee cup就可以看到如下的图。

这里去掉Option里的所有checkbox 例如Display segmentation filling 就可以把图片上的标记去掉,查看原图了


Step 2
下载谷歌开源数据集

谷歌的数据集很大,全部都下载的话费时间费力气。所以我们去github上下载一个很实用的工具,这样我们可以只下载自己想要的数据集,该工具下载地址如下:https://github.com/EscVM/OIDv4_ToolKit

工具使用很简单:

1,下载工具并解压

2,运行 pip install -r requirements.txt 查看自己是否已经装了所有依赖库

3,装好所有库就可以使用该工具去下载数据集了,例如我想下载咖啡杯,就输入命令 python main.py downloader --classes Caffee_cup --type_csv validation



下载完成后,在…/OID/Dateset/validation文件夹下就可以查看图片和标签。

该工具还可以结合标签查看图片,首先在OID文件夹下新建一个文件夹名字叫做:visualize_folder(或者取你自己觉得方便的名字,后面对的上就行)。然后把之前下载的OID/Dataset 下的文件夹validation拷贝到OID/visualize_folder文件夹下,执行命令:python main.py visualizer --Dataset visualize_folder


输入validation(选择查看validation这个文件夹);输入Coffee cup(选择查看Coffee cup)。

按键盘 d 查看下一张,按键盘a查看上一张。



Step 3
图片分辨率与标签格式的转换


谷歌上下载的标签是VOC格式的,Lattice的参考代码需要KITTI格式的标签,这里需要把所有标签转换成KITTI格式,下图给出两种格式的对比。

谷歌上下载的图片分辨率大小各不相同,图片也需要全部转换成正方形,转换成正方形之后再将图片缩放到固定分辨率,例如Lattice的参考训练代码中用的224*224。图片大小形状改变了之后,记得标签也应该相应的改变。

准备好了图片和标签就可以做训练了,下一篇介绍Lattice Object counting 参考设计CNN训练部分。

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved