图像处理基本库的学习笔记5--公共数据集,PASCAL VOC数据集,NYUD V2数据集的简介与提取,COCO2017,医学影像数据集汇总_nyudv2数据集-程序员宅基地

技术标签: 图像处理基本库的学习笔记  

公共数据集

《基于全卷积神经网络的图像分割算法的研究及应用》

实验数据:本章节的公共数据集来源自计算机视觉领域的 PASCAL VOC 2012、NYUDv2、PASCAL CONTEXT,医学数据集来自法国 IRCAD 国际医疗中心数据库中的肝脏 CT 扫描图像。

本节按照 4:1 的比例将两个数据集分别划分成训练和测试两部分。在算法中,就会使用训练那部分完成算法网络模型的构建,在训练的过程中,为参数赋予不同值从而获得不同的结果,之后利用测试集对网络模型的结果进行记录和分析。
在这里插入图片描述

计算机视觉标准数据集整理—PASCAL VOC数据集

参考文章:https://blog.csdn.net/xingwei_09/article/details/79142558

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge。此数据集可以用于图像分类、目标检测、图像分割
在这里插入图片描述

包括任务
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述数据集简介

训练集由一套图像组成:每个图像拥有一个对应的标注文件,给出了图像中出现的物体的bounding box和class label,该物体属于上述20类中的某一类。同一张图像中,可能出现属于多个类别的多个物体。

所有的标注图片都有Detection需要的label,但只有部分数据有Segmentation Label。

VOC2007中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。

对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。

对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。

这些图像中的一部分图像还拥有像素级的标注,用于segmentationcompetition.

用于action classification的图片集与用于classification/detection/segmentation的图片集不相交。它们被部分地标注上了图像中人的bounding box,参考点和动作。

用于person layout taster的图像,被额外的标注上了人的身体部位(头、手、脚),其测试集与主任务(classification/detection)的测试集不相交。

数据集按1:1的比例被分为训练(验证)集和测试集。这两部分的图像中类别的分布也大致相等。

数据集文件结构

在这里插入图片描述

Annotation

Annotations文件夹中存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹中的一张图片。
在这里插入图片描述
在这里插入图片描述Action是下存放的是人的动作(running、jumping等等,这也是VOC challenge的一部分)

Layout下存放的是人体部位(head、hand、feet等等,这也是VOC challenge的一部分)

Main下存放的是图像物体识别的数据,总共分为20类

Segmentation下存放的是可用于分割的图片的编号

JPEGImages

JPEGImages文件夹中包含了PASCAL VOC所提供的所有的图片,包含训练图片和测试图片,共有17125张。图片均以“年份_编号.jpg”格式命名。图片的尺寸大小不一,所以在后面训练的时候需要对图片进行resize操作。

图片的像素尺寸大小不一,但是横向图的尺寸大约在500375左右,纵向图的尺寸大约在375500左右,基本不会偏差超过100。(在之后的训练中,第一步就是将这些图片都resize到300300或是500500,所有原始图片不能离这个标准过远,具体resize方式可以看最下面github链接里data.py。)

SegmentationClass

这里面包含了2913张图片,每一张图片都对应JPEGImages里面的相应编号的图片。图片的像素颜色共有20种,对应20类物体。
在这里插入图片描述

SegmentationObject

这里面同样包含了2913张图片,图片编号都与Class里面的图片编号相同。这里面的图片和Class里面图片的区别在于,这是针对Object的。
在这里插入图片描述
在Class里面,一张图片里如果有多架飞机,那么会全部标注为红色。而在Object里面,同一张图片里面的飞机会被不同颜色标注出来。

下载结果:
在这里插入图片描述

NYUD V2数据集的简介与提取

参考文章:https://blog.csdn.net/weixin_43915709/article/details/88774325

数据集:https://github.com/ankurhanda/nyuv2-meta-data

使用NYUDv2数据集进行语义分割的时候会发现,从官网直接下载的数据集有894类,而发现在许多论文中描述的是40类,有的也称作nyudv2-40;一些研究中也出现了13类的标签。

这里给出了40分类的label数据集:

labels40.mat,可直接进行提取# 从mat文件提取labels# 需要注意这个文件里面的格式和官方有所不同,长宽需要互换,也就是进行转置

import cv2
import scipy.io as scio
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import os 

dataFile = './labels40.mat'
data = 
scio.loadmat(dataFile)
labels=np.array(data["labels40"]) 

path_converted='./nyu_labels40'
if not os.path.isdir(path_converted):    os.makedirs(path_converted) 

labels_number=[]
for i in range(1449):        
    labels_number.append(labels[:,:,i].transpose((1, 0))) # 转置    
    labels_0=np.array(labels_number[i])    
    #print labels_0.shape    
    print (type(labels_0))
    
    label_img=Image.fromarray(np.uint8(labels_number[i]))    
    #label_img = label_img.rotate(270)    
    label_img = label_img.transpose(Image.ROTATE_270)     
    iconpath='./nyu_labels40/'+str('%06d'%(i+1))+'.png'
    label_img.save(iconpath, optimize=True)

下载结果:
在这里插入图片描述

COCO2017

参考文章:https://blog.csdn.net/qq_41847324/article/details/86224628

COCO数据集可以说是语义分割等计算机视觉任务中应用较为广泛的一个数据集,具体可以应用到物体识别、语义分割及目标检测等方面。

国内下载地址:http://fun001.f3322.net:666/share/coco2017/
在这里插入图片描述
COCO数据集介绍

网上关于COCO数据集的介绍多如牛毛,本文就不过多的加以介绍了,简要的介绍以下。
以COCO2014为例:
下载完COCO2014后进行解压后,目录如下:

images

  train2014
  val2014
  test2014

annotations

其中,images中的文件夹各自放置了训练、验证和测试的数据集图片。annotations文件夹中放置了标签文件,可以理解为Label,简要的来说,就是包含了某一类在图片中的具体位置的信息,
详细可见以下链接:https://blog.csdn.net/happyhorizion/article/details/77894205#semantic-scene-labeling图像分割
三、COCO数据集使用(数据载入)

所需环境为:
numpy
torch
tqdm(可视化数据载入)
os
pycocotools(coco数据集的应用API)
torchvision
PIL

医学影像数据集汇总

本文转自:https://blog.csdn.net/sinat_37842336/article/details/80582948

1、肺结节数据库LIDC-IDRI:

CSDN数据库介绍:http://blog.csdn.net/dcxhun3/article/details/54289598

数据库网址:https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI

2、乳腺图像数据库DDSM MIAS

数据库介绍(DDSM SQL Data Base):http://deckard.mc.duke.edu/ddsm_sql/book1.html

图片格式为LJPEG需要使用对应的压缩方法对其进行解压,目前找到了xMedcon,但是不太会用,打不开相应的文件,也可能是不是使用这个软件压缩的。不过这个软件可以用来转换大部分的医学图像。matlab社区上有how to open lossless jpeg file,但是其中有一些答案提供的网址不能打开,可能是没有科学上网??

数据库网址:http://figment.csee.usf.edu/Mammography/Database.html

MIAS MiniMammographic Database(来自researchgate的一个问答):322例,尺寸:1024*1024pixel,图像数据是PGM格式,找到一个介绍和读取的博客代码使用的c,matlab问答相关

小型乳房X光数据库:http://peipa.essex.ac.uk/pix/mias/all-mias.tar.gz

这也是一个乳腺的图像数据库,但是现在还没有搞清楚下载、格式之类的:https://www.repository.cam.ac.uk/handle/1810/250394?show=full

3、医学图像问答(目前还没搞清楚干嘛的,好像是一个网站的问答。暂存)

网址:http://www.dclunie.com/medical-image-faq/html/index.html

4、左心室MRI图像Cardiac MRI Dataset: http://www.cse.yorku.ca/~mridataset/

右心室MRI数据RVSC

右心室分割挑战赛(2012):http://pagesperso.litislab.fr/cpetitjean/mr-images-and-contour-data/

5、Kaggle比赛网址:https://www.kaggle.com/

CT Medical Image Analysis Turorial这个比赛好像是分析CT纹理与患者年龄的关系。

肺癌分类比赛:https://www.kaggle.com/c/data-science-bowl-2017/data

分割肺癌(Kaggle):https://www.kaggle.com/kmader/finding-lungs-in-ct-dataDICOM文件打开使用Sante

DICOM Free,paraview也可以打开,Mango网站:https://idoimaging.com/programs/124;anteDicom

官方下载网址:http://www.santesoft.com/win/sante-dicom-viewer-free/download.html

6、Cancer Imaging Archive这个网站可以获得一些癌症的数据库,下载下来是jnpl文件需要使用jre环境进行下载:http://www.cancerimagingarchive.net/

7、OsiriX数据库:各种医学数据,好像得注册收费的样子,还没搞清楚http://www.osirix-viewer.com/resources/dicom-image-library/

8.Github上哈佛 beamandrew机器学习和医学影像研究者-贡献的数据集https://github.com/beamandrew/medical-data

9.ISBI(生物医学成像国际研讨会)https://grand-challenge.org/All_Challenges/

10.NITRC的IBSR数据集

左心房图像分割集

心脏MRI数据集该网页包含短轴心脏MR图像数据集及其左心室心内膜和心外膜分割的基本事实。
该数据集首先被编译并用作以下论文的一部分:Alexander Andreopoulos,John K. Tsotsos,用于分析心脏MRI的形状和外观的高效和一般化统计模型,医学图像分析,第12卷,第3期,2008年6月,第335-357页。

PDF使用是免费的; 我们恭敬地问,如果您使用此数据集,则引用上述文章作为其来源。作者要感谢多伦多儿童医院心脏放射科医师Paul Babyn博士和心脏放射学家Shi-Joon Yoo博士的数据集以及他们对该研究项目的帮助。

免责声明:数据集仅供研究之用,约克大学和参与数据集生成的研究人员均未提供担保或担保。

从33个科目获得的心脏MR图像。每个主题的序列由沿长轴的20帧和8-15个切片组成,**总共7980个图像。对应于每个主题x的序列位于名为sol_yxzt_patx.mat的不同的.mat(MATLAB)文件中。**这些是未经处理的原始图像,最初存储为16位DICOM图像。下载上述序列的分段。

我们手动分割了7980个图像中的每一个,其中左心室的心内膜和心外膜都是可见的,总共5011个分割的MR图像和10022个轮廓。对应于每个主题x的分段位于名为manual_seg_32points_patx.mat的不同的.mat(MATLAB)文件中。每个轮廓由像素坐标中给出的32个点描述。

两个小的MATLAB函数,用于可视化相应图像上的分割。
请参阅随附的README文件以获取其使用示例。下载包含像素间距(每像素mm)的元数据,每个受试者序列的长轴(每片的mm)之间的间距,每个受试者的年龄和诊断。

都看到这里了,不如点个赞哦~
在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_42784535/article/details/104596004

智能推荐

电路基础(2)电阻电路的等效变换-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏20次。电路基础(2)电阻电路的等效变换_电阻电路的等效变换

JS前端获取上传文件的大小的方法-程序员宅基地

文章浏览阅读818次。WEB应用中,经常会遇到上传附件的问题,比如有时候会有限制附件大小的需求。那么如何去判断附件的大小呢? 方法如下:(遗憾的IE中只能判断出图片文件的大小) <html> <head> <title>JS获取文件大小 </title> <script type='text/javascript'> ..._js ios 上传时获取不到文件的大小

Apache的参数设置_org.apache.johnzon.max-string-length-程序员宅基地

文章浏览阅读3.4k次。以prefork模式为例来说明参数的设置,其缺省设置一般如下: ServerLimit 2000 StartServers 5 MinSpareServers 5 MaxSpareServers 10 _org.apache.johnzon.max-string-length

Wireshark_window size是发送窗口还是接收窗口-程序员宅基地

文章浏览阅读783次,点赞16次,收藏24次。wireshark抓HTTP包。_window size是发送窗口还是接收窗口

Nginx日志切割 手动+定时两种方式 非常详细_nginx 定时任务-程序员宅基地

文章浏览阅读1.2k次。Nginx日志切割 手动+定时两种方式 非常详细_nginx 定时任务

在Linux上使用yolov7训练自己的数据集【从零开始的教程】_yolov7的数据集格式-程序员宅基地

文章浏览阅读632次。yolov7的文件夹打开之后是这个样子啦以下是三个常见已经标注好的yolo格式数据集会按照以下格式进行存放train.txtval.txt网上有很多几种格式互相转换的教程。_yolov7的数据集格式

随便推点

【论文笔记_自监督知识蒸馏】Refine Myself by Teaching Myself : Feature Refinement via Self-Knowledge Distillation_frskd-程序员宅基地

文章浏览阅读3.7k次,点赞4次,收藏17次。通过自学来完善自己:基于自知识蒸馏的特征提取作者:Mingi Ji, Seungjae Shin, Seunghyun Hwang, Gibeom Park1Il-Chul Moon摘要知识提取是一种将知识从预先训练的复杂教师模型转移到学生模型的方法,因此在部署阶段,较小的网络可以取代较大的教师网络。为了减少培训大型教师模型的必要性,最近的文献介绍了一种自我知识蒸馏方法,该方法在没有预先培训的教师网络的情况下,逐步训练学生网络提取自己的知识。虽然自知识蒸馏在很大程度上分为基于数据增强的方法和基于辅助_frskd

PHP实现的封装验证码类详解及实例代码_php生成验证码代码-程序员宅基地

文章浏览阅读115次。通过封装验证码类,我们可以方便地生成验证码、输出验证码图像和验证用户输入的验证码。在PHP中,我们可以通过封装一个验证码类来实现验证码的生成和验证功能。这个类将包含生成验证码、输出验证码图像和验证用户输入的验证码等方法。的类,其中包含了生成验证码、创建图像资源、绘制验证码图像、输出验证码图像和验证用户输入的验证码等方法。在这个方法中,我们使用了包含数字和字母的字符集,通过随机选择字符来生成验证码。通过上述步骤,我们可以实现一个基本的验证码功能,并且可以在需要验证用户身份的地方使用它。方法绘制验证码图像。_php生成验证码代码

org.mockito.exceptions.misusing.MissingMethodInvocationException-程序员宅基地

文章浏览阅读1.3w次。powermock 常遇到的问题之一,如果你需要mock一个静态方法,可能你会发现抛出如下异常org.mockito.exceptions.misusing.MissingMethodInvocationException: when() requires an argument which has to be 'a method call on a mock'.For exa..._org.mockito.exceptions.misusing.missingmethodinvocationexception: when() req

proto unmarshal失败的问题_proto.unmarshal-程序员宅基地

文章浏览阅读1.3k次。239 191 189_proto.unmarshal

VSCode调试PHP_vscode php 调试-程序员宅基地

文章浏览阅读1.5w次,点赞8次,收藏26次。1、安装PHP Debug2、配置php.ini[xdebug]; zend_extension = D:\DEVTOOLS\PHP\php72\ext\php_xdebug-2.7.1-7.2-vc15-x86_64.dllzend_extension = "D:\DEVTOOLS\PHP\php72\ext\php_xdebug-2.7.2-7.2-vc15-x86_64.d..._vscode php 调试

php 生成验证码(带旋转和干扰线条)_php验证码干扰线-程序员宅基地

文章浏览阅读5.3k次。带旋转和干扰线条的验证码生成函数,代码如下:<?php // 把字符串做出验证码图片 // string $text,要处理的字符串 // int $linect,需要混淆的线条个数 // int $fontsize,字体大小,1到5 // bool $rotate,是否旋转 // array $textcol,字体颜色RGB值,array(R,G,B) // array $_php验证码干扰线</div>

推荐文章

热门文章

相关标签