收藏 | 语义分割数据集总结-程序员宅基地

技术标签: 机器学习  计算机视觉  深度学习  人工智能  编程语言  

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自|视觉算法

图片来源于网络

语义分割在自然数据集的分割效果不断进步,有研究逐步应用到了遥感领域,尤其是高分辨率遥感影像。由于遥感图像具有海量数据,尺度依赖,空间相关性强的特点,能够很好地用语义分割的方法来提取地物或进行分类。

随着全卷积神经网络的提出,卷积网络不仅在全图式的分类上有所提高,也在结构化输出的局部任务上取得了进步。全卷积神经网络实现了对图像进行像素级的分类,从而解决了语义级别的图像分割问题。

本期对现有的10个遥感语义分割数据集进行总结,并附上下载链接,供大家对自己的算法进行测试。

分享的语义分割数据集如下:

1. Gaofen Image Dataset(GID)

2.  ISPRS Test Project on Urban Classification and 3D Building Reconstruction—2D SemanticLabeling Contest

3.  2017 IEEE GRSS Data Fusion Contest

4.  Aerial Image Segmentation Dataset

5.  2018 IEEE GRSS Data Fusion Contest

6.  EvLab-SS Dataset

7.  DeepGlobe Land Cover Classification Challenge

8.  38-Cloud dataset

9.  Aeroscapes

10.  SEN12MS

01

Gaofen Image Dataset(GID)

Gaofen Image Dataset(GID)是一个用于土地利用和土地覆盖(LULC)分类的大型数据集。它包含来自中国60多个不同城市的150幅高质量高分二号(GF-2)图像,这些图像覆盖的地理区域超过了5万km²。GID图像具有较高的类内多样性和较低的类间可分离性。GF-2是高清晰度地球观测系统(HDEOS)的第二颗卫星。GF-2卫星包括了空间分辨率为1 m的全色图像和4 m的多光谱图像,图像大小为6908×7300像素。多光谱提供了蓝色、绿色、红色和近红外波段的图像。自2014年启动以来,GF-2已被用于土地调查、环境监测、作物估算、建设规划等重要应用。

下载地址

http://captain.whu.edu.cn/GID/

参考文献:

Tong X Y, Xia G S, Lu Q, et al. Learning Transferable Deep Models for      Land-Use Classification with High-Resolution Remote Sensing Images[J].    arXiv preprint arXiv:1807.05713, 2018.

02

ISPRS Test Project on Urban Classification and 3D Building Reconstruction—2D Semantic Labeling Contest

ISPRS提供了城市分类和三维建筑重建测试项目的两个最先进的机载图像数据集。该数据集采用了由高分辨率正交照片和相应的密集图像匹配技术产生的数字地表模型(DSM)。这两个数据集区域都涵盖了城市场景。Vaihingen是一个相对较小的村庄,有许多独立的建筑和小的多层建筑;Postdam是一个典型的历史城市,有着大的建筑群、狭窄的街道和密集的聚落结构。每个数据集已手动分类为6个最常见的土地覆盖类别。

①不透水面 (RGB: 255, 255, 255)

②建筑物(RGB: 0, 0, 255)

③低矮植被 (RGB: 0, 255, 255)

④树木 (RGB: 0, 255, 0)

⑤汽车(RGB: 255, 255, 0)

⑥背景 (RGB: 255, 0, 0)

背景类包括水体和与其他已定义类别不同的物体(例如容器、网球场、游泳池),这些物体通常属于城市场景中的不感兴趣的语义对象。

下载地址

http://www2.isprs.org/commissions/comm3/wg4/semantic-labeling.html

  • Vaihingen

该数据集包含33幅不同大小的遥感图像,每幅图像都是从一个更大的顶层正射影像图片提取的。顶层影像和DSM的空间分辨率为9 cm。遥感图像格式为8位TIFF文件,由近红外、红色和绿色3个波段组成。DSM是单波段的TIFF文件,灰度等级(对应于DSM高度)为32位浮点值编码。

  • Postdam

与Vaihingen区域类似,该数据集也是由3个波段的遥感TIFF文件和单波段的DSM组成。其每幅遥感图像区域覆盖大小是相同的。这样,遥感图像和DSM是在同一个参考系统上定义的(UTM WGS84)。每幅图像都有一个仿射变换文件,以便在需要时将图像重新分解为更小的图片。

除了DSM,数据集还提供了归一化DSM,即在地面过滤之后,每个像素的地面高度被移除,从而产生了高于地形的高度表示。这些数据是使用一些全自动过滤工作流产生的,没有人工质量控制。因此,不保证这里没有错误的数据,这是为了帮助研究人员使用高度数据,而不使用绝对的DSM。

03

2017 IEEE GRSS Data Fusion Contest

2017年IEEE GRSS数据融合竞赛采用分类作为主体。要执行的任务是对各种城市环境中的土地使用(即针对2012年地方气候区(LCZ))进行分类。竞赛选择了几个城市来测试LCZ预测在世界各地推广的能力。输入数据为多时相、多源和多模态,包括图像和语义层。

数据集由4个部分组成。

美国地质调查局提供的的地面卫星数据:包含可见光、短波和长波红外在内的8个多光谱波段,并以100 m分辨率重采样的;

哨兵2图像:该图像空间分辨率为100 m,拥有9个多光谱波段即可见光、近红外和短红外波长(包含修改的哥白尼数据2016);

辅助数据:开放街道图(OSM)层,具有土地利用信息:建筑、自然、道路和其他土地利用区域。其中还为建筑和土地使用区域提供分辨率为20 m的OSM层的栅格地图,可与卫星图像叠加。

此外,对于选取的城市,还提供了城市几个地区的各种LCZ类的地面真实标签。标签为100 m分辨率的栅格图像,也可叠加到卫星图像上。

下载地址

http://www.grss-ieee.org/2017-ieee-grss-data-fusion-contest/http://dase.ticinumaerospace.com/index.php

04

Aerial Image Segmentation Dataset

该航空图像分为来自谷歌地图的航空遥感图像和来自OpenStreetMap的像素级的建筑、道路和背景标签。覆盖区域为柏林、芝加哥、巴黎、波茨坦和苏黎世。地物真实图像包括一张来自谷歌地图的东京地区航空图像,以及手动生成的、像素级的建筑、道路和背景标签。像素级标签以RGB顺序作为PNG图像提供,标记为建筑物、道路和背景的像素由RGB颜色[255,0,0]、[0,0,255]和[255,255,255]表示。

下载地址

https://zenodo.org/record/1154821#.XH6HtygzbIU

05

2018 IEEE GRSS Data Fusion Contest

数据是由NCALM于2017年2月16日在16:31至18:18 GMT之间从国家机载激光测绘中心获得的。在这场比赛中使用数据收集的传感器包括:有3个不同波段的激光雷达传感器OPTech TITAM M(14sen/con340)、具有70 mm焦距的高分辨率的彩色成像仪Dimac ULTRALIGHT+、高光谱成像仪ITRES CASI 1500。多光谱激光雷达点云数据波段在1550 nm,1064 nm和532 nm。高光谱数据覆盖范围为380—1050 nm,共有48个波段,空间分辨率为1 m。高分辨率RGB遥感图像的空间分辨率为5 cm,被分割成几个单独的图片。

下载地址

http://www.grss-ieee.org/community/technical-committees/data-fusion/2018-ieee-grss-data-fusion-contest/

http://dase.ticinumaerospace.com

06

EvLab-SS Dataset

EvLab-SS数据集用于评估真实工程场景上的语义分割算法,旨在为遥感领域的高分辨率像素级分类任务寻找一种良好的深度学习架构。

数据集来源于中国地理条件调查和绘图项目,每幅图像都有地理条件调查的完整注释。数据集的平均大小约为4500×4500像素。EvLab-SS数据集包含11个大类,分别是背景、农田、花园、林地、草地、建筑、道路、构筑物、挖孔桩、沙漠和水域,目前包括由不同平台和传感器拍摄的60幅图像。

该数据集包括35幅卫星图像,其中19幅由World-View-2卫星采集,5幅由GeoEye卫星采集,5幅由Quick Bird卫星采集,6幅由GF-2卫星采集。该数据集还有25幅航空图像,其中10幅图像的空间分辨率为0.25 m,15幅图像的空间分辨率为0.1 m。

下载地址

http://earthvisionlab.whu.edu.cn/zm/SemanticSegmentation/index.html

参考文献:

Zhang M, Hu X, Zhao L, et al.  Learning dual multi-scale manifold ranking for semantic segmentation of  high-resolution images[J]. Remote Sensing, 2017, 9(5): 500

07

DeepGlobe Land Cover Classification Challenge

DeepGlobe Land Cover Classification Challenge是一个公共数据集,提供高分辨率亚米卫星图像,重点是农村地区。由于土地覆盖类型的多样性和注释的高密度,该数据集很具挑战性。该数据集共包含10146幅卫星图像,大小为20448×20448像素,分为训练/验证/测试集,每组图像为803/171/172幅(对应70%/15%/15%)。

下载地址

http://deepglobe.org/index.html
https://competitions.codalab.org/competitions/18468

08

38-Cloud dataset

该数据集包含38幅Landsat 8 场景图像及其手动提取的像素级地物真实标签,用于云检测。这些场景的整个图像被裁剪成384×384个斑块,以适合于基于深度学习的语义分割算法。数据集被划分为8400个斑块进行训练,9201个补丁进行测试。每幅图像有4个相应的波段,分别是红色(波段4)、绿色(波段3)、蓝色(波段2)和近红外(波段5)。

下载地址

https://github.com/SorourMo/38-Cloud-A-Cloud-Segmentation-Dataset

参考文献

Mohajerani S, Krammer T A, Saeedi P. Cloud Detection Algorithm for Remote Sensing Images Using Fully Convolutional Neural Networks[J]. arXiv preprint      arXiv:1810.05782, 2018

Mohajerani S, Saeedi P. Cloud-Net: An end-to-end Cloud Detection Algorithm for Landsat 8 Imagery[J]. arXiv preprint arXiv:1901.10077, 2019

09

Aeroscapes

空中语义分割数据集包括使用商业无人机从5到50 m高度范围内捕获的图像。该数据集为11个类提供了3269幅720 p图像和地表真实标签。

下载地址:

https://github.com/ishann/aeroscapes

参考文献:

Nigam I, Huang C, Ramanan D. Ensemble knowledge transfer for semantic segmentation[C]//2018 IEEE Winter Conference on Applications  of Computer Vision (WACV). IEEE, 2018: 1499-1508

10

SEN12MS

SEN12MS是由180748张相应的3种类型遥感数据组成的一个数据集,包括了Sentinel-1双极化SAR数据,Sentinel-2多光谱图像和MODIS土地覆盖图。其中Sentinel-1图像分辨率为20 m,Sentinel-2多光谱图像分辨率为10 m,波段数为13,MODIS的土地覆盖的图像分辨率为500 m。

下载地址:

https://mediatum.ub.tum.de/1474000

end

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_42722197/article/details/119922843

智能推荐

Python 加密解密_咕咕加密v4-程序员宅基地

文章浏览阅读1k次。# -*- coding: utf-8 -*-import hashlib'''加密解密'''#MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,# 通常用一个32位的16进制字符串表示。md5 = hashlib.md5()update = md5.update('hhhhhaaa')print(md5.hexdigest())#SHA1的结果是160..._咕咕加密v4

使用cesium primitive api绘制三维插值图,热力图_cesium 插值点-程序员宅基地

文章浏览阅读1.4k次,点赞3次,收藏13次。【代码】使用cesium primitive api绘制三维插值图。_cesium 插值点

flask + pyecharts 疫情数据分析 搭建交互式动态可视化疫情趋势分析、舆情监测平台(附代码实现)_疫情舆情分析代码-程序员宅基地

文章浏览阅读978次,点赞3次,收藏21次。该项目是浙江大学地理空间数据库课程作业8:空间分析中,使用 flask + pyecharts搭建的简单新冠肺炎疫情数据可视化交互分析平台的一部分,完整的实现包含疫情数据获取、态势感知、预测分析、舆情监测等任务;包含完整代码、数据集和实现的github地址: https://github.com/yunwei37/COVID-19-NLP-vis项目分析报告已部署到网页端,可点击 http://flask.yunwei123.tech/ 进行查看,数据已更新到6.17本项目采用flask作为_疫情舆情分析代码

python之09-tuple元组-程序员宅基地

文章浏览阅读254次。详细请参考:https://www.cnblogs.com/Neeo/articles/11212374.html1、元组的基本操作1>创建元组Python中,元组(tuple)用一对小括号()表示,元组内的各元素以逗号分隔。t = ()print(type(t)) # <type 'tuple'>t1 = ('name', )print(t1) ..._tuple元祖for循环取值

c语言程序怎样生产dll文件,关于c语言创建dll文件及dll文件的调用-程序员宅基地

文章浏览阅读860次。关于c语言创建dll文件及dll文件的调用近来又有人在群里问如何用c语言编制dll文件(动态链接库)。原来没有对这个问题太在意过,也没有尝试过任何解决方案,毕竟原来我是用vb的(现在用.net),做个dll只不过是点选一下建立activeX dll工程的图标而已。今天在网上与朋友聊天,看了他指给我的几个几个文件,用MingW将C程序编译成dll文件的例子,我恍然大悟,原来讲C程序编译成dll文件只..._keil c语言 生成dll

【学习笔记】基于遗传算法的BP神经网络优化算法_遗传算法优化 bp 染色体-程序员宅基地

文章浏览阅读6.8k次,点赞11次,收藏111次。一、背景介绍BP神经网络是一类多层的前馈神经网络。它的名字源于在网络训练的过程中,调整网络的权值的算法是误差的反向传播的学习算法,即为BP学习算法。BP神经网络是人工神经网络中应用广泛的算法,但依然存在着一些缺陷,例如学习收敛速度太慢、不能保证收敛到全局最小点、网络结构不易确定等。另外,网络结构、初始连接权值和阈值的选择对网络训练的影响很大,但是又无法准确获得,针对这些特点可以采用遗传算法对神经网络进行优化。二、算法流程创建网络;确定网络的初始权重值和阈值,对其进行编码得到初始种群;while_遗传算法优化 bp 染色体

随便推点

二、Json对象、Json数组和Json字符串_json字符串数组-程序员宅基地

文章浏览阅读6.7k次,点赞3次,收藏17次。一、Json字符串和Json对象定义:1、Json字符串:所谓字符串:单引号或者双引号引起来,是一个String类型的字符串:如下:var person='{"name":"shily","sex":"女","age":"23"}';//json字符串console.log(person)console.log(person.name)console.log(typeof person) 2、Json对象:最显著的特征:对象的值可以用 “对象.属性” 进行访问,_json字符串数组

Linux系统100条命令:关于Ubuntu和 CentOS 7 相同功能的不同的终端操作命令_ubuntu 命令跟centos-程序员宅基地

文章浏览阅读718次。CentOS 7:ip link set interface_name up 或 ip link set interface_name down。Ubuntu:ifconfig interface_name up 或 ifconfig interface_name down。CentOS 7:编辑 /etc/sysconfig/network-scripts/ifcfg-eth0 文件。Ubuntu:编辑 /etc/network/interfaces 文件。_ubuntu 命令跟centos

windows10下VS2019编译jpegsrc.v9e.tar.gz为lib静态库(已验证)_jpeg library error vs2019-程序员宅基地

文章浏览阅读652次。jpegsr9e windows vs2019生成方法,以及库下载_jpeg library error vs2019

重磅?华为 Mate60/Pro 系列网速实测结果公布,最高 1205.57 Mbps_华为mate60pro+核实网络-程序员宅基地

文章浏览阅读647次。总的来说,华为Mate 60/Pro系列手机的高速网速表现引起了广泛的关注,这也是消费者对该系列手机购买热情高涨的一个重要因素。可以看出,华为Mate 60/Pro系列手机的网速表现非常出色,这也是消费者购买该系列手机的一个重要原因。此前,华为Mate 60 Pro的供应量已经增至1500万至1700万台,而最新消息称,华为Mate 60 Pro和Mate 60 Pro+的出货量甚至已上调至2000万台。目前,在中国市场上,手机竞争愈发激烈,不仅华为Mate 60系列,其他品牌的手机也都受到了高温的迎接。_华为mate60pro+核实网络

access查找出生日期年份_access怎样利用出生日期计算年龄呀!-程序员宅基地

文章浏览阅读7.1k次。公告: 为响应国家净网行动,部分内容已经删除,感谢读者理解。话题:access怎样利用出生日期计算年龄呀!回答:lt;%set rs = server.createobject("adodb.recordset") curid=request("id") sql = "UPDATE pany SET a_num=a_num+1,day_count=day_count+1 WHERE day_lda..._access出生年份表达式

python 内置函数-程序员宅基地

文章浏览阅读75次。Python内置函数(1)——absPython内置函数(2)——divmodPython内置函数(3)——maxPython内置函数(4)——minPython内置函数(5)——powPython内置函数(6)——roundPython内置函数(7)——sumPython内置函数(8)——bool...