深度学习之批量图片数据增强_批量数据增强-程序员宅基地

技术标签: # 深度学习  

在之前的文章中,分别对数据增强的库函数进行了介绍,本文将结合实际应用进行批量图片的数据增强。

背景:项目采集的是灰度图,原数据只有不到20张图片,因此,选择数据增强的方法,通过不同变换方法的组合,实现数据增加的百张以上,这样才可以放入深度学习模型进行训练(利用迁移学习)。

话不多说,直接上代码,在代码中解释用到的变换操作。

1 单核方法

#!usr/bin/python
# -*- coding: utf-8 -*-
import cv2
from imgaug import augmenters as iaa
import os

class MyAugMethod():

    def __init__(self):
        self.seq = iaa.Sequential()
        self.imglist_name = []
        self.imglist = []

    # 遍历输入文件夹,返回所有图片名称
    def show_path_file(self, inputpath, all_files_name, all_files):
        # 首先遍历当前目录所有文件及文件夹
        file_list = os.listdir(inputpath)
        # 保存图片文件的目录
        last_path = inputpath
        # 准备循环判断每个元素是否是文件夹还是文件,
        # 是文件的话,把名称传入list,是文件夹的话,递归
        for filename in file_list:
            # 利用os.path.join()方法取得路径全名,并存入cur_path变量
            # 否则每次只能遍历一层目录
            cur_path = os.path.join(inputpath, filename)
            # 判断是否是文件夹
            if os.path.isdir(cur_path):
                last_path = cur_path
                self.show_path_file(cur_path, all_files_name, all_files)
            else:
                filename = os.path.join(last_path, filename)
                all_files_name.append(filename)
                all_files.append(cv2.imread(filename))   

    # 定义增强的方法
    def aug_method(self):
        # 给指定的方法设置对应比例
        # 如Sometimes(0.5, GaussianBlur(0.3))表示每两张图片做一次模糊处理
        sometimes = lambda aug: iaa.Sometimes(0.5, aug)
        
        # 定义一组变换方法.
        self.seq = iaa.Sequential([
            # 选择0到5种方法做变换
            iaa.SomeOf((0, 5),
                [                                        
                    # 将图像进行超分辨率,每幅图采样20到200个像素,
                    # 替换其中的一些值,但不会使用平均值来替换所有的超像素
                    sometimes(
                        iaa.Superpixels(
                            p_replace=(0, 1.0),
                            n_segments=(20, 200)
                        )
                    ),

                    # 使用不同的模糊方法来对图像进行模糊处理
                    # 高斯滤波
                    # 均值滤波
                    # 中值滤波
                    iaa.OneOf([
                        iaa.GaussianBlur((0, 3.0)),
                        iaa.AverageBlur(k=(2, 7)),
                        iaa.MedianBlur(k=(3, 11)),
                    ]),

                    # 对图像进行锐化处理,alpha表示锐化程度
                    iaa.Sharpen(alpha=(0, 1.0), lightness=(0.75, 1.5)),

                    # 与sharpen锐化效果类似,但是浮雕效果
                    iaa.Emboss(alpha=(0, 1.0), strength=(0, 2.0)),

                    # 添加高斯噪声
                    iaa.AdditiveGaussianNoise(
                        loc=0, scale=(0.0, 0.05*255)
                    ),

                    # 每个像素增加(-10,10)之间的像素值
                    iaa.Add((-10, 10), per_channel=0.5),

                    # 将-40到40之间的随机值添加到图像中,每个值按像素采样
                    iaa.AddElementwise((-40, 40)),

                    # 改变图像亮度(原值的50-150%)
                    iaa.Multiply((0.5, 1.5)),

                    # 将每个像素乘以0.5到1.5之间的随机值.
                    iaa.MultiplyElementwise((0.5, 1.5)),

                    # 增强或弱化图像的对比度.
                    iaa.ContrastNormalization((0.5, 2.0)),                
                ],
                # 按随机顺序进行上述所有扩充
                random_order=True
            )
        
        ],random_order=True) 

    # 增强函数
    def aug_data(self, inputpath, times):
        # 获得输入文件夹中的文件列表
        self.show_path_file(inputpath, self.imglist_name, self.imglist)
        # 实例化增强方法
        self.aug_method()
        #对文件夹中的图片进行增强操作,循环times次
        for count in range(times):
            print("aug data for {} times ".format(count))
            images_aug = self.seq.augment_images(self.imglist)
            for index in range(len(images_aug)):
                filename = self.imglist_name[index].split(".jpg", 1)[0]
                filename = filename + "_" + str(count) +'.jpg'
                #保存图片
                cv2.imwrite(filename, images_aug[index])
                # print('image of count%s index%s has been writen'%(count,index))	

if __name__ == "__main__":
    # 图片文件相关路径
    inputpath = './data/test'
    times = 3
    test = MyAugMethod()
    test.aug_data(inputpath, times)

2 多核方法

(待完成……)

通过以上代码的操作,可将目标文件夹中的原始图片进行随机变化,选择变化方法组中的0到5种操作,当然,也可以在方法组中添加其它需要的操作,由于我的原图是灰度图,没有涉及到颜色空间的变化,如果是彩色图,可以增加相对应的变化,这样更全面一些。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/zong596568821xp/article/details/83111124

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf