大数据基础概述_编程小吉的博客-程序员ITS203_大数据基础

技术标签: 大数据  

1.前言

三次信息浪潮

信息化浪潮 发生时间 标志 解决问题 代表企业
第一次浪潮 1980年前后 个人计算机 信息处理 Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等
第二次浪潮 1995年前后 互联网 信息传输 雅虎、谷歌、阿里巴巴、百度、腾讯等
第三次浪潮 2010年前后 物联网、云计算和大数据 信息爆炸 将涌现出一批新的市场标杆企业

2.大数据技术发展的三个阶段

阶段 时间 内容
萌 芽期 上世纪90年代至本世纪初 随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术开始被应用,如数据仓库、专家系统、知识管理系统等。
成熟期 本世纪前十年 Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动了大数据技术的快速突破,大数据解决方案逐渐走向成熟,形成了并行计算与分布式系统两大核心技术,谷歌的GFS和MapReduce等大数据技术受到追捧,Hadoop平台开始大行其道
应用期 2010年以后 大数据应用渗透各行各业,数据驱动决策,信息社会智能化程度大幅提高

3.大数据技术面临的问题

  • 存储设备容量不断增加
  • CPU处理能力不断提升
  • 网络带宽不断增加

4.大数据技术数据的特点

  • 数据量超大

    每天各种数据的产生

  • 数据类型多

    大数据是由结构化和非结构化数据组成的

  • 处理速度块

    从数据的生成到消耗,时间窗口非常小

  • 价值密度低

    价值密度低,商业价值高

5.大数据对各方面的影响

  • 在科学研究上,先后历经了实验、理论、计算和数据四种范式
  • 在思维方式方面,大数据完全颠覆了传统的思维方式
  • 在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现
  • 在就业市场方面,大数据的兴起使得数据科学家成为热门职业
  • 在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制

6.大数据技术的应用领域

在这里插入图片描述

7.大数据技术的相关概念

分布式存储和分布式处理

在这里插入图片描述

计算模式

在这里插入图片描述

8.大数据技术的相关产业

大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合

产业链环节 包含内容
IT基础设施层 包括提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务的企业,比如,提供数据中心解决方案的IBM、惠普和戴尔等,提供存储解决方案的EMC,提供虚拟化管理软件的微软、思杰、SUN、Redhat等
数据源层 大数据生态圈里的数据提供者,是生物大数据(生物信息学领域的各类研究机构)、交通大数据(交通主管部门)、医疗大数据(各大医院、体检机构)、政务大数据(政府部门)、电商大数据(淘宝、天猫、苏宁云商、京东等电商)、社交网络大数据(微博、微信、人人网等)、搜索引擎大数据(百度、谷歌等)等各种数据的来源
数据管理层 包括数据抽取、转换、存储和管理等服务的各类企业或产品,比如分布式文件系统(如Hadoop的HDFS和谷歌的GFS)、ETL工具(Informatica、Datastage、Kettle等)、数据库和数据仓库(Oracle、MySQL、SQL Server、HBase、GreenPlum等)
数据分析层 包括提供分布式计算、数据挖掘、统计分析等服务的各类企业或产品,比如,分布式计算框架MapReduce、统计分析软件SPSS和SAS、数据挖掘工具Weka、数据可视化工具Tableau、BI工具(MicroStrategy、Cognos、BO)等等
数据平台层 包括提供数据分享平台、数据分析平台、数据租售平台等服务的企业或产品,比如阿里巴巴、谷歌、中国电信、百度等
数据应用层 提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业、机构或政府部门,比如交通主管部门、各大医疗机构、菜鸟网络、国家电网等

9.云计算和物联网

云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别

在这里插入图片描述

  • 云计算

    云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源

    在这里插入图片描述

    在这里插入图片描述

    • 技术

      在这里插入图片描述

    • 应用

      • 政务云上可以部署公共安全管理、容灾备份、城市管理、应急管理、智能交通、社会保障等应用,通过集约化建设、管理和运行,可以实现信息资源整合和政务资源共享,推动政务管理创新,加快向服务型政府转型
      • 教育云可以有效整合幼儿教育、中小学教育、高等教育以及继续教育等优质教育资源,逐步实现教育信息共享、教育资源共享及教育资源深度挖掘等目标
      • 中小企业云能够让企业以低廉的成本建立财务、供应链、客户关系等管理应用系统,大大降低企业信息化门槛,迅速提升企业信息化水平,增强企业市场竞争力
      • 医疗云可以推动医院与医院、医院与社区、医院与急救中心、医院与家庭之间的服务共享,并形成一套全新的医疗健康服务系统,从而有效地提高医疗保健的质量
    • 产业

      云计算产业作为战略性新兴产业,近些年得到了迅速发展,形成了成熟的产业链结构,产业涵盖硬件与设备制造、基础设施运营、软件与解决方案供应商、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、终端设备、云安全、云计算交付/咨询/认证等环节。

  • 物联网

    物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化和远程管理控制

    • 架构

      在这里插入图片描述

    • 技术

      物联网中的关键技术包括识别和感知技术(二维码、RFID、传感器等)、网络与通信技术、数据挖掘与融合技术等

    • 应用

      在这里插入图片描述

    • 产业

      完整的物联网产业链主要包括核心感应器件提供商、感知层末端设备提供商、网络提供商、软件与行业解决方案提供商、系统集成商、运营及服务提供商等六大环节

      在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_45747519/article/details/115794060

智能推荐

OpenStack-Nova组件部署步骤_卑微小CC的博客-程序员ITS203

文章目录【OpenStack-Placement组件部署】一、创建数据库实例和数据库用户二、创建Placement服务用户和API的endpoint● 创建placement用户● 给与placement用户对service项目拥有admin权限● 创建一个placement服务,服务类型为placement● 注册API端口到placement的service中;注册的信息会写入到mysql中● 安装placement服务● 修改placement配置文件● 导入数据库● 修改Apache配置文件: 00

hadoop-伪分布式开发环境_DA-f的博客-程序员ITS203

关闭开启图形界面关闭图形界面为init 3开启图形界面为init 5打包解压# 打包文件tar -cvf 打包文件.tar 被打包的文件/路径# 解包文件tar -xvf 打包文件.tar# 拷贝Hadoop源文件并解压tar -zxcf hadoop-2.7.1_64bit.tar.gz -C关闭开启图形界面init 3 关闭 init 5 开启关闭防火墙syste...

UIView_程序员的修养的博客-程序员ITS203

(1)view基本介绍 先来看看官方API的解释:The UIView class defines a rectangular area on the screen and the interfaces for managing the content in that area. At runtime, a view object handles the rendering of any

MATLAB中MEX文件的编写与调试_weixin_30458043的博客-程序员ITS203

学习与示例:http://www.mathworks.cn/cn/help/matlab/creating-c-c-and-fortran-programs-to-be-callable-from-matlab-mex-files.html附博文:http://hi.baidu.com/gjviootibjbgtyd/item/521987c33433e666f6c95dbc1...

robotframework(一)安装篇_转辰的博客-程序员ITS203

一、学习链接bilibili:https://www.bilibili.com/video/BV1fK411w7us二、学习笔记(一)简介f框架(robot framework)自动化测试框架 支持web、app、接口自动化框架组成部分:robotframe 基础库robotframe-ride图像界面(二)安装1.安装python和pip(略)2.安装robot framework需要的东西(1)更新pip c:\users\guozhuanchen\appdata\loca

SoftKey.Solutions.SENTINEL.Emulator.2007.FIXED-EDGE _linhanshi的博客-程序员ITS203

http://rapidshare.com/files/64894085/SoftKey.Solutions.SENTINEL.Emulator.2007.FIXED-EDGE.zip.html 

随便推点

大马猴队-测试与发布_weixin_30544657的博客-程序员ITS203

Alpha版本测试报告bug列表概述情况切换账号聊天列表不更新已修复切换账号在本地缓存中的个人信息没有刷新已修复删除好友通讯录没有刷新已修复个人聊天推送通知点击页面跳转错误已修复用户退出登录连接没有关闭导致下一个用户的连接错误已修复添加好友服务器推送数据...

python pandas read_csv 迭代器使用方法_Python | 使用pandas.read_csv()读取csv_演员郭晓东的博客-程序员ITS203

pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converte...

c++ cv转化灰度图_OpenCV C++如何使RGB图像变为灰度图像_weixin_39808953的博客-程序员ITS203

http://m.blog.csdn.net/blog/u014395105/41308979最近在研究如何用C++来处理图像,而不使用封装好的OpenCV代码,这样能够更好的了解OpenCV的内部原理。在网上搜了一些关于C++代码来实现RGB(彩色)图像转换为 gray(灰度)的原理以及代码,可读性较差,所以自己整理了一下,若需转载,请标明出处,谢谢!一、学习cvtColor函数void cvC...

Tina SDK 使用V833/V831 NPU跑YOLO网络_papaofdoudou的博客-程序员ITS203_v833

1.Tina SDK打开内核NNA驱动支持make kernel_menuconfig->打开 CONFIG_SUNXI_NNA这样,内核才会出现/dev/nna设备节点2.编译YOLO算法用例库算法用例库的布局如下图所示,编译前,需要调整Makefile中默认的编译器路径未正确路径:编译过程:编译生成了可执行测试文件yolo3将整个目录拷贝到TF卡上,卡挂载到V833平台上,输出警告不用管.2.运行测试用例首次执行yolo3用.....

magento2 安装 sparsh 插件拓展_没用の阿豪的博客-程序员ITS203

最近在研究magento2 用起来还是可以的 不过想做一些额外的功能 需要安装插件 到了官网找了几个免费的插件 准备安装就很烦,试了各个版本还是不行 最终去网上找了别人下载好的包装了几个,不过有的包实在找不到 必须用composer安装,经过多番尝试"repositories": [ { "type": "composer", "url": "https://plugin.company/" }, { "type": "comp

[转帖]difference between sales cloud and service cloud_weixin_30861797的博客-程序员ITS203

https://developer.salesforce.com/forums/?id=906F0000000BTWqIAO从字面意思上理解, 一个是"Sales" 一个是"Service", Sales包含的模块包括:Leads, Accouts, Contacts, Opportunities, Products, PriceBooks, Quotes, Campaigns并带有容量...