hive - 程序员宅基地

Hive正则表达式

hive中metastore服务、hiveserver2服务、hive客户端、beeline客户端连接元数据的方式

标签： hive

hive是Hadoop的客户端，启动hive前必须启动hadoop，同时hive的元数据存储在mysql中，是由于hive自带的derby数据库不支持多客户端访问。 2.开启metastore服务的参数 hive-site.xml中打开metastore的连接地址。 <!-...

【大数据基础实践】(六)数据仓库Hive的基本操作_熟悉hive的基本操作

标签：大数据数据仓库 hive

解决方法：查看hadoop安装目录下 share/hadoop/common/lib 内 guava.jar 版本，查看 hive安装目录下lib内guava.jar的版本，如果两者不一致，删除版本低的，并拷贝高版本的。在表student_zqc中添加两个分区Dept=’CS...

Hive 移除索引支持的原因

标签： hive hadoop 数据仓库

基于上述原因，Hive在3.0.0版本中宣布移除了索引功能。这是一个经过深思熟虑的决定，目的是简化Hive的使用，避免用户对索引抱有不切实际的性能提升期望，并鼓励用户采用更适合大数据处理的数据组织方式。Hive在早期...

Hive3.1.2安装与配置

标签： hive mysql hadoop

本教程适用于初学者安装hive学习使用，很多配置，需要个人在后续的学习与使用中探索来掌握。

Hive安装与配置详解

标签： Hive安装与配置详解

Hive安装与配置详解 hive安装和配置 hive的测试 hive安装和配置安装一：下载hive——地址：http://mirror.bit.edu.cn/apache/hive/ 这里以hive-2.1.1为例子，如图：将hive解压到/usr/local下： [root@s100 ...

使用Hive时几个重要配置

标签：数据库数据库开发大数据

【代码】使用Hive时几个重要配置。

【通过Hive清洗、处理和计算原始数据，Hive清洗处理后的结果，将存入Hbase，海量数据随机查询场景从HBase...

标签： hive hbase hadoop

/ 数据清洗和处理（如筛选某一列、计算平均值等操作）// 通过Hive查询HBase数据。// 使用Java API查询数据。// 导入数据到HBase。// 创建Hive表。4. 清洗和处理数据。

Hive安装详细教程

标签： hive hadoop big data

一.Hive安装 1、下载安装包：apache-hive-3.1.1-bin.tar.gz 上传至linux系统/opt/software路径 2、解压软件 cd /opt/software tar -zxvf apache-hive-3.1.1-bin.tar.gz -C /opt/module/ 3、修改系统环境变量 vi /...

Windows10安装Hive3.1.2

标签： hive big data hadoop

基本环境资源 Hadoop:2.3.X Hive:2.3.X.bin.tar.gz 版本第一步：下载Hive.tar.gz,官网下载地址：http://archive.apache.org/dist/hive，可以在CSDN上找...注意：Hive 的Hive_x.x.x_bin.tar.gz 版本在windows 环.

【通过Hive清洗、处理和计算原始数据，Hive清洗处理后的结果，将存入Hbase，海量数据随机查询场景从HBase...

标签： hive hbase hadoop

/ 数据清洗和处理（如筛选某一列、计算平均值等操作）// 通过Hive查询HBase数据。// 使用Java API查询数据。// 导入数据到HBase。// 创建Hive表。4. 清洗和处理数据。

大数据开发岗面试30天冲刺 - 日积月累，每日五题【Day01】——Hive1_一般大数据面试需要准备多久(2)

标签：大数据面试职场和发展

今天我们复习了面试中常考的Hive相关的五个问题，你做到心中有数了么？其实做这个专栏我也有私心，就是希望借助每天写一篇面试题，督促自己学习，以免在吹水群甚至都没有谈资！对了，如果你的朋友也在准备面试，请将...

【Hive】基本建库、建表操作

标签： centos hive

文章目录一、Hive 数据仓库的操作1、创建数据仓库2、查看 db 数据仓库的信息及路径3、删除 db 数据仓库二、Hive 数据表的操作1、创建内部表2、创建内部表3、修改表结构4、删除表5、创建同结构表三、Hive 中数据的...

spark系列18：sparksql操作hive表的使用

标签： sparksql操作hive sparksql spark

1.SparkSQL 整合 Hive 导读开启Hive的MetaStore独立进程整合SparkSQL和Hive的MetaStore 和一个文件格式不同,Hive是一个外部的数据存储和查询引擎, 所以如果Spark要访问Hive的话, 就需要先整合Hive ...

大数据开发岗面试30天冲刺 - 日积月累，每日五题【Day01】——Hive1_一般大数据面试需要准备多久(1)

标签：大数据面试职场和发展

本栏目大数据开发岗高频面试题主要出自大数据技术专栏的各个小专栏,由于个别笔记上传太早,排版杂乱,后面会进行原文美化、增加。

hadoop-基于hive的聊天数据分析报表可视化案例数据源

标签： hadoop 大数据 hive 数据分析

有30w条数据

8、Hive数据仓库——环境搭建及简单使用

标签： hive 数据仓库 hadoop

Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL ），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言...

flink实战--读写Hive（ hive on flink ）

标签： flink读写hive flink flinksql操作

Apache Flink 从 1.9.0 版本开始增加了与 Hive 集成的功能，用户可以通过 Flink 来访问 Hive 的元数据，以及读写 Hive 中的表,Hive 是大数据领域最早出现的 SQL 引擎，发展至今有着丰富的功能和广泛的用户基础。...

hive学习笔记之八：Sqoop

标签： hive 学习笔记

面试前的“练手”还是很重要的，所以开始面试之前一定要准备好啊，不然也是耽搁面试官和自己的时间。我自己是刷了不少面试题的，所以在面试过程中才能够做到心中有数，基本上会清楚面试过程中会问到哪些知识点，高频...

hive跑数脚本

标签： hive

使用 nohup 启动 beeline 并执行 SQL 脚本。# 定义需要执行的 SQL 脚本列表。# 循环执行每个 SQL 脚本。# 输出日志文件路径。

hive报错Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

标签： hadoop hive

hive报错Error: Error while processing statement: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask (state=08S01,code=2)

jdbc连接Hive

标签： hive

jdbc连接Hive 1.使用sqoop将stu表导入到hive中数据库表位于hadoop102上的test数据库 bin/sqoop import \ --connect jdbc:mysql://hadoop102:3306/test \ --username root \ --password 000000 \ --table stu ...

工作中遇到的hive常见报错及问题

标签： hive big data hadoop

1，执行#hive命令进入Hive CLI时报如下错误： Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata....