Hive和HBase整合

本文主要描述Hive和HBase 环境整合配置的详细过程:

  • 基本环境
  • 整合配置
  • 测试验证

[一]、基本环境

各设备对应的信息/角色/用途:

hostname
IP
Hadoop用途
HBase用途
Hive

Master.Hadoop
1[……]

Read more

HiveException:Not a host:port pair: PBUF

HBase和Hive整合后,在Hive shell中执行建表语句时错误信息如下:

一般这样的错误信息是由于:<HIVE_HOME>/lib/hbase-x.y.z*.jar的版本和当前环境中HBase的版本不一致造成的[……]

Read more

HBase安装配置之完全分布式模式

HBase安装模式有三种:单机模式、分布式(伪分布式和完全分布式)。本教程介绍了HBase的完全分布式模式安装配置的过程,分布式模式均需要依赖于HDFS。

  • 基础环境
  • 安装配置

[一]、环境说明

  • JDK1.6+
  • Hadoop 2.2.0
  • CentOS 6.0
  • HB[……]

Read more

HBase安装配置之伪分布式模式

HBase安装模式有三种:单机模式、分布式(伪分布式和完全分布式)。本教程介绍了HBase的伪分布式模式安装配置的过程,伪分布式模式是把进程运行在一台机器上,但不是同一个JVM(单机模式),分布式模式的安装配置需要依赖于HDFS。

  • 基础环境
  • 安装配置

[一]、环境说明

  • JD[……]

Read more

HBase安装配置之单机模式

HBase安装模式有三种:单机模式、分布式(伪分布式完全分布式)。默认的安装模式就是单机模式 ,在单机模式中,HBase使用本地文件系统而不是HDFS ,所有的服务和zooKeeper都运作在一个JVM中。本教程介绍了HBase单机安装的方法,并演示:启动HBase、通过shell创建表、插入数据[……]

Read more

github更新自己Fork的代码

github上有个功能叫fork,可以将别人的工程复制到自己账号下。这个功能很方便,但其有一个缺点是:当源项目更新后,你fork的分支并不会一起更新,需要自己手动去更新。

以github用户名:micmiu ,fork 项目 sql-parser(原始地址https://github.com/[……]

Read more

Hive自定义分隔符InputFormat

Hive默认创建的表字段分隔符为:\001(ctrl-A),也可以通过 ROW FORMAT DELIMITED FIELDS TERMINATED BY 指定其他字符,但是该语法只支持单个字符,如果你的分隔符是多个字符,则需要你自定义InputFormat来实现,本文就以简单的示例演示多个字符作为[……]

Read more

HBase基于Hadoop2的源码编译

本文以HBase0.98.0 为例,演示编译生成适用于Hadoop2.x 版本软件包的过程。

基本环境参数:

  • Mac OSX 10.9.1
  • Maven 3.0.4
  • Java 1.6.0_65
  • Hadoop 2.2.0
  • HBase 0.98.0

源码编译的基本步骤:[……]

Read more

Hive教程之metastore的三种模式

Hive中metastore(元数据存储)的三种方式

  • 内嵌Derby方式
  • Local方式
  • Remote方式

[一]、内嵌Derby方式

这个是Hive默认的启动模式,一般用于单元测试,这种存储方式有一个缺点:在同一时间只能有一个进程连接使用数据库。

hive-si[……]

Read more

Hive教程之DML数据导入导出

文章基本目录结构:

  • 数据导入
    • 导入本地文件
    • 导入hdfs文件
  • 数据导出
    • 导出到新表
    • 导出到本地文件
    • 导出到hdfs文件

本文的测试基于Hadoop 2.2.0 + hive 0.12.0

[一]、数据导入

LOAD的基本语法:[……]

Read more

第 5 页,共 31 页« 最新...34567...102030...最旧 »