分类存档: 海量数据

Hadoop在Map阶段获取当前split的文件名

在mapper处理阶段中有时候我们需要获取当前正在处理的HDFS文件名/HDFS目录名,其实我们可以通过 Context 来获取相关参数,代码类似如下:
[crayon-65f947d9db0e48[……]

Read more

hadoop多硬盘配置注意点

[一]、实验环境

1.1、环境

  • hadoop 2.6.0
  • namenode 2个  各增加 2个1T硬盘
  • datanode   3个  各增加3个1T硬盘

1.2、挂载硬盘[……]

Read more

Hadoop修改配置PID文件路径

[一]、 概述

Hadoop启动后的PID文件默认配置是保存在 /tmp 目录下的,而linux下 /tmp 目录会定时清理,所以在集群运行一段时间后如果在停Hadoop相关服务是会出现类似:n[......]

Read more

HBase安装配置snappy压缩算法

[一]、前提

首先是snappy编译安装和hadoop-snappy编译,这个可以直接参考: Hadoop安装配置snappy压缩,所有前提准备好后,HBase上安装配置snappy压缩算法就相[……]

Read more

Hadoop安装配置snappy压缩

本文的主要详细介绍hadoop2.x中snappy压缩算法安装配置的详细步骤。

[一]、  实验环境

  • CentOS 6.3 64位
  • Hadoop 2.6.0
  • JDK 1.7.0_[……]

Read more

HBase+Hadoop2 NN HA+Zookeeper独立安装的整合

Hadoop2 NN HA+Zookeeper独立安装的步骤参见:http://www.micmiu.com/bigdata/hadoop/hadoop2-cluster-ha-setup/ ,本文H[……]

Read more

Hadoop2分布式及NN和RM实现HA的实验

目录结构

  • 引言
  • 实验环境
  • 实验过程
  • 演示demo

[一]、 引言

在Hadoop2.x初期的时候写过一篇 hadoop 2.2.0 集群模式安装配置和测试,记录了分布式[……]

Read more

ERROR org.apache.hadoop.hbase.master.HMasterCommandLine: Failed to start master

HBase单机模式启动后,很快进程就结束了,日志中错误信息如下:

环境参数:

  • Mac OSX 10.10.1
  • Java[……]

Read more

Hadoop2.x在Ubuntu系统中编译源码

本文主要记录Hadoop2.x在Ubuntu 12.04下编译源码的主要步骤和注意点:

[一]、基础环境

  • Ubuntu 12.04 LTS 64  位
  • Hadoop2.2.0
  • J[……]

Read more

eclipse中开发Hadoop2.x的Map/Reduce项目

eclipse-mr-01

本文演示如何在Eclipse中开发一个Map/Reduce项目:

1、环境说明

  • Hadoop2.2.0
  • Eclipse Juno SR2
  • Hadoop2.x-eclipse-pl[……]

Read more

第 1 页,共 4 页1234