Quantcast
Channel: 专注海量数据 » hadoop1
Browsing latest articles
Browse All 7 View Live

hadoop 0.19.1 rpc代码分析

一、概述 hadoop中mr类图大致如下所示,其中只是简单列出了一些主要的功能模块。JobConf、JobTracker、TaskTracker、RPC Server等组件。在图中,我用红色框框框出了一些基本的类。此图基本反映了MR的类图结构。 一个简单的job在hadoop上面跑起来,基本可以分为10个步骤。如下图所示:...

View Article



hadoop mr类图大纲

分析一框架,莫过于类图,近日,亲自画此类图。 高清图:http://img1.ph.126.net/pngTQtip2YZ5JR_yqdNSmQ==/6597918589632662351.jpg 主要分为: client、JobTracker、TaskTracker、TaskRunner、Clild。 协调有的是通过RPC调用,有的是通过Shell命令调用。...

View Article

hadoop日志简单分析

一、概述 本文基于0.19.1分析得出,有一些是alibaba hadoop优化的部分。本文不涉及jobtracker及nodename元数据的部分,本文主要讲述一个任务在计算阶段大致产生的一些日志,及日志的一些问题。 二、日志简单介绍 当所有的守护进程都起来后(为了简单起见,我们用的是伪分布模式,是由一个机器搭建的),大致的目录结构如下: [dragon.caol@hd19-vm1 logs]$...

View Article

hadoop mr的一些文件归属(包括临时文件的存储情况)

一、概述 一个计算的流程如下图所示,对于一个简单的wordcount的计算中,总共要经历哪些文件呢?本文将详细探讨这个话题。文章可能会重新编辑,如果想浏览最新内容请访问原创博客:http://blog.csdn.net/bxyz1203/article/details/8057810。由于作者个人知识面有限,如果描述有错误或者遗留之处敬请谅解,再欢迎指出,我们共同进步。...

View Article

hadoop mr的数据流程交互简单描述

一、概述 文章可能会重新编辑,如果想浏览最新内容请访问原创博客:http://blog.csdn.net/bxyz1203/article/details/8074248。由于作者个人知识面有限,如果描述有错误或者遗留之处敬请谅解,再欢迎指出,我们共同进步。 二、计算流程 MR计算框架发展到1.0.3左右,计算框架没有发展大的变化。在《hadoop  The Definitive...

View Article


hadoop相关的一些技巧

分布式系统比普通程序开发有一些特别的难度,最主要的就是环境问题。本博客将记录怎么去解决这些问题,最主要的是一些脚本。后期会连续更新,目前最主要的技巧有:...

View Article

谈谈hadoop日志限制的问题

一、概述...

View Article
Browsing latest articles
Browse All 7 View Live


Latest Images