a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 網管 > 服務器 > 正文

Hadoop是什么

2020-05-27 13:21:27
字體:
來源:轉載
供稿:網友

   Hadoop是什么?Hadoop是一個開發和運行處理大規模數據的軟件平臺,是Appach的一個用java語言實現開源軟件框架,實現在大量計算機組成的集群中對海量數據進行分布式計算.

  Hadoop框架中最核心設計就是:HDFS和MapReduce.HDFS提供了海量數據的存儲,MapReduce提供了對數據的計算.

  數據在Hadoop中處理的流程可以簡單的按照下圖來理解:數據通過Haddop的集群處理后得到結果.

Hadoop是什么 武林網

  HDFS:Hadoop Distributed File System,Hadoop的分布式文件系統.

  大文件被分成默認64M一塊的數據塊分布存儲在集群機器中.

  如下圖中的文件 data1被分成3塊,這3塊以冗余鏡像的方式分布在不同的機器中.

  MapReduce:Hadoop為每一個input split創建一個task調用Map計算,在此task中依次處理此split中的一個個記錄(record),map會將結果以key--value的形式輸出,hadoop負責按key值將map的輸出整理后作為Reduce的輸入,Reduce Task的輸出為整個job的輸出,保存在HDFS上.

  Hadoop的集群主要由 NameNode,DataNode,Secondary NameNode,JobTracker,TaskTracker組成.

  如下圖所示:

  NameNode中記錄了文件是如何被拆分成block以及這些block都存儲到了那些DateNode節點.

  NameNode同時保存了文件系統運行的狀態信息.

  DataNode中存儲的是被拆分的blocks.

  Secondary NameNode幫助NameNode收集文件系統運行的狀態信息.

  JobTracker當有任務提交到Hadoop集群的時候負責Job的運行,負責調度多個TaskTracker.

  TaskTracker負責某一個map或者reduce任務.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: aaa日本高清在线播放免费观看 | 午夜精品久久久久 | 北条麻妃一区二区在线 | 狠狠狠色丁香婷婷综合久久五月 | 伊人久久精品 | www.久久精品| 精品成人在线 | 夜夜av| 国产精品久久久久久一区二区三区 | 国产午夜久久 | 国产毛片毛片 | 久久国产精品99久久久久久牛牛 | 成年人福利| 久久99这里只有精品 | 国产一区久久精品 | 最近免费中文字幕大全免费版视频 | 成人在线不卡 | 国产精品久久久久无码av | 成人免费在线电影 | 国产成人精品无人区一区 | 欧美综合第一页 | 99精品国产在热久久 | 日韩免费在线 | 成人免费crm在线观看 | 日本精品视频 | 一区二区视频 | 国产精品精品 | 欧美在线观看一区 | 精品日韩欧美一区二区三区在线播放 | 国产精品久久久久久久久久免费 | 国产高清无密码一区二区三区 | 国产精品天天干 | 自拍亚洲 | 蜜桃免费视频 | 97久久超碰国产精品电影 | 这里有精品在线视频 | 鲁一鲁影院| 麻豆一区 | 亚洲专区在线播放 | 久久六月 | 国产区视频在线观看 |