完美世界国际版下载,完美世界辰东,千年殇

hadoop是什么？

Hadoop是使用Java編寫，允許分布在集群，使用簡單的編程模型的計算機大型數據集處理的Apache的開源框架。 Hadoop框架應用工程提供跨計算機集群的分布式存儲和計算的環境。 Hadoop是專為從單一服務器到上千臺機器擴展，每個機器都可以提供本地計算和存儲。

Hadoop的架構

在其核心，Hadoop主要有兩個層次，即_

加工/計算層(MapReduce)，以及

存儲層(Hadoop分布式文件系統)。

MapReduce
MapReduce是一種并行編程模型，用于編寫普通硬件的設計，谷歌對大量數據的高效處理(多TB數據集)的分布式應用在大型集群(數千個節點)以及可靠的容錯方式。 MapReduce程序可在Apache的開源框架Hadoop上運行。
Hadoop分布式文件系統

Hadoop分布式文件系統（HDFS）是基于谷歌文件系統（GFS），并提供了一個設計在普通硬件上運行的分布式文件系統。她與現有的分布式文件系統有許多相似之處。來自其他分布式文件系統的差別是顯著。她高度容錯并設計成部署在低成本的硬件。提供了高吞吐量的應用數據訪問，并且適用于具有大數據集的應用程序。

除了上面提到的兩個核心組件，Hadoop的框架還包括以下兩個模塊_

Hadoop通用_這是Java庫和其他Hadoop組件所需的實用工具。

Hadoop YARN _這是作業調度和集群資源管理的框架。

Hadoop如何工作？
建立重配置，處理大規模處理服務器這是相當昂貴的，但是作為替代，可以聯系許多普通電腦采用單CPU在一起，作為一個單一功能的分布式系統，實際上，集群機可以平行讀取數據集，并提供一個高得多的吞吐量。此外，這樣便宜不到一個高端服務器價格。因此使用Hadoop跨越集群和低成本的機器上運行是一個不錯的選擇。
Hadoop運行整個計算機集群代碼。這個過程包括以下核心任務由 Hadoop 執行_

數據最初分為目錄和文件。文件分為128M和64M（128M最好）統一大小塊。

然后這些文件被分布在不同的群集節點，以便進一步處理。

HDFS，本地文件系統的頂端﹑監管處理。

塊復制處理硬件故障。

檢查代碼已成功執行。

執行發生映射之間，減少階段的排序。

發送排序的數據到某一計算機。為每個作業編寫的調試日志。

Hadoop的優勢

Hadoop框架允許用戶快速地編寫和測試的分布式系統。有效并在整個機器和反過來自動分配數據和工作，利用CPU內核的基本平行度。

Hadoop不依賴于硬件，以提供容錯和高可用性（FTHA），而Hadoop庫本身已被設計在應用層可以檢測和處理故障。

服務器可以添加或從集群動態刪除，Hadoop可繼續不中斷地運行。

Hadoop的的另一大優勢在于，除了是開源的，因為她是基于Java并兼容所有的平臺。

• 天然氣的主要成分是什么？	• 手把手教你看懂成分_找到專屬自己的護膚方法
• vivo_Pad2平板電腦今日10點開售_搭載	• 健身知識科普一_身體成分篇也健康科普
• 華為將于5月18日發布新系列平板_更輕薄_更新	• 相遇是什么？是...
• 平板中的姓能王者_小米平板6_Pro開箱為什么賞	• 小米平板6_Pro首次體驗_第壹款驍龍8+全能
• 首次天璣8020芯片_榮耀平板V8正式發布_1	• 聯想小新Pad_Plus_2023平板電腦開啟

免费人成动漫在线播放r18-免费人成观看在线网-免费人成黄页在线观看日本-免费人成激情视频在线观看冫-jlzzjlzz亚洲大全-jlzzjlzz亚洲日本

VIP

推廣服務

大數據教程--Hadoop教程（三）《Hado