Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和(Google MapReduce的开源实现)为核心的
Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉(low-cost)的硬件上,形成分布式系统;
MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下并发并行应用程序。所以用户可以利用集群的Hadoop轻松地组织计算机资源,
从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理。
Hadoop是一个开源框架,可编写和运行分布式应用处理大规模数据。分布式计算是一个宽泛并且不断变化的领域。
方便:Hadoop运行在由一般商用机器构成的大型集群上,或者云计算服务上,比如EC2。
健壮:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障。
可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集。
简单:Hadoop允许用户快速编写高效的并行代码。
Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系统,MapReduce 是分布式数据处理模型和执行环境。掌握了这两部分,也就掌握了Hadoop最核心的东西。
课程目录
课时1Hadoop起源介绍.mp4
课时2Hadoop生态圈介绍.mp4
课时3Hadoop基本组件介绍.mp4
课时4Hadoop组成框架介绍.mp4
课时5Hadoop安装.mp4
课时6Eclipse环境搭建.mp4
课时7HDFS组件及备份机制介绍以及读写文件流程介绍.mp4
课时8Shell命令介绍.mp4
课时9HDFS Java API介绍(一).mp4
课时10HDFS Java API介绍(二).mp4
课时11HDFS新特性介绍.mp4
课时12YARN组件介绍以及YARN框架上job执行流程介绍.mp4
课时13MR编程模型总体介绍.mp4
课时14Shuffle阶段Map端执行流程介绍.mp4
课时15Shuffle阶段Reduce端执行流程介绍.mp4
课时16WordCount案例总体介绍.mp4
课时17MapReduce中数据类型介绍.mp4
课时18MR中自定义数据类型编写.mp4
课时19案例介绍以及类的编写.mp4
课时20Shuffle组件Partitioner自定义介绍.mp4
课时21Shuffle组件Combiner以及Grouping自定义介绍.mp4
课时22二次排序实现.mp4
课时23顺序式MR组合任务介绍.mp4
课时24依赖关系组合式MR任务介绍.mp4
课时25链式MR任务介绍.mp4
课时26MapSideJoin介绍.mp4
课时27ReduceSideJoin介绍.mp4
课时28半连接介绍.mp4
课时29倒排索引实现.mp4
阿里网盘 天翼云盘
1、本站提供的源码不保证资源的完整性以及安全性,不附带任何技术服务!
2、本站提供的模板、软件工具等其他资源,均不包含技术服务,请大家谅解!
3、本站提供的资源仅供下载者参考学习,请勿用于任何商业用途,请24小时内删除!
4、如需商用,请购买正版,由于未及时购买正版发生的侵权行为,与本站无关。
5、本站部分资源存放于百度网盘或其他网盘中,请提前注册好百度网盘账号,下载安装百度网盘客户端或其他网盘客户端进行下载;
6、本站部分资源文件是经压缩后的,请下载后安装解压软件,推荐使用WinRAR和7-Zip解压软件。
7、如果本站提供的资源侵犯到了您的权益,请邮件联系: 11210980@qq.com 进行处理!
本文地址:https://www.zye8.com/117348.html
文章转载或复制请以超链接形式并注明来源出处。 本文最后更新于:2023-09-19 13:31:18
声明:某些文章或资源具有时效性,若有 错误 或 所需下载资源 已失效,请联系客服QQ:11210980
请登录后发表评论
注册