预约成功
针对Hadoop集群环境下的网络环境进行测试,测试结果显示,一个有弹性的网络对Hadoop集群非常重要;对Hadoop集群具有重要影响的网络特性,以其影响程度从大到小依次排序为:网络可用性和弹性、Burst流量突发处理和队列深度、网络过载比、Datanode网络接入和网络延迟。
1、Hadoop网络特性有哪些——网络可用性和弹性
要部署一个高冗佘性和可扩展的网络,支持Hadoop集群的增长。在Datanode之间部署多条链路的技术要比那些有单点失效或两点失效的技术要好。交换机和路由器已经在业界被证明能够为服务器提供网络可用性。
2、Hadoop网络特性有哪些——Burst流量突发处理和队列深度
HDFS的有些操作和MapReduceJob会产生突发流量,如向HDFS加载文件或者把结果文件写入HDFS都需要通过网络。网络如果处理不了突发流量,就会丢弃数据包,所以适当的缓存可以缓解突发流量的影响。确保选择使用缓存和队列的交换机和路由器,来有效处理流量突发。
3、Hadoop网络特性有哪些——网络过载比
一个好的网络设计需要考虑到网络中关键节点的拥塞情况。一个ToR交换机从服务器接收20Gbps的数据,但是只有2个1Gbps的上联口会造成数据包丢失(10:1的过载比),严重影响集群的性能。过度配置的网络的价格又非常昂贵。一般情况下,服务器接入层可以接受的过载比在4:l左右,接入层和汇聚层之间,或者核心层的过载比在2:l左右。
4、Hadoop网络特性有哪些——Datanode网络接入
要基于集群工作负荷来推荐带宽配置。一般集群中的节点有1到2根1GB的上联12.是否选择10Gbps的服务器要权衡价格和性能。
5、Hadoop网络特性有哪些——网络延迟
交换机和路由器延迟的变化对集群性能的影响有限。相比网络延迟,应用层延迟对任务的影响比例更大。但是网络的延迟会对应用系统造成潜在的影响,例如造成不必要的应用切换等。
以上就是对于《Hadoop网络特性有哪些?这些特性是大数据工程师必须了解的》的详细分析,大家可以看到,在如今的大数据时代,掌握一种大数据工具很重要,这也是企业需要的东西。如果你想知道更多大数据的相关知识,可以点击下方资料下载链接。