`
coderplay
  • 浏览: 571557 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

我在Hadoop云计算会议的演讲

阅读更多

点击下载演讲稿


由中科院计算所主办的“Hadoop 中国2010云计算大会”于9月4日在北京召开。淘宝网作为国内最大的Hadoop应用商之一赞助与参与了这次会议。我有幸代表淘宝在大会上分享了淘宝在分布式数据处理实践的内容,下面是ppt的一个节选:

淘宝网目前有会员2亿左右,日均UV高达4000万,日交易量高达10亿元,每天产生大量的数据,所以部署了一系列不同规模的Hadoop集群。淘宝生产所使用的Hadoop集群为目前国内规模最大的Hadoop集群之一。在会议前一天,这个集群的规模是
1.总容量为9.3PB,利用率77.09%。
2.共有1100台机器。
3.每天处理约18000道hadoop作业
4. 用户数474人,用户组38个
5.约18000道作业/天,扫描数据:约500TB/天用户数474人,用户组38个

淘宝由于数据的快速增长,已经计划扩容至1500机器的规模,总容量达到20+PB.


点击下载演讲稿

 

  • 大小: 110 KB
3
1
分享到:
评论
2 楼 bhjackson 2011-05-18  
1 楼 凤凰山 2010-12-06  

相关推荐

Global site tag (gtag.js) - Google Analytics