领导力大挑战
在实施Scrum项目的过程中,Scrum Master的角色是相当关键的,因为他是团队的推动者。本文围绕什么是仆人式领导、仆人式领导的起源、如何将领导力传达给团队、Scrum Master作为仆人式领导者的角色展开叙述,同时重点阐述仆人式领导者应有的基本内外特征。
该内容已经被标记书签!
标记书签错误,请重试!
作者 Abel Avram 译者 丁雪丰 发布于 2011年11月5日
如今,公司越来越多地依赖大数据进行决策。Amazon、Cloudera和IBM都发布了它们的Hadoop-as-a-Service产品,Microsoft的类似产品也将在明年问世。
Amazon是最早推出AWS Elastic MapReduce的,可以追溯到2009年,在EC2和S3上运行Apache Hadoop。同Amazon的其他IaaS产品一样,这项服务提供了大数据分析所需的最基本的硬件和软件,把很多配置和编程的工作留给了客户,这需要不少专业知识。假定公司有这样的能力,它可以成功配置并运行Hadoop任务,就像New York Times一样,以相当低廉的价格,在100个Amazon EC2实例上运行了一个24小时的Hadoop任务,将内容为1851年到1922年发表的公开文章的1100万张图片转换成了1.5TB的PDF文档。
Cloudera将Amazon的MapReduce服务又超正确的方向上推进了一步,推出了CDH3,这是一个调优过的Hadoop AMI,包含很多附加软件,可以帮助管理、运行Hadoop上的复杂任务,例如:Apache Mahout、Flume、Sqoop、Pig、Oozie、Hive、HBase、ZooKeeper、Whirr等等,其中大多数都是开源项目。但是目前还是有些问题,仍然需要大量的专业知识,安装、配置一些东西,CDH3安装指南(PDF)还是有不下175页的篇幅是在说明如何从基础开始,对JDK、CDH3、Snappy以及系统的其他部分进行配置的。
Microsoft最近在PASS Summit 2011上宣布他们会在Windows Azure和SQL Server中整合Hadoop-as-a-Service服务,在2012年提供给那些在其平台上处理大数据的公司。目前还没有太多的细节,只知道Microsoft 承诺会保持与Apache Hadoop的兼容性,并且将代码贡献给开源项目。他们还提供了一个基于Sqoop的SQL Server-Hadoop Connector,这让SQL数据表与Hadoop的HDFS之间的双向数据传输成为可能,因为Hadoop需要将数据保存在自己的文件系统中以保证能够高效地处理大量的数据。
IBM也发布了自己的产品,使用IBM InfoSphere BigInsights软件,在SmartCloud Enterprise上运行Hadoop。BigInsights有两个版本,基础版是免费的,非常适合项目评估,企业版用于生产环境。IBM的解决方案是迄今为止看起来最为成熟的,基于Watson技术,这是一个AI系统,它打败了两名今年的Jeopardy!最佳选手(译注:Jeopardy!是美国的一个电视智力竞猜节目,比赛问题内容涵盖多个方面,1964年开播至今)。Watson并非在大集群上运行Hadoop来回答问题,而是包含了超过100项技术来“分析自然语言,识别源数据,发现并生成假设,寻找证据并评分,对假设做合并和分级”。因此,这并不仅仅是一个运行大数据任务的平台,它还提供了发现数据并解释它的能力,这是处理问题的过程中最复杂的部分之一。
与Cloudera的解决方案类似,IBM的BigInsights包含了Hadoop以外的很多开源项目,例如:
BigInsights还包含了IBM开发的定制技术:一个文本分析引擎、一个用于商业分析的数据挖掘工具,与企业软件的整合和Hadoop增强让管理更加方便,性能更加优越。
BigInsights并没有替代OLAP(Online Analytical Processing)或OLTP(Online Transaction Processing)应用程序,但它可以整合其中,用于“过滤大量原始数据并合并结果,将结果以结构化数据的形式保存在DBMS或数据仓库中”。
IBM的Hadoop解决方案已经问世了,客户可以进行测试。
另一个值得一提的解决方案是EMC Greenplum Analytics Workbench,一个1000+物理节点的集群在运行Hadoop集成测试,是由EMC及Intel、Mellanox Technologies、Micron、Seagate、SuperMicro、Switch和VMware这些合作伙伴一同推出的。Greenplum并不提供Hadoop-as-a-Service,而是提供了一个超过10000虚拟节点和24 PB存储容量的平台,用于对Hadoop本身进行测试。
根据2011 TDWI的一份调查,34%的企业使用大数据分析来帮助制定决策。大数据和Hadoop将在未来扮演更重要的角色。
查看英文原文:Hadoop-as-a-Service from Amazon, Cloudera, Microsoft and IBM
译者 丁雪丰 是InfoQ中文站编辑,满江红翻译组核心成员,出版过《Spring攻略》、《JRuby实战》等多部译著。主要关注领域:企业级应用、海量数据计算、动态语言应用等。
在实施Scrum项目的过程中,Scrum Master的角色是相当关键的,因为他是团队的推动者。本文围绕什么是仆人式领导、仆人式领导的起源、如何将领导力传达给团队、Scrum Master作为仆人式领导者的角色展开叙述,同时重点阐述仆人式领导者应有的基本内外特征。
论道WP第三篇专栏,以应用程序栏的使用为中心,包括了软键盘带来的问题、应用程序栏介绍、如何绑定应用程序栏的属性等几个方面的具体话题,为开发者顺利使用应用程序栏开发提供了具体指导。
在多线程并发编程中Synchronized一直是元老级角色,很多人都会称呼它为重量级锁,但是随着Java SE1.6对Synchronized进行了各种优化之后,有些情况下它并不那么重了,本文详细介绍了Java SE1.6中对于锁的性能优化,以及锁的存储结构及升级过程。
本次分享将首先介绍现代富文本编辑器的组成和实现,然后结合UEditor的开发过程,与参会者分享UEditor在设计和实现的过程中,所涉及到的核心功能的细节实现。
本次演讲视频录制于百度技术沙龙。
我们所开发的应用程序大多都需要提供一个图形用户界面(GUI)。关于GUI应用的架构设计,已经有了Form & Control、MVC,、MVP、 Passive View等多种模式。模式可以帮助我们建立优雅的架构,但前提是弄清楚模式的应用场景。弄清楚GUI应用面临的设计上的问题,有助于我们正确的挑选设计方案。
MongoDB是一种非常易用的NoSQL方案,Brian C. Dilley在这篇文章里介绍了MongoDB的优劣势,并介绍了MJORM项目。MJORM用于MongoDB,是一个没有注解的Java ORM库。
随着网络基础设施的逐步成熟,从RPC进化到Web Service,并在业界开始普遍推行SOA,再到后来的RESTful平台以及云计算中的PaaS与SaaS概念的推广,分布式架构在企业应用中开始呈现出不同的风貌,然而殊途同归,这些分布式架构的目标仍然是希望回到建造巴别塔的时代,系统之间的交流不再为不同语言与平台的隔阂而产生障碍。
1 条回复
关注此讨论 回复