大规模视频网站的计费与流量管理
本次分享将会就大规模视频网站的计费与流量管理这个话题,从操作层面细细进行讲解和分析,为系统工程师们揭示平日里我们没有关心的另一些内容。同时也希望本次分享能揭示行业中的一些“潜规则”,让互联网行业的流量与带宽管理更为开放与简洁。
本次演讲视频录制于QCon杭州2011。
该内容已经被标记书签!
标记书签错误,请重试!
作者 Jonathan Allen 译者 张海龙 发布于 2008年3月10日
微软和Unisys声称他们创造了向关系型数据库载入信息的纪录。非官方的评测结果是:数据提取、转换和装载工具(简称ETL工具)在不到30分钟的时间内将1TB的TPC-H数据存储到关系数据库中。对于此数据量,此前的纪录是由Informatica创建的45分钟。
声明的详情如下:
从非结构化数据文件中分析得到超过1TB的数据,通过网络传送并装载到目标数据库中,而这只用了不到30分钟的时间,超越了此前所有公开使用ETL工具纪录,是一个新的世界纪录。它的速率达到了2TB每小时(每秒超过650MB),更准确地说,是在1794秒以内完成1.18TB的非结构化文件数据装载,这相当于每25分20秒就完成1TB或是每小时2.36TB。
ETL的评测使用了TPC-H数据,但这并非是事务处理性能委员会(Transaction Processing Performance Council)的官方评测,但这并不影响像Informatica这样的公司去吹嘘他们的产品性能。微软承认ETL评测很重要,因为他们能代表现实世界对产品的应用需求。
在如今的业务中,只有极少数的数据会一直保留在目标系统中而无须进行标准化以及载入前的错误处理,而在极大多数情况下,对大量数据装载的处理极有意义。数据的集成涉及到复杂的转换规则、错误检验和数据标准化技术。像SSIS这样的ETL工具就可以实现这些功能,如,在不同的系统间进行数据的移动、数据的再格式化、完整性校验、关键值查询、衍生跟踪等,SSIS也证明了它是一个有能力和有着多方面用途的ETL工具。现在,它又向公众展示它是ETL工具中最快的一员。
实现这一个漂亮成绩的硬件当然也是非标准的,它也不是大多数公司能企及的。
数据库服务器是运行在Unisys ES70000企业级服务器上的,它拥有32颗Intel® 双核XeonTM 3.4G(7140M)处理器,256GB内存和8个双端口4G的HBA网卡。SQL Server的数据是存储在一个拥有165个硬盘插槽的EMC Clariion CX3-80 SAN中(数据吞吐能力可以达到146GB/15 krpm)。数据库服务器是预发布SQL Server 2008企业版(版本号为V10.0.1300.4,是“2008二月份CTP版”之前的一个版本),操作系统是Windows Server 2008 x64 Datacenter版本。
有四台服务作为提供数据源,它们模拟着现代企业中各种不同系统的实际数据来源。每一个源服务器运行一个SSIS包将数据通过网络发送到数据库服务器上。源服务器上的SSIS是基于SQL Server build V10.0.1300.4版本,操作系统是Windows Server 2008。原始数据是从非关系型数据文件中获得的,这些文件都是由DBGEN生成的。
关于这一评测的白皮书尚未发布。源服务器是四台Unisys ES3220L服务器,操作系统是Windows 2008 x64企业版。每一台设备都配备了2颗Inter®Quad Core 2GHz处理器、4GB内存和一个双端口4Gbit Emulex HBA以及Inter PRO1000/PT网卡。原始数据是从二台拥有45个硬盘插槽的EMC Clariion CX600 SAN中进行读入的。
查看英文原文:Microsoft Claims to Hold the ETL Record at 1 TB in 30 Minutes
本次分享将会就大规模视频网站的计费与流量管理这个话题,从操作层面细细进行讲解和分析,为系统工程师们揭示平日里我们没有关心的另一些内容。同时也希望本次分享能揭示行业中的一些“潜规则”,让互联网行业的流量与带宽管理更为开放与简洁。
本次演讲视频录制于QCon杭州2011。
Jeffrey Richter以其多本Windows核心技术的经典著作而闻名,同时,他深入掌握微软的.NET等一系列核心技术,2012年1月,Jeffrey Richter在北京接受了InfoQ中文站的专访,谈到Windows 8和WinRT编程,并就异步编程、Windows编程中的可扩展性、性能和安全性方面给出自己的建议。
云计算平台的可用性,相比传统互联网服务而言,更加复杂和困难,也更具有挑战性。本文借助新浪SAE云平台为读者讲述了云平台可用性的定义、如何打造高可用的平台,以及对云计算的用户提出了建议。
淘宝高度重视Java平台的健康发展,组建了一个团队专注于Java平台的底层部分的性能、功能与稳定性改进;工作主要基于OpenJDK中的HotSpot VM开展,其中一些通用的功能随后也会逐渐反馈给OpenJDK社区。希望能与使用Java平台开发应用的大家交流经验。
本次演讲视频录制于QCon杭州2011。
2011年4月21日至22日是值得云计算从业者纪念的日子。Amazon的IaaS服务出现故障,导致许多商业网站的服务中断,影响非常严重。作为云计算用户,我们需要思考的是,如何保证即便在云服务不可用的情况,我们的应用架构仍然能够屹立不倒?本文正是站在云计算用户的角度试图探讨这一问题。
12人的技术团队,4组刀片服务器,每月20亿的访问量,每日1次准时部署,99.9%的可用性。这可能吗?当然。想知道如何做的吗?百姓网将与您分享他们在DevOps实践过程中的经验和技巧。
本次演讲视频录制于QCon杭州2011。
篱笆作为一家起源于社区的电子商务公司,反映到技术层面就是同时要面对产品和业务,以及经营战略的变化调整。如何在产品和业务的夹缝之间完成技术架构的抽象与平衡,寻找更有效的价值定位,这当中有些经验教训和个人感悟愿与众人分享。
本次演讲视频录制于QCon杭州2011。
本文将对特性注入以及相关方法做一个扫盲性的介绍。我们会解释这个框架的关键要素,并附上实例来证实它们。为了让文章保持相对较短,我们不会深入到某个工具或方法中,而是会给出一些参考资料,以便大家做进一步的研究。
没有回复
关注此讨论 回复