相关文章

借力万兆以太网 搜狐推开移动互联之门

来源网址:

  如今的时代,“”(Sohu.com )已经是闻名全球的名字,搜狐集团拥有搜狐公司和畅游公司两家美国纳斯达克上市公司,在中国,搜狐担任了2008北京奥运会互联网内容服务赞助商,目前互联网用户数量近5亿,日均浏览量高达8亿,是众多中国互联网用户的门户首选。

  随着互联网内容形式的不断多样化,除了传统的文字、图片信息,越来越多的互联网用户乐于接受和分享视频内容,同时,在社交化和碎片化的推动下,互联网用户也希望能随时随地去交流、沟通和互动,移动化已经为互联网开启了另一扇门。

  新应用趋势下的冲击

  作为一家互联网大鳄,搜狐早已感知到用户行为习惯的变化。“搜狐本身是门户矩阵,我们拥有很多不同的业务,近两年我们的视频业务和用户端增长迅猛。”搜狐公司技术副总裁周霖先生这样说道。

  搜狐公司技术副总裁周霖先生

  新增的用户访问压力对搜狐原有的IT基础设施而言是一个不小的冲击,周霖表示,最直接的影响就是带来带宽的飞速增长,随着视频、移动互联网的发展,现在的带宽量总量已经超过T级,在原有千兆以太网的模式下需要增加大量的来满足用户的访问。

  除了遭遇带宽的压力,近几年,开始在互联网行业爆发,并,如何挖掘大数据中蕴藏的巨大商业价值也一直是互联网所思考的。在周霖看来,大数据应用的前提必须是采集到足够多的数据,以前数据的采集方式,大部分是采用服务器日志Log等技术方向来实现,一方面无法从网络层面真实了解用户每一次访问是如何得到服务的,另一方面整个数据采集总存在丢失或不全面的情况。因此,周霖的团队也在思考能不能把数据采集点从最后端服务器的Log一直前推到网络的边界上,从边界上获得第一手的网络数据用于大数据分析。

  此外,在安全方面,形势比以前更严峻,攻击也更频繁,随着、上网行为的发展,网站受到攻击的情况也比以前更为隐蔽,攻击的目的也并不是让服务器宕机,更多是以渗透APT的攻击方式进行,对于互联网企业而言,保护好用户的隐私也越来越重要,“因此,为了分析安全事件,也有必要在整个边界上用更高速的处理方式来发现和阻断一些安全的攻击,总结起来我们所面临的一个重要的要求就是如何在边界上快速、有效地处理网络数据和用户请求。”周霖说道。

  万兆以太网逐渐替代千兆负载均衡

  满足用户对视频和移动应用的需求无疑将帮助搜狐把握未来的先机,而在这个过程中对后端IT架构的建设将显得至关重要。为了减少在服务器等设施的投入,同时也使得网络响应更好地服务用户,周霖的团队决定用万兆硬件处理模式来替代原有的千兆负载均衡。

  搜狐公司环境

  谈起作出这个选择的原因,周霖说:“我们先期做了分析,对一些技术进行了调研,包括改用专用的网络设备、网络,但是发现这些方式基本上能满足我们一部分的需求,但存在一个比较大的问题,那就是构架相对比较有限制,不能灵活的处理一些突发情况并适应未来的变化。”

  另一方面,对于搜狐来说,近两年也发现要实现新功能时,往往需要在网络边界层次上进行针对于应用的开发,其中最常见的便是根据用户的情况和特点进行不同网络请求的分发,比如对于移动用户就应该提供一些适合于移动的服务响应,在这种情况下对于前端定制化的转发要求很高,“为了避免在后面升级中带来问题,我们设想,是不是可以通过现有通用的服务器架构很好地解决这些问题。”周霖如是说。

  在整个实施过程中,搜狐克服了网络、计算性能、处理性能上的问题,最终达到了预期的处理能力。周霖表示,这个项目的立项最初是在搜狐-英特尔技术创新实验室达成的,现在搜狐已经在一些边界上进行部署和试用,目前整个项目达到了预期的要求。

  成本和灵活性的双重考虑

  一直以来,英特尔与搜狐都保持良好的合作关系,双方有多年的深入合作,对新技术的研究及行业发展趋势有很大的认同,并在2011年4月14日共同成立了搜狐-英特尔技术创新实验室,于共同挖掘前沿技术、推动关键技术发展。

  周霖介绍,创新实验室和搜狐运维团队一共差不多20人,也正是这两个团队为整个项目的实施提供了强有力的技术保障。

  之前,搜狐线上服务器的域值设在单机30万并发处理和分发,周霖强调,现在搜狐具备处理200万并发处理和分发的能力,在线上设置也是180万以上的域值,所以从域值上来说,现有一台服务器的工作效率提升到原来的六倍。

  “另外一个层面说,我们精简了网络架构部署,而且缩减了服务器使用量,利用了其他的服务器资源比如高速CPU资源、其他计算资源,从而避免了资源的浪费。” 周霖进一步补充道。

                                                 搜狐公司彭毅先生

  随着创新实验室合作的进一步深入,未来搜狐是否还会大面积采用英特尔架构的网络设计,甚至是InfiBand网络,对此,搜狐公司彭毅表示:“是否大规模部署主要取决于我们自身的网络设计,以及英特尔和我们现有的网络设计的匹配度,替代现在的网络应用模型必须经过搜狐在可用性方面的验证和尝试。”

  总结起来,周霖对整个项目实施的考虑中,其实商业的成分很少,本质是解决搜狐面临的实际问题,同时兼顾成本和灵活性上的优势。

  除了不能损害性能,灵活性体现了搜狐对于二次开发能力的重视,创新实验室和搜狐运维团队共同的协作则满足了这一要求。“互联网的发展总是很快,假如形势发生了变化,我们要考虑如何跟上的问题。有一部分交给第三方做是合适的,因为它会更快地迭代它的新产品,有一部分是和我们业务相关的,我们自己来做则更合适,可以紧跟业务相关的变化。” 周霖总结道。