日前,第五届云计算大会日前在北京国家会议中心召开。Marvell大中华区系统与解决方案首席规划师甘卫宁在大会上作了主题为“Marvell的公共云洞察——Web2.0时代的数据中心”的演讲,重点阐述了Marvell作为一家芯片公司与云的关系。
以下是演讲实录:
各位下午好,我看了一下合作伙伴,这些合作伙伴就是一个产业链,前面两个都是做应用的,IBM是做系统的,我们唯一一家做芯片的,后面是做平台的。经常会问,芯片跟云有什么关系?这就是我今天讲的主要内容。
从整个产业链的头端,对整个公共云的影响,这张图其实把整个用云的概念显示的比较丰富一点,我们看云的这条线上四个屏,人类在接触信息的时候,就这四张 屏,根据屏的大小,各自场景也不一样。这四个屏,实际上不断的向五个云里去的。咱们先从今天的主题公共云来讲,我们所有的内容几乎都在右边的云上,这里像 阿里云、百度,包括我们中国电信移动联通这些大的运营商,都在建立公共云。
这些云的内容,要通过一个基础设施,包括宽带,或者LTE 4G宽带推到我们的用户端。用户端就是根据我们所在的位置,从家里起来上班,在移动过程中成为移动云,最后到办公室,成为私有云,这个结构组成了我们现在跟信息交流的主要方式。
Marvell的定位,就是人和人互相之间,通过四个平台,四个终端,和五个云连接在一起。今天主要讲公共云基础上的变化,做一个公共云数据中心,从产业 链上来讲,有几个核心的组成部分。从我们做芯片元器件的产业链一端来说,我们把所有硬件、元器件做出来,然后做系统设置的各种盒子,包括游戏机、交换机以 及服务器。最后由代工厂把它做成产品,给产品贴上不同的标签,或者没有标签直接进数据中心。然后加上Linux,或者各种各样的Open Stack,一些OS,或者一些应用。还有一些根据各种应用有关的一些软件,像微信,百度的搜索,阿里云上的一些自己的特殊应用,最终组成了一套数据中心 的系统。在系统运营过程中还要有系统的维护。所以整个产业链转一圈,一代产品过了,再转一圈,第二代产品过了,这就是它整个核心的产业链。
现在来看我们传统的数据中心是怎么做出来?实际上有四个组成在其中扮演相关的角色,我们作为芯片厂商,首先要提供元器件;然后代工厂主要做生产;接着厂家 提供一些应用软件;上面有系统集成商(IBM、HP),把系统设置起来,然后维护好,做成数据中心。这是原来传统的产业结构。
从这种结构可以看到,数据中心的三项核心技术:计算、储存、网络,这里面有三个代表的厂家,但不是说只是三家在做这件事情,而是在产业里有代表性。这些厂 家在各个领域是很专长的,专长的结果是,每家都有每家的特长,这样的好处是和不同厂家做区分。从计算到存储再到网络,互相之间都会找差异性。
但实际上你看数据中心并不需要差异性,它需要三者重合的部分——Vanity Free,也就是说去掉多余的花花缀缀的东西,实际上这是大的公共数据中心所需要的东西。这种结果,就像这两句话讲,厂家相互之间的差异化给厂家带来很多 价值,但并非能解决数据中心需要的核心的一点东西。它产生的价值,对真正运营数据中心来说其实是成本。
所以在新的理念之下,产业结构有新的变化。最终我们的数据中心中间的环节,系统产业在陆陆续续的走出来,逐渐在消失。那么这些厂家,做芯片,做代工厂,或 者做系统设计,还包括做开源软件,包括自己公司内部的软件开发,慢慢的顶起来四条柱子,来支撑几个数据中心,这就是我们经常说的白牌(White Box)数据中心模型。
这个带来最大的好处是投入成本,就是硬件成本会降低很多,同时运维成本会降低更多。在新的生态系统产业链结构下,最典型的例子,可以看Facebook, 其实做这些东西,并不是Facebook第一个做的,可能是Google第一个做的,但Facebook第一个把它的stack整个公开看看它是怎么做 的。Facebook当时定义的东西,它有一个使命,把这个东西做的非常便宜,同时非常有效,大家做的量比较大,把它标准公开,这样比较便宜。
所以整个硬件做数据中心,服务器应该做成什么样,储存应该做成什么样,数据中心里的机柜应该做成什么样的,网络应该做成什么样的,包括整个设备的管理应该 用怎么样规范,最终到每个设备的认证都有严格的定义。在这个指导思想下,Facebook第一个数据中心,就是在俄勒冈开的数据中心,完全按照这个架构来 做的。紧接着它宣布在北卡建立新的数据中心,在两边海岸把美国给覆盖下来。它在瑞典也做数据中心,覆盖整个欧洲,最近刚宣布在美国中部再盖个数据中心,这 样就把整个全美三个数据中心全部盖起来。这几个中心,重头开始建设,就是根据这个概念来做的。
所以我刚才说的新的生态系统是Facebook第一个作为一个产业和行业往前走的。做这个东西对我们现在市场的数据有什么影响?我们看一个数值,从服务器 的角度,去年Q4跟前年的Q4相比,可以看出这几家厂家的服务器的成长在降低,红线画出的点正在增加。所以Facebook的这种模式给市场带来了冲击, 这是整个产业链的变化。
讲了很多数据中心,实际上这张图把整个数据中心都覆盖下来。实际上这部分是在数据中心里头,运营商网络建立了防火墙,然后把所有的流量打到外服务器上,看 你是要干什么的。然后根据内容的不一样,分散到不同的应用服务器上,有些东西要从数据库拿的,进入数据库集群,在数据库中把数据拿出来。现在比较流行的是 存放到内存缓冲服务器(Memory cache server)上,下次再拿的时候,就不用到服务器上,因为时间比较长。对于一些冷数据,可以放在存储服务器(Storage server)上,这个数据中心就是这么一个结构。
在我们设立一种硬件的时候,就有不同的要求。核心起来,整个数据中心就是三大技术,从计算来讲的话,在这个种类里头有三种,一种是专门做计算的,另外一种专门做存储,这是它的各种应用场景。还有一种是两者比较均衡。这是从计算的角度来说的。
从存储的角度来说,根据存储数据提取的快慢,那种SSD和硬盘,还有混合硬盘,是三个不同。拿到网络上,把数据库这些存储东西合在一起,最终还有防火墙,还有集成的服务器,把这些覆盖均衡。所以整个数据中心的核心技术,实际上归于三类。
------------ ---------- ----------- ---------- --------- -------- ------- ------ ----- ---- --- -- - - -