伯克利云计算白皮书————重点摘要心得

2015/11/23 posted in  云计算和大数据

伯克利云计算白皮书

内容概要

从硬件上看云计算和传统的对比:
  1. 云计算能随需应变的提供似乎无限的计算资源,云计算终端用户无需再为计算力准备计划或预算。(灵活的架构,计算按需扩充,快速部署上线)
  2. 云用户(SaaS 服务供应商)可以根据需要,逐步追加硬件资源,而不需要预先给出承诺。(灵活架构,硬件按需扩充)
  3. 云计算提供其用户短期使用资源的灵活性(例如:按小时购买处理器或按天购买存储)。当不再需要这些资源的时候,用户可以方便的释放这些资源。(按需购买,精确到小时,精确使用,减少资源浪费)

云计算的成本意义。

数据中心构建:

在低成本地区建立和运维超大规模商用数据中心是实现云计算的关键,因为这样可以在电力、网络带宽、运维、软件和硬件等 5 到 7 个方面降低成本。

数据中心构建的成本意义。

虚拟化技术抽象到不同的层次

云计算中,为了实现资源的弹性利用以及给用户造成资源无限的假象,必须实现资源的复用。这需要通过虚拟化技术,隐藏资源被复用和共享的具体细节来实现。不同的效用计算将由展现给开发者的抽象层次的不同和各种计算存储资源管理层次的不同这两者所决定的

Amazon EC2 将EC2实例抽象成为一个类似完整的物理硬件。
Google AppEngine 每个实例针对特定的传统Web应用程序。

私有云与效用计算选型区分

对拥有私有云的公司或个人而言,什么时候更应该使用效用计算,而不是私有云服务呢?最典型的情况是当服务的需求随时间而变化的时候。第 二种典型情况是无法提前估计未来的计算需求。第三种典型情况是批量分析处理的公司可以利用云计算更快的完成计算工作。

云计算挑战与机遇
问题 机遇
1 服务的可用性 选用多个云计算提供商;利用弹性来防范 DDOS 攻击
2 数据锁定 标准化的 API;使用兼容的软硬件以进行波动计算
3 数据安全性和可审计性 采用加密技术,VLANs 和防火墙;跨地域的数据存储
4 数据传输瓶颈 快递硬盘;数据备份/获取;更加低的广域网路由开销; 更高带宽的 LAN 交换机
5 性能不可预知性 改进虚拟机支持;闪存;支持 HPC 应用的虚拟集群
6 可伸缩的存储 发明可伸缩的存储
7 大规模分布式系统中的错误 发明基于分布式虚拟机的调试工具
8 快速伸缩 基于机器学习的计算自动伸缩;使用快照以节约资源
9 声誉和法律危机 采用特定的服务进行保护
10 软件许可 使用即用即付许可;批量销售
虚拟机方向> 所有的层面应该更注重虚拟机的横向可扩展性而不是在单个虚拟机上的效率。此外,1. 应用软件既要能快速向下分解,又要能向上组合,这是一个新的要求。同时软件需要采用基于使用量的支付模型来满足云计算的要求。
  1. 基础软件需要清楚:它是在虚拟机上而不再是在逻辑上运行。而且它必须从一开始就内置了帐单功能。
  2. 硬件系统应该被设计成像一个大的容器(至少 12 个机柜),这将是最小销售单位。运维的成本将与购置成本变得一样重要,当内存、磁盘和网络闲置的时候,可将其调至节能状态。处理器要求在虚拟机环境下能很好的工作,闪存应该被加入到存储层次结构中,局域网交换机和广域网路由器都需要在带宽和成本上进行改善。

云计算的定义> 云计算包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施。互联网上的 应用服务一直被称作软件即服务(Software as a Service, SaaS),所以我们使用这个术语。而 数据中心的软硬件设施就是我们称作的云(Cloud)。

当云以即用即付的方式提供给公众的时候,我们称其为公共云,这里出售的是效用计算。 当前典型得效用计算有 Amazon Web Services、Google AppEngine 和微软的 Azure。不对公众 开放的企业或组织内部数据中心的资源称作私有云。因此云计算就是 SaaS 和效用计算,但 通常不包括私有云。

将私有云排除出云计算的范畴。由于私有云的计算是内部的,不向公众开发的计算能力。