2024大三下山东大学计算机学院云计算课程内容复习

第一章 云计算概述

1.1云计算的产生与发展

1.1.1 云计算的产生背景

image-slry.png

1.1.2 云计算的发展

  • 1961年,John McCarthy:如果我倡导的计算机能在未来得到使用,那么有一天,计算也可以像电话一样成为公用设施。……计算机应用(Computer utility)将成为一种全新的、重要的产业的基础。

  • 1969年,ARPANET首席科学家Leonard Kleinrock:现在,计算机网络还处于初级阶段,但随着网络的进步和复杂化,我们将可能看到“计算机应用”的扩展……

  • 1983年,SUN公司:网络是电脑(The Network is the Computer)。

  • 2006年3月,亚马逊公司推出弹性计算云服务(Elastic Compute Cloud, EC2),同年8月谷歌公司在搜索引擎大会上首次使用“云计算”一词。

image-ogwt.png

1.1.3 云计算的定义

  • Gartner公司:…一种计算方式,能通过Internet技术将可扩展的和弹性的IT能力作为服务交付给外部用户。

  • Forrester Research公司:…一种标准化的IT性能(服务、软件或者基础设施),以按使用付费和自主服务方式,通过Internet技术进行交付。

  • 美国国家标准与技术研究院(NIST):云计算是一种模型,可以实现随时随地、便捷的、按需的从可配置计算资源共享池中获取所需的资源(例如,网络、服务器、存储、应用程序及服务),资源可以快速供给和释放,使管理的工作量和服务提供者的介入降低至最少。这种云模型由五个基本特征、三种服务模型和四种部署模型构成。

  • 本课程:云计算是分布式计算的一种特殊形式,它引入效用模型来远程供给可扩展可测量的资源。

1.1.4 云计算的特点

利用云计算技术,可以管理、调度、整合、优化分布在网络上的各种资源、并以统一界面为用户提供各类计算服务。

云计算的特点包括:

  • 按需服务:云为用户提供想要的服务,用户可以按照自己的需求来获取计算资源,就像显示生活中使用自来水、煤气、电力资源一样。

  • 通用性:云计算并不是一种特定的计算方式,可以在云端衍生出千变万化的应用,且适用范围广。(各种类型的产品:计算、存储……)

  • 超大规模计算能力:现在各大云计算提供商为用户提供了非常多且强大的云服务器,这些云服务器赋予用户前所未有的计算能力。

  • 实时在线:云支持在任何位置、使用各种终端来获取实时服务,请求的资源来源于云而不是固定的有形实体。

  • 高可靠性:绝大部分云计算提供商采用了多容错副本、计算节点同构可互换等措施来保障服务可靠性,使用户计算、数据更加可靠。

1.1.5 云计算的商业驱动力

  1. 容量规划

  2. 降低成本

  3. 组织灵活性

  • 容量规划:指确定和满足一个组织未来对IT资源、产品和服务的需求的过程。

    • 容量(capacity): 指在一段时间内,一个IT资源能够提供的最大工作量。

    • 过度配置:IT资源容量远高于需求,导致系统效率低下。

    • 配置不足:IT资源容量低于需求,导致无法满足用户需求。

    • 重点:将IT资源容量预期需求之间的差异最小化,以获得预期的效率和性能。

    • 容量规划的类型:

      • 领先策略(Lead Strategy):根据预期增加IT资源的容量。

      • 滞后策略(Lag Strategy):当IT资源达到其最大容量时增加资源容量。

      • 匹配策略(Match Strategy): 当需求增加时,小幅增加IT资源容量。

    • 对“使用负载“变化的估计,导致容量规划颇具挑战性

      • 若按照峰值负载配置IT资源,会出现不合理的紫金投入。

      • 有限的资金投入,会导致因使用限度降低而出现交易损失和使用受限。

  • 降低成本

    • 成本的类型

      • 获得新基础设施的成本;

      • 保有其所有权的成本。

        • 与基础设施相关的运营开销在IT预算中占相当大一部分,往往超过了前期投资成本。

    • IT成本与业务性能之间的平衡很难保持。

    • IT环境的扩展总是与其最大使用需求的评估相对应,这可以让不断增加的投资自动支持新的、扩展的业务。

    • 大部分所需资金都注入到基础设施的扩建中,应为给定的自动化解决方案的使用潜力,总是受限于底层基础设施的处理能力。

  • 组织灵活性:是组织对变化响应程度的衡量。

    • IT企业常常需要应对行业变化,通常采用的措施是在原来预期或者计划的IT资源规模上进行扩展。

    • 变化的业务需求和优先级也会要求IT资源具备更高的可用性和可靠性。

    • 从更广泛的范围来说,采用新的或是扩展业务自动化解决方案,所需要的预付投资以及基础设施所有权成本可能会使企业望而却步。

    • 企业在审查其基础设施预算后,可能决定完全不采用自动化解决方案。

1.1.6 影响了云计算的技术创新(了解)

  1. 集群化:集群是一组互联的独立IT资源,以整体形式工作。

    1. 集群具有冗余和容错特性,当可用性和可靠性提高时,系统故障率就会降低。

    2. 硬件集群的组件系统由基本相同的硬件和操作系统构成。

    3. 构成集群的组件设备通过专用的高速通信链路来保持同步。

  2. 网格计算

    1. 网格为计算资源提供了一个平台,使其能够组织成一个或多个逻辑池。这些逻辑池统一协调为一个高性能分布式望楼哦,有时也称为”超级虚拟计算机“

    2. 网格比集群更加松耦合,更加分散,网格可以包含异构的、且处于不同地理位置的计算资源。

  3. 传统虚拟化技术:是一个技术平台,用于创建IT资源的虚拟实例。

    1. 允许物理IT资源提供自身的多个虚拟映像,这样用户就可以共享它们的底层处理能力。

    2. 虚拟化环境中运行的仿真软件可以模拟对硬件的需求,打断了硬件之间静态的依赖性。

    3. 云计算的现代虚拟化技术,克服了传统虚拟化平台在性能、可靠性、可扩展性方面的局限性。

性能

虚拟化前

虚拟化后

资源利用率

每台主机一个操作系统,系统的资源利用率低。

主机与操作系统不一一对应,按需分配使用,系统的资源利用率高。

独立性

软硬件紧密结合,硬件成本高昂且不够灵活。

操作系统和硬件不相互依赖,虚拟机独立于硬件,宁在任何硬件上运行。

程序运行效率

同一台主机上同时运行多个程序容易产生冲突,运行效率较低。

管理操作系统和应用程序被封装成单一个体,不同个体之间不冲突,同一台机器上运行同一个程序,效率高。

安全性

安全性较差。

强大的安全性和故障隔离。

技术创新与使能技术(cloud-enable technology):

  • 宽带网络和Internet架构

  • 数据中心网络

  • (现代)虚拟化技术

  • web技术

  • 多租户技术

  • 服务技术

小结

  • 云计算需求导致其形成的主要商业驱动力:容量规划、降低成本呵呵组织灵活性。

  • 影响并启发了云计算关键特征的主要技术创新:集群技术、网格计算和传统虚拟化技术。

1.2 云计算的基础知识

1.2.1 云计算的概念

  • 用户视角:云计算是由第三方通过互联网提供的计算服务,用户只需要关心云所提供的服务。

    • 云计算平台提供用户亟需的硬件服务、软件服务、数据资源服务。而且还能够向用户提供可配置的平台服务。

    • 用户按需向平台提交自己的硬件配置、软件安装、数据访问即其他的计算需求,支付一定的费用即可使用。

  • 云计算提供商视角:解决三个实质问题

    • 大规模问题:(1)云计算由数据中心支持,其聚集大量计算资源;(2)云计算也能够支撑大规模的、互联网级别的数据和应用

    • 低成本问题:给用户带来成本上的优势。

    • 服务运营问题:通过无差别的存储计算能力提供公共基础服务,服务运营的本质是按量付费、弹性扩展,并解决多租户环境的安全问题。

  • 平台技术视角:云计算聚集了多种技术。

    • 从计算角度:云计算是由一组内部互联的物理服务器组成的并行和分布式计算系统,该系统能够根据服务提供商和客户之间协商好的服务等级协议动态提供计算资源。

    • 从服务角度:云计算通过互联网提供弹性的硬件,软件和数据服务,他以社会化服务的形式呈现。基础设施即服务/平台即服务(IaaS/PaaS)提供商对客户提供数据中心的硬件、平台和软件服务。软件即服务(SaaS)提供商通过互联网以服务的形式给终端用户交付应用软件。

    • 从存储的角度:云计算将信息永久存储在云上的服务器中,客户端只是使用时缓存。

    • 从配置的角度:云是以付费的形式向用户提供各种服务的分布式计算系统,其本质是一个对虚拟化的计算和存储资源池进行动态部署、分配、实时监控,从而向用户提供满足要求的计算服务、数据存储服务、平台服务的系统。

1.2.2 云计算的基本术语

  1. IT资源(IT Resource):只一个与IT相关的物理或虚拟的事物。

    1. 可以是基于软件的,比如虚拟服务器或定制软件程序。

    2. 可以是基于硬件的,比如物理服务器或网络设备。

  2. 企业内部的(on-premise):指不基于云的可控的IT环境

    1. 一个内部的IT资源可以访问一个基于云的IT资源,并与之交互。

    2. 一个内部的IT资源可以被迁移到云中,从而成为一个基于云的IT资源。

    3. IT资源既可以冗余部署在内部环境中,也可以部署在云环境中。

  3. 可扩展性:指IT资源可以处理增加或减少的使用需求的能力。

    1. 水平扩展(horizontal scaling)指分配和释放IT资源,其中分配资源称为向外扩展(scaling out),释放资源称为向内扩展(scaling in).

    2. 垂直扩展(vertical scaling)指现有IT资源被具有更大或更小容量的资源代替,分别称为向上(scaling up)扩展向下(scaling down)扩展。

水平扩展

垂直扩展

  1. 云服务(cloud service)指任何可以通过云远程访问的IT资源

    1. 并非云中所有IT资源都可以被远程访问,比如云中的数据库或物理服务器只能被本云的其它IT资源访问。

    2. 公开发布的API可以专门部署为允许远程客户访问。

  2. 云服务用户(cloud service consumer)是一个临时的运行时角色,由访问云服务的软件程序承担。

1.3 目标和收益

1.3.1 降低的投资与成比例的开销

云IT投资理念减少或者彻底消除前期的IT投资,也就是软硬件的采购和拥有成本。

  • 成比例的成本(proportional cost)使用可测的运营支出,代替预期资本投入。

  • 企业从小规模开始,根据需求相应的增加IT资源配置。

  • 减少前期投资可以使资本用于核心业务投资。

云用户能获得的可测收益:

  • 可以短期按需访问按使用付费的计算资源,并在不需要时释放这些资源。

  • 在需要时可以获得无限的计算资源,因此减少了资源供给的需求。

  • 可以细粒度的增加或者删除IT资源,比如按照1G的幅度增减存储空间。

  • 基础设施抽象化,应用不会与设备或位置绑定,可以在需要时方便的迁移。

1.3.2 提高的可扩展性

提高的可扩展性

  • 云用户可以根据处理需求的波动和峰值,自动或手动地扩展其云IT资源。

  • 处理需求减少时,自动或手动地释放其云IT资源。

  • 提供可灵活扩展的IT资源是云固有的、天生的特性,该特性与成比例的成本收益直接相关。

  • IT资源总是可以满足和实现不可预知的用户需求,避免在使用需求达到阈值时可能出现的损失。

1.3.3 可用性和可靠性

提高的可用性和可靠性

显著减少业务中断的风险,提高用户满意度,同时降低运营成本。

1.4 风险与挑战

1.4.1 增加的安全漏洞

  • 将业务迁移到云中,意味着云提供者要分担数据安全的责任。

    • 远程使用IT资源需要云用户将信任边界扩展到外部云

    • 建立包含这样信任边界的安全架构,同时又不引入安全漏洞是非常困难的,除非云用户和云提供者碰巧支持相同或兼容的安全架构。

  • 云IT资源通常是共享的,基于这一事实,不同云用户的信任边界可能重叠并引入安全风险。

  • 重叠信任边界,给恶意云用户(人和自动化工具)提供了更多攻击IT资源、偷窃或破坏企业数据的机会。

1.4.2 降低的(受限的)运营管理控制

  • 云用户对云资源的管理控制通常低于对企业内部IT资源的管理控制,因此云提供者如何操作云,以及云用户之间进行通信所需的外部链接都可能引入风险。

    • 一个不可靠的云提供者可能不会遵守对它的云服务发布的SLA保证,对于使用这些云服务的用户来说,这将威胁到它们的解决方案的质量。

    • 云用户和云提供者之间较长的地理距离,可能需要更多的网络跳数,这导致了延迟波动和可能的带宽受限。

SLA是Service-Level Agreement的缩写,意思是服务等级协议。服务等级协议(SLA)最根本的形式是协议双方(服务提供者和用户)签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。

1.4.3 云提供者之间有限的可移植性

由于云计算行业内没有建立工业标准,因此,公有云存在不同程度的私有化。当云用户定制的解决方案要依赖于这些私有环境时,在云提供者之间进行迁移就成为了挑战。

1.4.4 多地区法规遵循和法律问题

  • 第三方云提供者常常在可负担的或是方便的地理位置建立数据中心,云用户往往意识不到资源位置,但对某些组织来说,这可能造成严重的法律问题。比如英国法律规定,英国公民的个人数据只能留在英国境内。

  • 另一个潜在的问题涉及数据的获得和公开。有些国家的法律规定,某些类型的数据必须向某些政府机构或者数据主体公开。

第一章总结

  • 产生背景

    • 体现了云计算需求并导致其形成的主要商业驱动力:容量规划、降低成本和组织灵活性。

    • 影响并启发了云计算关键特征的主要技术创新:集群技术、网格计算和传统虚拟化技术。

  • 云计算的概念

    • 用户视角

    • 云计算提供商的视角

    • 平台技术视角

  • 目标和收益

    • 云环境由相当广泛的基础设施组成,提供了“按使用付费”模式租赁的IT资源池,即IT资源仅根据实际使用情况付费。与相同的企业内部环境相比,云具备减少初期投资,以及与可测使用情况成正比的运营成本的能力。

    • 扩展IT资源是云的固有能力,这能让使用云的企业适应无法预测的使用变化,不会因为受限于预设的阈值而拒绝用户请求。相反,按需减少资源扩展也是云的一个功能,它直接与成比例的成本收益相关。

    • 利用云环境使IT资源变的高度可用和可靠,企业能向用户提供更高的服务质量保证,同时,还能进一步降低或避免出现意外运行故障时可能带来的损失。

  • 风险与挑战

    • 云环境会引入不同的安全挑战,其中的一些与信任边界重叠有关,这些重叠是由于多个云用户共享一个云提供者的IT资源造成的。

    • 根据云提供者在其平台上提供的控制,云用户的运营控制受限于云环境

    • 云的私有特征可能会抑制云IT资源的移植

    • 当数据和IT资源被第三方云提供者处理时,其地理位置可能会可能会引起各种法律和法规问题

第二章 基本概念与模型

2.1 角色与边界

2.1.1 云计算常见角色

  • 云提供者:提供基于云的IT资源的组织机构

    • 云提供者要依据SLA保证,负责向云用户保证云服务可用。

    • 提供必要管理和行政职责,保证整个云基础设施的持续运行。

  • 云用户:使用基于云的IT资源的一方。可以是组织机构或个人,他们与云提供者签订正式合同或者约定,使用云提供者的可用IT资源。

    • 云用户使用云服务用户来访问云服务。

  • 云服务:指任何可以通过远程访问的IT资源。

  • 云服务拥有者:在法律上拥有云服务的个人或者组织。

    • 云服务拥有者可以是云用户,也可以是拥有该云服务所在云的云提供者

    • 当用户在云中部署了自己的服务,它就变成了云服务拥有者。

    • 如果云提供者部署了自己的云服务,通常是供其他云用户来使用的,那么云提供者就变成了云服务拥有者。

  • 云资源管理者:负责管理基于云的IT资源(包括云服务)的人或组织。

    • 云资源管理者可以是云服务所属云的云用户或云提供者。

    • 云资源管理者可以是签订了合约来管理基于云的IT资源的第三方组织。

  • 其他角色:

    • 云审计者:对云环境进行独立进行独立评估的第三方,典型责任包括安全控制评估、隐私影响以及性能评估,主要目的是提供对云环境的公平评价(和可能的背书),帮助加强云用户和云提供者之间的信任关系。

    • 云代理:承担管理和协商云用户和云提供者之间的云服务使用的责任,其提供的仲裁服务包括服务调解、仲裁。

    • 云运营商:负责提供云用户和云提供者之间的线路级连接,通常由网络和电信提供商担任。

2.1.2 云计算的边界

  • 组织边界:是一个物理范围,指由一家组织拥有和管理的IT资源集合。

    • 组织边界表示该组织的IT资产和IT资源,不表示组织实际的边界。

  • 信任边界:是一个逻辑范围,通常会跨越物理边界,表明IT资源受信任的程度。

    • 当组织角色是云用户是,要访问基于云的IT资源时,需要将信任扩展到该组织的物理边界之外,把部分云环境包括进来。

    • 扩展的信任边界包括云提供者和云用户的组织边界。

2.1 小结

  • 与基于云的交互和关系常见的觉得包括:云提供者、云用户、云服务拥有者和云资源管理者。

  • 组织边界代表着一个组织拥有和管理的IT资源的物理范围。

  • 信任边界是逻辑范围,包括一个组织信任的IT资源。

2.2 云特性

  • 按需使用:云用户可以单边访问基于云的IT资源,给予用户自助提供IT资源的自由。一旦配置好了,对自助提供的IT资源的访问可以自动化,不再需要云用户或云提供者的介入。

  • 泛在接入:是一个云服务可用被广泛访问的能力。实现泛在接入可能需要支持一组设备、传输协议、接口和安全技术。

  • 多租户:一个软件程序的实例能够服务不同用户(租户),租户之间互相隔离,通常通过虚拟化技术实现。

  • 弹性:云根据运行时条件,或云用户或云提供者事先确定的要求,自动透明的扩展IT资源。这是采用云计算的核心理由。

  • 可测量的使用:是云平台记录对IT资源使用情况的能力,根据记录的内容,云提供者只对云用户实际使用的和/或被授予IT资源访问的时间段进行收费。

  • 可恢复性:是一种故障转移形式,他在多个物理位置分放IT资源的冗余实现。当一个资源出现故障时,就自动转移到另一个冗余实现上处理。

    • 一个可恢复的系统,其中云B中由一个服务A的冗余实现,当云A上的云服务不可用时,提供故障转移。

2.2 小结

  • 按需使用指云用户能够通过自助服务来使用所需的基于云的服务,而无需与云提供者交互。这一特性与可测量的使用有关,后者表示的是云对其IT资源使用进行测量的能力。

  • 泛在接入即随处访问。允许基于云的服务能够被各种云服务用户访问,而多租户指一个IT资源的一个实例可以同时透明的服务多个云用户的能力(计算机中”透明“指”不可见“)

  • 弹性特性表示云能够透明的和自动的扩展IT资源。可恢复性与内在的云故障转移特性相关。

2.3 云交付模型

云交付模型:是云提供者提供的具体的、事先打包好的IT资源组合,公认的和被形式化描述了的三种常见云交付模型是:

  • 基础设施及服务(IaaS)

  • 平台即服务(PaaS)

  • 软件即服务(SaaS)

三种基本云交付模型的变种:存储即服务、数据库即服务、安全即服务、通信即服务、集成即服务、测试即服务、处理即服务……

  1. 基础设施即服务(IaaS):基础设施可以包括硬件、网络、连通性、操作系统以及其他一些原始的IT资源,这些资源是虚拟化的并打包成包,使得运行时扩展和定制基础设施变的简单。

  2. 平台即服务(PaaS):是预定义好的就绪可用的环境,一般由已经部署好和配置好的IT资源组成。用户使用PaaS的常见原因包括:

    1. 为了可扩展性和经济原因,云用户想要把企业内的环境扩展到云中。

    2. 云用户使用已就绪环境来完全代替企业内的环境。

    3. 云用户想要成为云提供者并部署自己的云服务,是指对其他外部云用户可见。

  3. 软件即服务(SaaS):把软件程序定位成共享的云服务,作为”产品“或通用工具进行提供。特点:

    1. 订阅制

    2. 无需安装和维护

    3. 随时随地访问

    4. 自动更新和升级

三种云交付模型的比较:

你需要做的 平台提供的

IaaS

PaaS

SaaS

应用程序

应用程序

应用程序

数据信息

数据信息

数据信息

中间件/运行库

中间件/运行库

中间件/运行库

数据库

数据库

数据库

操作系统

操作系统

操作系统

服务器/虚拟机

服务器/虚拟机

服务器/虚拟机

磁盘柜

磁盘柜

磁盘柜

计算机网络

计算机网络

计算机网络

机房基础设施

机房基础设施

机房基础设施