Docstoc
EXCLUSIVE OFFER FOR DOCSTOC USERS
Try the all-new QuickBooks Online for FREE.  No credit card required.

Cloud Computation beyond Tuing Machine

Document Sample
Cloud Computation beyond Tuing Machine Powered By Docstoc
					超出图灵机的云计算
Cloud Computation Beyond
     Turing Machines
         李 德 毅
         lidy@cae.cn
       2009年11月29日
     主 要 内 容

一、互联网改变了计算机和软件的工作模式

二、网络科学十年形成了对互联网的新认识

三、超出图灵机的云计算

四、云计算的基本内容

五、云计算对信息产业的影响
一、互联网改变了计算机和软件的工作模式
                     从图灵计算到网络计算的演化
  图灵论文                            73年 (1936年)
  计算机                             65年 (1944年)
  软件工程                            41年 (1968年)
  互联网                             25年 (1984年)                                                                      Cloud
                                                                                                                 Computing
  万维网                             20年 (1989年)                                                                      2007
                                                                                                          Wiki
  网络科学                            11年 (1998年)                                                   Utility
                                                                                     Semantic Computing
                                                                                                          2001
                                                                                       Web
  维基百科                             8年 (2001年)                            eCommerce
                                                                                                 2000

                                                                                        1999
                                                                Mosaic     1995
                                                      WWW
                                                                 1993
                                                      1989
                                           Internet
                                  TCP/IP
                                            1984
                        ARPANET
 Packet     Hypertext              1974
Switching                                                                                        WEB Services
                          1969
              1965                                                                WEB
  1964                                                                                         web2.0 , web3.0
                                                           IP                 web1.0
                        Everything is over
                                                      V4        V6
通信发展的吉尔德速度是微电子发展的摩尔速度的2-3倍

                 university        production use        commercial            broadband
       theory    prototypes          in research       early residential         home


1960          1970          1980                1990                   2000                2010
     port            100 kb/s      1 Mb/s           10 Mb/s         100 Mb/s         1 Gb/s
     speeds



     FTTx系列技术迅速发展。100Mbps的端口速率能够传输1500
      余路传统话音(按照PCM编码速率计算)。
     无线接入技术迅速发展。如3G达2Mbps, WiFi达11Mbps,
      WiMax 达34Mbps, B3G标志性指标1Gbps已经实验成功,为
      泛在的网络计算提供接入条件。
 通信(尤其是光通信和移动通信)和网
络(尤其是互联网)比可计算模型和软件
理论发展快,且很快渗透到人类生活中去
,加快了从图灵计算到网络计算的转变。


IT大公司纷纷宣布了自己的云计算计划,如
此一致的行动在IT产业的历史上难得多见。
                     Alan Mathison Turing
                      1912.6.23 - 1954.6.7


Alan Turing, “On Computable Numbers with
an Application to the Entscheidungs problem”
       —— Proceedings of the London Math Society 2 (42),
1936, pp. 173-198.
    图灵命题
   图灵1936年的传世论文《论可计算数及其在判定问题中的应
    用》主要是回答德国大数学家希尔伯特在1900年提出的著名
    的“23个数学难题”之中的第10个,问题涉及逻辑的完备性
    ,即是不是所有的数学问题在逻辑上都是可解的。这篇论文
    说,有些数学问题是不可解的。
   自动计算机的理论模型是在该论文中提出的,这种抽象模型
    可以把推理化作一系列简单的机械动作,被称作为图灵机的模
    型,有许多等价描述。歪打正着,图灵机模型到上世纪60年代
    却转变成用来说明可计算能力的模型。
   为纪念该文发表30周年,1966年设立“图灵奖”,以纪念这位
    计算机科学理论的奠基人。
图灵机
   一条双向可无限延长的、被分成一
    个个方格的磁带, 格里写有符号

   一个有限状态控制器

   一个读写磁头

图灵机的动作由五元组确定:
      < q, b, a, m, q’ >
其中,q和q’为控制器的当前状态和下一状态;b和a为方格中的原有符号
和修改后的符号,m指示磁头移动方向,或左或右或停。由状态和符号
确定的工作过程称图灵机程序。

图灵论题:凡是可计算的函数都可以用图灵机计算。
                           邱奇-图灵论题
邱奇论题:任何计算,如果存在一有效过程,它就
能够被图灵机实现。
冯·诺伊曼结构的计算机
   计算机由控制器、运算器、存
    储器、输入设备和输出设备组       冯·诺依曼(1903-1957)
    成。
   基本原理:存储程序(stored
    program)并按地址顺序执行。
   控制器按照程序顺序,逐条把
    指令和数据从存储器中取出并
    加以执行,自动完成由程序所
    描述的处理工作。
冯 • 诺伊曼结构的计算机

   计算机的核心包括运算器和控制
                            应用软件
    器在内的中央处理单元(CPU)。

   计算机系统是由软硬件组成的多      中间件

    级层次结构,由微程序级、一般
                       系统软件
    机器级、操作系统级、汇编语言
    级、高级语言级组成。         裸机

   从此,人们把CPU和操作系统看
    作计算机的“核”。
程序设计和软件工程

   在每一个层次上都能够进行程序设计。

   高级语言程序设计过程是“分析问题—>建立数学模型—>
    选择数据结构—> 设计算法—> 编程—>编译器逐层向下
    编译成为机器可执行代码由机器运行”的过程。



         软件 = 程序 + 文档

            = 算法 + 数据 + 文档
                互联网之父
   Robert E. Kahn        Vinton G. Cerf
   (1938-      )         (1943-      )




美国国家研究推进机构CNRI董事长   Google公司副总裁兼首席互联网顾问


因为在TCP/IP协议方面所取得的杰出成就,他们在2004年荣膺图灵奖,
2005年获得美国总统颁发的总统自由勋章。
         万维网之父




           Tim Berners-Lee
            (1955-     )

伯纳斯.李将超文本引入互联网, 创建万维网协议HTTP和
HTML, 2004年成为全球最大的技术类奖——千年技术奖的首
位获奖者,现任万维网联盟 ( WWW Consortium)主席。
                   维基之父




     Jimmy Wales 1966.8.7--   Lawrence Sanger 1968.7.16 --


 Wikipedia 2001年1月15日正式问世,目前世界上最
大的Wiki系统,“让世界上每个人都能自由分享人类
知识的总和”,创始人吉米·威尔士和拉里·桑格
 用云作为logo表示网络环境和网络资源早就有之

                                      汽车电子设备
             GPS

导航




                                               iPhone


移动电话
                                               PDAs


                                                 DCs

       TVs         PCs   智能家电   传感器        。。。
     中国互联网发展状况
         (截至2009年3月31日)



  网民人数   3.16亿    宽带网民    2.70亿
  手机用户   6.70亿    年增长率    133%
  手机网民    1.18亿   农村网民    8460万
  中文网站   287.8万   网站域名    1682万


一个无处不网、无时不网、人人上网、时时在线的时代!
•



    图灵奖获得者吉姆.格雷(Jim Gray)说:

    网络环境下每18个月产生的数据量等
    于过去几千年的数据量之和。
30年前,电脑被送进千家万户……


20年前,网络被送进千家万户……


现在,服务被送进千家万户……
想一想:电子邮件客户端的变化
 从电子邮件变迁看软件由制造业到服务业的趋势

电子邮件    Eudora 是   WebMail   Hotmail        用户不再关心
        第一个有       诞生,                      邮件管理软件
诞生,用                         流行,
        图形界面       用户可                      自身,在同一个
@符号隔                         并纳入            帐户下,用户
        的电子邮       通过任
离用户名    件管理系                 MSN            可使用网络日
                   何联网
                                            历、文档处理、
和邮箱服    统          计算机                      照片存储和协
务器                 获得邮                      作等在内的多
                   件服务                      种服务。


                   WebMail




 1971       1988     1995      1996              2004

                             Thunderbird, Outlook和
                             Foxmail等邮件管理软件也
                             提供基于Web的服务。
想一想: VISTA操作系统规模为什么这么大?
 Windows操作系统的演化
 功能扩展
                                                                            vista

                                                                            Server 2003
                                                                     XP
防火墙和用
                                                         me
户安全
                                               98
多媒体平台
系统

网络和通讯                                95                       2000
等功能

即插即用对
各种外设的
支持                             3.2
                       3.1                 NT4.0
通信服务

多用户多任               3.0
                             NT 3.1
务系统            2.0
……
         1.0
                                                                                          版本升级

         85年 87年     90年 92年 94年 95年 96年           98年   00年   00年    01年   03年 06年 08年 时间
         11月 12月     5月 3月       8月 8月             6月    9月    12月    10月   4月 11月
 Windows绑定大量与网络相关的软件使得规模越来越大
                                                                “安全优先”
                                                                的设计理念,
   Vista       升级版本                                             引入许多新的
                                                                安全机制和技
                                                                术,提高用户
                                         面向商业,包含                终端的安全性
Windows XP                               NTFS文件系统、                 …
                                         EFS文件加密、       整合许多的第三方软件
                                         增强硬件支持等           …
Windows 2000                                …

                               捆绑IE销售,
Windows 98                     给系统桌面提       改良对硬件标准的支
                               供HTML支持      持并整合到桌面上
Windows 95                       …             …


Windows 3.*                      改进界面、内存管理
                 借鉴Mac OS        添加声音I/O的基本多
                   …             媒体支持、TrueType
Windows 2.0                      字体…


Windows 1.0
                  用户
                 图形界面…
  MS-DOS
                  85年    87年    90年   95年   98年   00年    01年   06年
                                                                     24
    操作系统对硬件配置要求越来越高

                  处理器            内存          硬盘        显卡         代码行数

                 800MHz
                 Pentium4 1GHz   512MB                DirectX 9
Windows Vista                    推荐1GB以上     15GB以上    64MB       约5000万行
                 32位或64位

Windows XP       233MHz
                 推荐Pentium III
                                 128MB       1.5GB
                                                      4MB显存       约3500万行
Professional     500MHz以上
                                 推荐256MB以上   推荐4GB

                 233MHz
Windows 2000     推荐PentiumⅡ      64MB        1GB
                 450MHz以上        推荐128MB以上   推荐2GB
Windows ME       Pentium150      32MB        320MB
                 486             16 MB
Windows 98                       推荐24MB以上
                                             500MB                约1800万行
                 或586
                 486
Windows 95       或586
                                 8MB         300MB                约1500万行



               电脑耗能成为全球气候变暖的祸首之一
           绿色IT

   网络中心、数据中心和超算中心电耗惊人!

   电纸书阅读时几乎不耗电

   Google自己在建电站
用户不需要千人一面的操作系统

   用户需要便宜、简单、省电、多元、个性化的
    端机

   很快的上网速度



    轻量化的操作系统成为大势所趋 !
想一想:个人建个网页要多久?
  编程的变迁: 从精细编程(coding)到大块编程
  (mega-programming)
     十多年前:一个礼拜                        现在:一个下午




了解Internet, WWW, 学习 web server,   鼠标点击、点击、点击….
The simple HTML page…             具有丰富应用的Blog页面就可以产生
如果通信不是个问题……


如果网络不是个问题……


如果沟通不是个问题……
计算机之间的相互作用多种多样

   计算机之间的交互可归纳为:消息传递、数据交换和程
    序调用。

   计算机病毒(能够通过修改其他程序并把自身拷贝包含
    在其中而感染这些程序的程序)在计算机之间传播

   网络蜘蛛在万维网中各站点爬行,捕获网页内容,对词
    语进行索引编排,并发回主站点

   网络机器人可以使用这台计算机,控制另一台(批)计
    算机的资源(带宽、存储空间和计算能力),机器人可
    以繁殖和传播
    网络计算:蜘蛛在网页上爬行
   Spider是基于Web的程序, 它通过请求站点上的 HTML
    文档访问某一站点, 不断从一个站点移到另一个站点
    , 自动建立索引,加入到网页数据库中。
   Spider 进入某个超文本时, 利用HTML 语言的标记结
    构来搜索信 息及获取指向其他超文本的 URL 地址,
    无需用户干预, 实现网络上的自动爬行和搜索。
   Spider 每遇到一个新文档, 都要搜索它上面的链接
    。搜索策略以深度优先搜索为例, 它沿着一条选中
    的链接向下搜寻, 顺着一级级链接查询到不再含链
    接的Web 页面, 再沿原路返回出发点, 选择下一个
    链接继续搜索,遍历 Web 空间。
    网络计算:蜘蛛在网页上爬行
   Spider 将每次搜索的结果( 文档名称
    、URL、 概述、链接等信息) 存放在
    网页数据库中,所显示的结果就是从这
    些数据库中调出来的。
   像MetaCrawler 这样的Meta 搜索网站,
    使用机器人去浏览其他机器人的搜索结
    果, 将几个搜索站点的查询结果重新
    组合起来形成新的列表。
互联网突破了图灵机的描述范畴

   互联网上的计算以交互为中心,此计算机可以影响彼计
    算机的运行状态,和物理距离几乎无关;
   CPU只是网络上一个个自治节点中的可计算部分;
   节点可以是异构的;
   节点之间可存在弱耦合的关系;
   互联网不存在。

集中统一的调度,顺序的、确定的输入,不能描述互联网的工
作机理和交互机理。互联网不等同于一台虚拟的图灵机模型。
互联网成功实现了一群实现自我价值的人

   博客(Blog)成为面向公众的个人信息发布系统,还衍
    生出移动博客、图片博客、微博客等;
   播客(Podcast)成为个人网络广播站;闪客指用Flash软
    件做动画的人;拍客在摄影论坛张贴自己的作品,加入
    摄影讨论;黑客(Hacker)进入别人 系统,寻找漏洞,
    利用漏洞;
   威客(Witkey)是网上“我帮人人、人人帮我”的一群
    人,在威客网站上公开自己的知识、经验、能力,能够
    提供的服务,或者提出问题,寻求服务。
     互联网不是什么?


互联网 ≠ 世界上最大的计算机


互联网 ≠ ∑ 图灵机
          互联网是什么?

   互联网成为人人感知和认知不可或缺的装备,使
    得人的感知能力和认知能力挣脱了时间和距离的
    束缚,得到极大地延伸;
   互联网成为人与人之间沟通的不可或缺的装备,
    使得人与人之间、人与社会之间沟通质量和效率
    得到极大地提升;
   互联网正在向物联网渗透(CPS)。
         互联网是什么?

   互联网是人类二十世纪最伟大的发明,它改变了
    人类的生活方式、工作方式和休闲方式,改变了
    社会的民主、教育、经济、商务、健康与娱乐机
    制,已经成为推动新的技术发明和社会变革的最
    强大的发动机。
         社区是什么?


   社区成为网上从事某种专项事物的人群,或者
    从事某种专项服务的领域,社区就是商业圈、
    企业圈、娱乐圈、学术圈、业务圈、朋友圈等
    等。
   社区规模可大可小,社区主题可粗可细,社区
    门槛有高有低,社区划分无穷无尽。
         社区是什么?


   社区的出现巧妙地解决了人工智能中无法解决
    的常识知识的界定和表达问题。
   信息时代,人人都在社区之中,人人都在有差
    异的多个社区之中。
二、网络科学十年形成对互联网新的认识
Ten Years History for NetSci

       Watts, Nature, 1998
       Barabási, Science, 1999




Physics        Network            Physics
            网络科学的兴起
WS 小世界模型(1998)             BA 无标度模型(1999)




         Duncan Watts                Albert Barabási
       (1971- , America)           (1967- , Hungary)




         Steven Strogatz               Réka Albert
       (1959- , America)             (Ph.D. in 2001)
  A twenty-first century science




If handled appropriately, data about Internet-based
 communication and interactivity could
 revolutionize our understanding of collective
 human behavior.
        —— D J Watts, NATURE, 1 February 2007
I want to make sense out
   of this, how do I do it?
Challenge : basic, but very hard
How to understand networks?


             Preferential Attachment in Evolution


              Node Activity




                                   Local Effect



  Heterogeneity
互联网是网络科学研究的重要载体
  互联网不是交响乐,没有总指挥,
没有人为它规定开始、中间和结尾,在
互联网发展过程中有协议或规范来定义
它的架构,这一架构从来没有完整的规
划,没有所谓的顶层设计。要有,那就
是演化。万维网亦然。
网络科学告诉我们,互联网、万维网等现
实世界中的网络具有下列特性:

   小世界现象

   无标度:二八定律和长尾分布

   不均匀性(高集聚性)

   脆弱性和鲁棒性并存

   级联失效和连锁崩溃
                      70后们在干什么?

     PageRank算法(1998)                HITS算法(1998)        GN算法(2002)




   Sergey Brin      Larry Page         Jon Kleinberg
(1971- , Russia) (1973- , America)                       Mark Newman
                                     (1971- , America)
  Jon Michael Kleinberg
  乔恩·克莱因伯格
                          1971年生,1993年康奈大学计算机学
                           士学位,1996年麻省理工学院计算机
                           博士学位。现任康奈尔大学计算机教
                           授,美国工程院最年青的院士之一。
                          研究兴趣是网络与信息组合结构的数
                           学分析与建模,创造了基于超链接分
                           析的主题搜索算法HITS。
                          以解决重要而且实际的问题并能够从
                           中发现深刻的数学问题(尤其是网络
                           结构的数学分析方法)而著称。

2006年获得信息学领域最杰出数学成就奖——拉尔夫·奈望林纳
奖(Rolf Nevanlinna Prize)
  任何人,作为网络的端用户,其端
机上的资源(计算资源、存储资源、软
件资源和信息资源等)和网络上的资源
相比, 都变得微不足道。
 无论用户是在进行网格计算、对等
计算、还是信息搜索,哪些事情由端机
承担?哪些事情由边缘网络承担?哪些
事情由核心网络承担?这成为一个资源
规划问题。网络资源对一个特定的在线
端用户而言如何表示?
     科学问题:谁瘦谁胖?
两个极端状况:
   网络上没有任何信息资源,网络仅仅实现即时
    的交换,回到传统通信的交换时代。

   所有信息资源都在主计算机(虚拟机)上,端
    机仅仅是人机即时交互,回到传统的主机/终
    端模式。
 有了云计算,广大用户无需自购软、
硬件,无需将自己的软硬件系统交给它
人托管,甚至无需知道是谁提供的服务,
只关注自己真正需要什么样的资源或者
得到什么样的服务。
   对于大量的中小企业,不再需要一开始就花费大
    量的投资来购买部署计算机软硬件设备和聘用维
    护人员;不必担心因为高估自身业务受欢迎的程
    度而过度部署造成资源浪费,或由于对广受欢迎
    的业务部署不足错失潜在的客户。

   这种不需要额外代价就能获得信息资源使用上的
    柔性,按需获取,在IT历史上前所未有。
       买单买什么?

   买知识产权(许可证)?
   买硬设备?买软件?买配置?
   买电?买电子垃圾?
   从为我所有到为我所用——买服务
 中小企业是云计算的最大受益
者,用户应用成本的降低以及应
用自由度的增加是云计算带来的
基本驱动力。
信息服务不能简单地等同水电服务


  信息服务         水电服务

  信息不会损失        一次性使用


 双向传送,双重角色    单向传送,单一角色

    信息内容
              有规划、有统一调度
 无规划、无统一调度

个性化、多样化、多粒度    内容单一、通用
三、超出图灵机的云计算
          图灵模型的局限性

   从初始字符串到终态字符串,
    可认为是确定空间点到点的
    映射,无法解决不确定性问题
   通过时钟频率把模拟量近似为
    数值量,并决定了读写磁头动作
    的快慢,等粒度的细分决定
    了数字化程度,至于这样的近似
    是否可行,数值量如何返回模拟量, 均不在图灵模型考虑之
    内
   图灵模型中没有考虑输入输出的形式化方法,输入输出、人
    机交互没有出现在计算过程中
                                                                     云计算




                                                                  网络增值服务
                                                                代表公司:Google
                                           面向大众的成套软件         特点:向端用户收小
                                                             

                                                             头,向寄生在服务上
                                                  代表公司:微软
                                                             的广告商要大头
                                 企业解决方案        特点:基于个人计算,
                                               

                                               服务大众市场
                                代表公司:ORACLE
                   软件产品
                             特点:面向领域,以
                             

               代表公司:        企业解决方案供应商
     软件定制      Informatics   的面目出现
   代表公司:CSC
          特点:保护知识产
               


特点:为单 个客
          权,以许可证方式
户提供定制软件, 销售软件产品
包括技术咨询、软
件编程和维护。软
件销售是一次性的
     软件工程危机归根到底是图灵危机
                                            互联网
                                            云计算

       软件作为单
软件附属   独产品,催     面向   面向     面向        面向    面向
于硬件    生软件工程     过程   对象     构件        领域    大众


50年代   60年代    70年代   80年代    90年代           现在



   软件工程太多地关注图灵计算,忽视了人机交互,
    忽视了机器行为通过人群的参与引发的相互影响。
                                  62
图灵模型作用的扩大化
   尽管图灵命题主要说的是数学的弱点,在解决数学问题
    时图灵机不能够做什么,如停机的不可判定问题。但是
    计算机科学家们却逐渐开始将图灵机用来说明可计算能
    力的模型,进而作为一种解决所有计算问题的模型,把
    图灵机作用扩大化了。

   图灵自己也认为图灵机并不适于作为解决计算问题的通
    用模型。包括图灵和图灵奖获得者米尔纳等在内的学者
    尝试用交互机来扩展图灵机模型,形成超图灵计算。
图灵模型作用的扩大化

   凡是有集中控制的高性能计算机、集群计算机、虚拟

    机、网络系统、分布式系统等依然可看作图灵计算。

   40年的软件工程发展一直以图灵计算为中心。

   人们在寻找交互计算的超图灵计算模型。

   迅速发展的互联网改变了计算格局;互联网不存在集

    中统一的控制,不等同一台虚拟图灵机。
超图灵计算模式
   Wegner, Leenwen等人提出基于图灵机的交互机器模型
    ,如 site 机、交互机、多流交互机、持续图灵机(
    persistent Turing machine)等,企图扩展图灵机使其具
    有动态输入和输出能力。

   尽管已经证明这些模型的表达能力比图灵机强,但是
    它们只描述单个交互式系统而不涉及复合系统,不能
    用来研究全部交互机制,不能用来研究互联网。
   网络计算强调把计算机嵌入到网络、环境或日
    常工具中去,让电脑笔记本消失,人们注意的
    中心回归到要完成的任务本身。
   1991年施乐公司前首席科学家Mark Weiser提出
    普适计算思想。例如,他在办公室门前建造了
    一个喷水池,用喷水量和水柱高度来模拟显示
    网络上当前全球股价的走势。
   网络建立起一个人与人可以充分沟通的公用计
    算环境,把群体智能融入网络。
新理念:
                           Jimmy Wales
                           (born in 1966)

   大众既是软件的使用者,也是软件的开发者;既
    是服务的消费者,也是服务的提供者。图灵没有
    考虑过这样的群体智能产生模式。
   维基百科的创始人吉米·威尔士(Jimmy Wales)想
    到了。
    大众参与的计算(Wikipedia)
   维基百科利用大众来集体创作百科条目,是通过社会评注
    形成群体智能的典型应用。
   在维基模式中,任何用户都可以对自己感兴趣的条目进行
    编辑。
   编辑是完全自由的,用户可参与到任意的条目中贡献任何
    的看法。
   尽管每个人在条目编辑中可能会出现错误,甚至恶意篡改
    ,但是在大众参与的情况下,错误与恶意篡改的部分会被
    很快纠正过来,大多数条目都保持了相当高的水平。
“Cloud computing”条目
   该条目创建于2007年9月4日

   一段时期是简单的、片面的争议版本

   到2009年9月11日,经历了868位用户的2 375次编辑
    ,逐渐趋于稳定,形成比较客观、准确的解释

   条目的单月浏览量:2008年1月为21 537次;2009年8
    月为253 501次。

   本条目在en.wikipedia.org 中的浏览量排在第1134位
    。
2007年9月4日 2008年9月4日   2009年9月14日
2007年9月4日   2008年9月4日 2009年9月14日
2007年9月4日   2008年9月4日   2009年9月14日
2009年9月以来的编辑日志
 Edits        User         Edits       User
  625     SamJohnston        9     88.173.106.101
  37       Bkengland         8        Sanjiv
  37        MrOllie          8       XLinkBot
  34          Ronz           8      FatalError
  29        Letdorf          8        Trödel
  25     CloudComputing      7       Gratridge
  23      WikiLaurent        7      75.41.52.92
  22     SteveLoughran       7     93.3.248.168
  21        SmackBot         7     121.242.112.11
  17          Rw2            7        Kompere
  16     203.199.211.117     7     UncleDouggie
  14     68.111.85.247       6     68.193.125.252
  14       Metapsyche        6         Rich
  13         CliffC          6     131.107.0.73
  13        Sapenov          6       Chanakal
  12      70.79.65.227       6        Mwarren
  12     69.222.228.201      6     75.38.30.240
  11      WikiScrubber       6      AstralWiki
  10       Bovineone         6     74.39.200.63
   9        Walshga          6     Jakemoilanen



对该条目贡献(修改次数)最大的前40位用户
2008年1月该条目浏览量21,537次的分布:
                                                            浏
                                                            览
                                                            次
                                                            数




2009年8月该条目的浏览量253,501次的分布:
                                                            浏
                                                            览
                                                            次
                                                            数




 This article ranked 1134 in traffic on en.wikipedia.org.
我们在2009年9月9日对“cloud computing ”的小修
改




一个月后,至2009年10月9日,该条目又新经历了156次编辑。
2009年10月7日数据统计快照
     群体智能

 现实生活中人类对某个概念或事件的认
知,经过一段时间的反复、交互、汇聚、
修正与演化,群体形成趋于相对稳定的共
识。合作编辑下的维基条目就是这种过程
的生动再现。
              大众参与的计算
PICKS RANDOM STRING         RENDERS IT INTO A
     OF LETTERS             DISTORTED IMAGE


     oamg
   …AND GENERATES A TEST:




            TYPE THE CHARACTERS
          THAT APPEAR IN THE IMAGE
大众参与的计算

   类似于图片识别等任务对于人来说很简单,但要
    转化为图灵可计算问题却是很大的挑战,因此,
    网络环境出现可信计算和可信软件的研究。
   又如,目前搜索引擎上的爬虫程序搜索的只是文
    字资料,难以实现图片内容搜索。而如果能够让
    用户参与这种搜索,网络连接的就不(只)是计算
    机, 还有人。
大众参与的计算
   目前的搜索引擎软件要判断图片内容很难,公司不得不
    雇佣一些人来整理图片,为其标上标签。
   Luis开发了一个游戏:网上玩家共同看一张图,玩家必
    须给出一个关键字,另一个玩家要与之配对,一旦两边
    输入的关键字一样就得分,进入下一关。这样,游戏运
    行的一段时间之后将会产生大量基本图片标签。而如果
    网络游戏者都能为这样的图片标签系统作贡献,甚至可
    以渐渐将整个图片的资料库建立起来。
   对图形实现社会标注的构想
    网民(北京)            网民(纽约)




GUESSING: CAR      GUESSING: BOY
GUESSING: HAT      GUESSING: CAR
GUESSING: KID      SUCCESS!
                   YOU AGREE ON CAR
SUCCESS!
YOU AGREE ON CAR
社会标注

       BEACH
       SEA
       PEOPLE
       TALKING
       PORCH
       SKY
       BELL
       CHAT BY BEACH
群体智能:对图片进行分类
分成为两类
 分成为六类




为宠物找到了主人!
   通过群体标注,图片如此分类!
   社区常识决定不同社区有不同标注!
   对文本进行群体标注会如何?
   对视频图像进行群体标注又会如何?
   通过标注可否实现跨媒体检索?
       各尽其能,超出但没有超越

   图灵机智能 (人工智能)                    云计算
    数值计算
    海量的存储和永不遗忘的记忆                   图灵机
    快速的搜索和灵活的匹配
    逻辑思维:确定的形式化推理能力

   群体智能(collective intelligence)
     常识知识(生活常识、社会常识、百科常识……)
     形象思维:图像思维能力
     感悟、联想、顿悟等
     不确定性智能
          Wiki项目计划




                     维基教科书
       维基百科



维基资源
              维基新闻
网络智能 = 图灵机智能 ∽ 群体智能


 云计算 = 图灵计算 ∽ 大众计算
为什么大家都喜欢云?

天空中大量云滴构成的云,远观有形,
近观无边,千姿百态,飘逸不定,有时
如朵朵棉花,有时一泻千里,或淡或浓,
或卷或舒,自在洒脱,在长空中漂浮着,
聚散着,变幻着,引发人类诸多遐想,
造就多少不朽诗句。
量子物理中的电子云

   量子物理中的电子云(electron cloud): 在原子核

    周围运动的电子,不是一个确定的轨道,而是

    弥漫空间的云状存在,形成一个概率分布的密

    度函数,可用薛定谔波动方程来描述。

   电子云具有概然性、弥漫性、同时性等。
   云计算一定是基于互联网的。互联网为大
    众提供一个个虚拟的、丰富的、按需即取
    的数据存储池、软件下载和维护池、计算
    能力池、多媒体信息资源池、客户服务池
    ;提供人与人、社区与社区沟通的便捷平
    台。

                         93
 云滴:服务       互联网的生态
   水气凝结成云滴        云:服务的聚合
               云滴聚集成云
阳光:用户需求

          蒸发:     降水:
          服务的发布
                  按需即取


水库:“云数据中心”




 类比水的生态循环,看基于网络的信息服务和服务质量。
大胆的设想:
                         Chris Langton(1949-)

   “生命的本质在于物质的组织形式,而不在于物质的
    自身”—— 人工生命之父克里斯·兰顿

   信息资源网络的本质在于信息资源之间的组织形式,
    而不在于承载信息的图灵机自身

   云计算的提出有可能导致软件工程的重大变革,突破
    图灵机模型的束缚:不在于单台图灵机上的软件,而
    在于网络上软件之间的相互作用。引发对计算机CPU
    核、操作系统、交互这三者关系的再认识!
                                       95
   图灵计算与云计算的比较

   图灵计算            云计算
重点关注CPU和操作系统    重点关注节点间的交互

   确定的计算          不确定的计算

    最优解           尽力而为的解
   统一的调度       无集中控制、局域性偏好依附
   机械的执行          有主体行为能力
   可计算模型           服务模型
  人不参与的计算        人主动参与的计算
软件的网络化性质比单台图灵机上软件单
元的性质更强烈地影响着网络软件的整体
行为和特性,甚至出现涌现,如计算机病
毒在全网的突然泛滥等。




                     97
         软件 —— 永远的beta版
   软件将没有版本的概念,采用永远在用的软件开发
    模式(the “forever beta” approach to software)

   谷歌的Gmail, Gdoc已经采用

   云计算淡化了软件产品的生命周期,服务商可以无
    数次在线更新软件,而用户与软件的互动使得软件
    向贴近用户需求的方向演化
         软件即服务(SaaS)

   “SaaS”改变了操作系统、中间件等作为产品
    配置在客户端的传统,软件可以租用;用户端
    可以零安装、零维护、零剩余;

   出现同一个应用软件系统(如CRM)同时租
    给许多不同用户使用(multi-tenance)
    软件、平台和信息基础设施都是服务

   PaaS:亚马逊(Amazon)的一个虚拟计算单
    元(相当于1.2Ghz的Intel Xeon的32位处理器
    、1.7GB内存、160GB存储器)付费为每小时
    0.1 美元,在S3上存储1GB的数据每个月只需
    0.16美元。
   网上社区的群体智能(舆情)也许能够强烈地影
    响着网上社区的整体行为和特性,出现涌现。这
    种涌现甚至影响到社区之外的更大范围。

   2009年6月伊朗大选结果引发了大规模的抗议活动,
    示威者纷纷通过Twitter、Facebook等网络工具,
    突破国内新闻封锁,沟通彼此,并向世界报道。
    伊朗发生着两场革命,一场在街头,一场在网络




                                101
四、云计算的基本内容
目前,太多的定义和太泛的解释使

得云计算有成为“皇帝的新衣”之

嫌,迫切需要业界汇聚共识!
内容一:虚拟计算
 虚拟存储
 虚拟机
 虚拟网络
 虚拟社区
 虚拟计算能力


计算设施的本身细节和物理位置对用户透明。
内容二:变粒度和跨粒度计算
云滴在不同的粒度上提供服务:
  云滴的弥散性——雾

  云滴的聚合——云团

  毛毛细雨,小雨,中雨,大雨


复杂的软件、资源、服务和计算任务,被精细化和
碎片化,变得易于重组和扩展,可以即时性协作,
实现服务聚合,完成变粒度的计算/服务任务。
 对服务资源不同层次的管理和动态扩
展,从不同的粒度上对“云”所提供的服
务资源进行处理,形成面向不同社区用户、
不同使用目的、表现形态各异的云滴和云。
内容三:不确定性计算
 互联网上信息的特点是海量和低质量。
低质量包括高噪声、高冗余、不完备、不协
调、不一致、随机、模糊、多变等。

     统计计算
     群智计算
     不确定性计算
搜索结果的不确定性
   对于用户的一个请求,Google搜索引擎返回成千
    上万的相关网页,用户难以直接得到最关心的回
    答。
   不断地在“下一页”中找寻答案并不是最终目标
    ,如何将搜索返回的结果集聚合形成一个“摘要
    ”的按需回答,才是解决问题的关键。
   “云滴”和“期望”

 把按用户请求返回的N个页面看作是 N
个“云滴”,通过网页语义相似性及其对
用户请求的语义确定度计算,利用逆向云
发生器进行简约得到 “期望” ,从而实现
尽力而为的、非唯一的、按需服务的回答。
内容四:软计算
   根本上是定性定量转换计算
   内容计算:词(概念)计算、语义计
    算、文本计算、语音计算等;语构、
    语义、语境理解
   图形图像理解
   流媒体理解
         云计算的应用

   网络环境下信息资源的感知、存储、处理、发

    布、传播和租用;

   网络化数据挖掘:用户主导、面向领域的跨系

    统、跨媒体、即时定制的服务或者服务组合。
也许,目前人们提及的云计算还

仅仅是冰山上的一角!
热点问题一:云计算和网格计算
谁在“忽悠”谁?

   网格计算:学术界热、企业界不热

   云计算: 企业界热、学术界不热
     在线维基百科对网格计算的定义

      Grid computing is the combination of computer
resources from multiple administrative domains applied
to a common task, usually to a scientific, technical or
business problem that requires a great number of
computer processing cycles or the need to process large
amounts of data.
         Many for one


   网格计算:依托专网或互联网,将处于
    不同地域、不同领域的多个计算机资源
    组织起来,统一调度,组成一台虚拟的
    “超级计算机”, 完成一个共同的任务
    ,如一个要求大量计算处理周期和大量
    数据的科学计算问题。
     在线维基百科对云计算的定义

     Cloud computing is a style of computing in
which dynamically scalable and often virtualized
resources are provided as a service over the
Internet.
          One for many


   云计算:互联网上某些节点强大的信息资源,
    包括存储资源、计算资源、软件资源、数据资
    源、管理资源,通过云计算以互联网上的服务
    方式,变成广大用户动态、可伸缩的虚拟资源
    ,为用户所用。强调需求驱动、用户主导、按
    需服务,即用即付,用完即散,不对用户集中
    控制,用户不关心服务者在什么地方。
网格计算和云计算的相同点


    资源共享
    虚拟计算
       网格计算                  云计算

并行计算为主:依托网络将跨地域的计
算机组织起来并行作业,但需要通过调度系   集群计算为主 :节点自主、自治
统将作业分解到各个不同的物理节点去。    ,节点之内常常是集群计算


屏蔽异构:用中间件屏蔽异构系统,使     承认异构:承认节点在原理、规模、
                      能力上的差异性,依靠互操作来实现节
用户面向同一环境,实现资源共享
                      点之间的资源共享

                      完成持久性多样化服务 :中心提
完成一次性特定任务:要完成的任       供计算、存储等资源,用户利用云计算
务是预先设定的               按需聚合、柔性重组,获取持久、个性
                      化服务,

协作式运营:带宽保证、性能保障,      商业式运营:尽力而为的服务、按
结果确定                  租使用,按用付费,多租赁,即用即散



确定的交互:按规定要求和程序输入      人机交互、群体智能:大众参与
                      的计算,包括不确定性、软计算,相互
/输出,人不主动参与            沟通交流
    热点问题二:关于安全


   云计算本身安全不安全?

   云计算为改善安全能做出什么贡献?
   云计算不是专门为了解决安全问题的新式武器,

    它不能避免软件中出现漏洞,网络上出现病毒等

   云计算把安全作为服务的形式(SaaS),实现安

    全服务的专业化、社会化,改变当前人人都在打

    补丁、个个都在杀病毒的状况;也可以把备份作

    为服务的形式,实现专门的云备份服务。
热点问题三:“私有云”



   会不会有私有云?

   企业讲的私有云是什么?
五、云计算对信息产业的影响
影响一:信息产业面临重新洗牌

大量的中小企业软件开发商    工作平台:

面临着工作平台、工作对象、   面向单机    面向网络

工作方式的重组:
                工作对象:
在云计算的大潮中要么做大
                面向软件    面向服务
做强服务,成为“大款” ;
要么“傍大款”,依附发展;
                工作方式:
否则被淘汰。
                软件工程    需求工程
如同电力时代高压传输问题解决之后大
规模甚至超大规模核电厂的建立一样,信
息时代做大做强了的大规模甚至超大规模
的数据中心、存储中心、软件中心、计算
中心、媒体中心、娱乐中心、安全中心的
建立,势必成为未来云计算的基本要素。
 影响二:软件产业结构面临调整

 云计算使得信息服务的社会化成为
 可能,改变并精细化了大众需求,
                              各类应用软件
 催生新的市场和新的服务业;                  38%

 软件产业结构发生变化,基于内容                       内容服务软件
                      中间件                12%
 的信息服务业所占比重越来越大:       8%

 单机的系统软件和中间件所占比重         系统软件     嵌入式软件
                          20%       22%
 逐渐减小,软件依附于应用;
 嵌入式软件更加个性化、柔性化。

如:诗词消费群体,My MP3,个人匹配兴趣搜索引擎等
                       2008年我国软件产值构成分析
用户只为自己所得到的服务付费。基于内
容的服务(如音乐服务、视频服务、交通服
务、客户关系管理服务、安全服务等)在高
度综合、集中、专业化的同时,又高度分化、
碎片化、精细化。一方面,龙头服务企业凸
显;另一方面,又能够满足无穷无尽社区表
现出的长尾市场的多样化需求。
基于内容的服务高度精细化、碎片化
的案例

   舞剧服务中心
   歌剧服务中心
   京剧服务中心
   地方剧服务中心
   二人转服务中心
   赵本山文艺作品服务中心
影响三:软件开发的组织方式面临变革

 出现各种各样开源、开放的软件合作开发社区。

 淡化软件产品的生命周期,软件在线更新,贴近

 用户新需求,强调软件的演化。

 软件频繁地被重用和重组,在第一时间满足客户

 需求。
影响四:大众普遍参与形成群体智慧

 海量的草根用户在偏好依附发展,构成网络软件生态环境
 的基础。

             万维网上的知名服务吸引了
             大众普通参与开发,确保了
             服务质量,扩大了应用覆盖
             范围。



             各种各样的信息资源中心和
             P2P运用相得益彰。
影响五:网络端设备多元化个性化

网络环境下泛在的计算

 手机、游戏机、电视机、上网本、笔记本电脑的差别
 变小

 端产品 iX 更加简洁、多样,泛在计算成为趋势

对于端设备制造商而言:

 通过I/O接口连接网络的端设备必须具备灵活的功能,

 能方便地进行功能的柔性重组,解决广义的“最后一
 公里”问题。
云计算在中国:服务提振经济
Thanks
Email:
leedeyi@tsinghua.edu.cn

Homepage:
http://www.ldy.csai.tsinghua.edu.cn

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:2
posted:2/10/2012
language:
pages:134