Unstructured Data Management System

Document Sample
Unstructured Data Management System Powered By Docstoc
					对科研工作的一些思考

     王建民
  清华大学软件学院
   2010年7月
提   纲

1. 科研内涵
2. 计算学科
3. 科研成果
4. 关键环节
5. 其它话题
              科学、技术与工程
• 科学       Science             --发现
 (the study of) knowledge which depends on testing facts
 and stating general natural laws

• 技术       Technology          --发明
 the branch of knowledge dealing with scientific and
 industrial methods and their practical use in industry

• 工程       Engineering         --实现
 the creative application of scientific principles to design
 or develop structures, machines, apparatus, or
 manufacturing processes, or works utilizing them singly
 or in combination
                  科学研究
• 科学     Science
 (the study of) knowledge which depends on
 testing facts and stating general natural laws
• 研究     Research
 (an) advanced and detailed study of a subject,
 so as to learn new facts


• 狭义与广义?
• 我国科研体制?
  NSFC/MOST/MIIT/NDRC/MOE/…
            科研工作者
•   知识   KNOWLEDGE
•   技巧   SKILL
•   能力   CAPACITY
•   素养   CULTURE

区别与联系?
智商与情商?
提   纲

1. 科研内涵
2. 计算学科
3. 科研成果
4. 关键环节
5. 其它话题
             发展历史
• ……
• 1936年,Turing论文“论可计算数及其在判定
  问题中的应用”发表
• 1945年,ENIAC计算机诞生
• 1962年,Stanford/Purdue建立计算机科学系
  (Department of Computer Science)
• ……

什么是学科?Discipline?
“学科”就是学校的“营房”
专业沿革
专业设置
                                       问题空间
Organizational Issues &
  Information Systems


            Application
          Technologies


     Software Methods
     and Technologies


              Systems
         Infrastructure



Computer Hardware and
          Architecture


                                                      DEVELOPMENT
                          Theory                                                     Application
                          Principles                                                Deployment
                          Innovation                                               Configuration
                                       More Theoretical             More Applied

  CE/CS/IS/IT/SE

     基本问题:什么是可计算的?What is computable?
提   纲

1. 科研内涵
2. 计算学科
3. 科研成果
4. 关键环节
5. 其它话题
     典型形态(以数据库为例)
• 语言(Languages)
  SQL,E-R Modeling Language(Concrete
  Syntax and Abstract Syntax),
• 算法(Algorithms)
  external sort-merge algorithm,
• 理论(Theories)
  Functional-Dependency Theory,
• 模型(Models)
  Relational Models,
      典型形态(以数据库为例)
• 方法(Approaches)
  universal-relation approach to relational
  database design
• 架构(Architectures)
  Database Server Architecture,
• 框架(Frameworks)
  Object-Relation Mapping Framework
• 平台(Platforms),Database platforms
• 系统(Systems),XML-native Systems
• ……
         成果评价
• 影响力(学术界与产业界)
• 论文量化评价
  数量评价  论文数量
  质量评价  SCI、EI、ACM收录篇数,
        期刊影响因子,他引数量
  综合评价  H-Index

如何评价?
   社会认可、同行认可、同事认可、个人认可
深与浅?宽与窄?
            成果评价
• 会议最佳论文、期刊最佳论文、……
• 国家三大奖
  自然科学奖、科技进步奖、技术发明奖
• 国家最高科学技术奖
• ACM Fellow, IEEE Fellow, ……
• Academicians of ……
• Turing Award, ……

中国学者的三顶帽子?杰青、长江、院士
海外学者的千人计划,A类、B类?
提   纲

1. 科研内涵
2. 计算学科
3. 科研成果
4. 关键环节
5. 其它话题
 科研本质是问题驱动、实践驱动
1991年图灵奖得主英国爱丁堡大学Robin
Milner教授,
在接受获奖采访时, 表达了这样一个观点,即
计算机科学既是理论性很强的学科,又是与应
用和实践密切联系着的学科。因此,任何希望
在这一领域取得成果的年轻人,必须十分重视
把理论与实践结合起来。他送给年轻人这样一
个忠告:“Don’t Lose the link”。
             七个环节
1. 选择领域,选择方向,……
2. 提出问题,选择问题,……
3. 分析问题,寻找切入点, ……
4. 深入调研,独立思考,……
5. 解决问题,大胆创新……
6. 试验与实验,……
7. 发布传播,……
环节1. 选择领域,选择方向,……
“入错行、嫁错郎”。
“有用”与“有趣”, 谁重要?“有用”即国
 家和社会所急需,国家主战场;“有趣”即
 符合自己的兴趣。
 举例,当前我们国家“核高基”专项基础软
 件方向、互联网搜索引擎--“Google退出中
 国”事件、可信软件与信息系统安全等。


机遇与准备?
环节2. 提出问题,选择问题,……
“提出问题比解决问题更重要”,Search的开始。
问题在哪里?问题源于实践,来源于应用。
问题的真与伪?去伪存真。比如:在关系数据
 库中存储大对象,Clob/Blog,实际证明,至
 少是目前的实际证明,没有必要将所有大对
 象都存储到关系数据库中;另外,面向对象
 数据库,企图用面向对象模型取代关系模型。
问题的新与老?大与小?易与难?
什么样的问题合适?
环节3. 分析问题,寻找切入点, ……
分析问题,深入理解问题本质,独立思考解决
 问题的切入点。不要急于寻找答案,先要独
 立思考。(高庆狮院士的观点)
“想进去”与“跳出来”?“想进去”主要是
 问题的特殊性,看问题自身的特点;“跳出
 来”就是看问题的一般性,看问题之间的联
 系。通过“想进去”和“跳出来”形成自己
 对问题切入点的独立思考。
环节4. 深入调研,独立思考,……
深入调研,在独立思考的基础上查找文献,检
 验自己的想法,这是Re-search的核心环节。


调研问题的过去与现在,调研问题研究工作发
 展脉络。经典论文不可忽视。


“找软肋”,“找弱点” 。Search这个阶段需要
 批判型思维。不唯洋、不唯师、只唯实。吾
 爱吾师,吾更爱真理。
环节5. 解决问题,大胆创新……
解决问题,通过理论、抽象和设计等形式进行
 创新研究。
提出新理论、新算法、新模型、新方法等。新
 理论,给出概念及其关系;抽象,设计建模
 语言,建立相应模型;设计,给出针对需求
 的方案,论证方案的合理性。


计算学科理论滞后性?
环节6. 试验与实验,……
试验验证,最好是实际验证。
将理论应用于某一领域或具体问题得到合理的
 解释;根据建立的模型进行分析仿真,验证
 模型的符合性;根据设计开发原型系统,验
 证设计的有效性。
忠于试验与实验;反思试验与实验。


Google Map/Reduce方法的局限?
Google BIGTable的争论?
环节7. 发布传播,……
Publish or Perish。
“录用与发表”是谁的责任。四大计算模型:
 递归函数、λ可计算函数、图灵机和Post系统。
要练好“笔杆子”。
“既会讲大道理与也会讲小道理”。
有效利用网络。


如何进行学术营销?树立自己的科研品牌
            图灵奖获得者的思考
 数据库领域的三位图灵奖
 Bachman
 E. F. Codd
 Jim Gray


推荐《ACM图灵奖》
提   纲

1. 科研内涵
2. 计算学科
3. 科研成果
4. 关键环节
5. 其它话题
     充分利用科研资源
• 学者资源
   该方向领军学者与团队交往。
• 文献资源
   网络文献资源平台
• 开源资源
   不要重新发明轮子
        态度与境界
知之者,不如好之者;好之者,不如乐之者
科学是实事求是的学问,来不得半点虚假
科研是目的,还是手段?
新语丝启示:今天科研是一种谋生的手段,出色的科
 研成果会使人名利双收,但万不可追名逐利。

王国维治学三境界:今之成大事业、大学问者,罔不
 经过三种之境界:“昨夜西风凋碧树。独上高楼,望
 尽天涯路。”此第一境界也。“衣带渐宽终不悔,为
 伊消得人憔悴。”(欧阳永叔)此第二境界也。“众
 里寻他千百度,回头蓦见那人正在灯火阑珊处。”此
 第三境也。
         几个关系
• 工程开发与理论研究的关系?

• 学习借鉴与独立思考的关系?

• 个人奋斗与团队合作的关系?

• 大成果与小成果的关系?
   成为杰出科研工作者的条件
• 志趣品格?
  淡泊明志、宁静致远;板凳要坐十年冷
• 科研素质?
  数学的基础作用, 《我是一个数学家》,
  美国政府的STEM,STEM+C
• 科研平台?
  领军人物、团队文化、项目机遇,……

还有哪些?哪个更重要?
       科研之道


 道常无为而无不为,天道酬勤—老子

科学上没有平坦的大道可走,只有不畏劳苦
 沿着陡峭山路勇敢攀登的人,才有希望到
     达光辉的顶点—马克思
谢谢!

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:6
posted:5/11/2012
language:
pages:33