INTERNET网络信息资源检索
• 网络基础知识
• 几个重要搜索引擎的使用方法
• 网上免费学术资源
1 网络基础知识
• 随着计算机应用的深入,特别是家用计算机越来越普及,一方面希望众
多用户能共享信息资源,另一方面也希望各计算机之间能互相传递信息进行
通信。个人计算机的硬件和软件配置一般都比较低,其功能也有限,因此,
要求大型与巨型计算机的硬件和软件资源,以及它们所管理的信息资源应该
为众多的微型计算机所共享,以便充分利用这些资源。基于这些原因,促使
计算机向网络化发展,将分散的计算机连接成网,组成计算机网络。
• 计算机网络:是现代通信技术与计算机技术相结合的产物。所谓计算机
网络,就是把分布在不同地理区域的计算机与专门的外部设备用通信线路互
联成一个规模大、功能强的网络系统,从而使众多的计算机可以方便地互相
传递信息,共享硬件、软件、数据信息等资源。通俗来说,网络就是通过电
缆、电话线、或无线通讯等互联的计算机的集合。
• 网络的功能:通过网络,您可以和其他连到网络上的用户一起共享网络
资源,如磁盘上的文件及打印机、调制解调器等,也可以和他们互相交换数
据信息。
• 网络的分类:按计算机连网的区域大小,我们可以把网络分为局域网(LAN,
Local Area Network)和广域网(WAN,Wide Area Network)。局域网
(LAN)是指在一个较小地理范围内的各种计算机网络设备互联在一起的通
信网络,可以包含一个或多个子网,通常局限在几千米的范围之内。如在一
个房间、一座大楼,或是在一个校园内的网络就称为局域网,广域网(WAN)
连接地理范围较大,常常是一个国家或是一个洲。其目的是为了让分布较远
的各局域网互联。我们平常讲的Internet就是最大最典型的广域网。
• 什么是网络协议: 那么,网络上的计算机之间又是如何交换信息的呢?就象
我们说话用某种语言一样,在网络上的各台计算机之间也有一种语言,这就
是网络协议,不同的计算机之间必须使用相同的网络协议才能进行通信。当
然了,网络协议也有很多种,具体选择哪一种协议则要看情况而定。Internet
上的计算机使用的是TCP/IP协议。
• 什么是Internet: 到Internet海洋去冲浪,如今已成为一种时尚。每当我们拿
起一张报纸、一本杂志或者打开收音机、电视机的时候, 都可能听到一个词:
Internet 。 而每每谈到Internet,必然离不开WWW、环球网、 信息高速公路
之类的时髦词儿,人们不禁要问,Internet是什么? 从广义上讲,Internet是遍
布全球的联络各个计算机平台的总网络,是成千上万信息资源的总称;从本
质上讲,Internet是一个使世界上不同类型的计算机能交换各类数据的通信媒
介。从Internet提供的资源及对人类的作用这方面来理解,Internet是建立在
高灵活性的通信技术之上的一个已硕果累累,正迅猛发展的全球数字化数据
库。点击下面我们可以形象的看到什么是Internet.
• Internet是怎样诞生的
• 与很多人的想象相反,Internet并非某一完美计划的结果,Internet的创
始人也绝不会想到它能发展成目前的规模和影响。在Internet面世之初,没有
人能想到它会进入千家万户,也没有人能想到它的商业用途。
• 从某种意义上,Internet可以说是美苏冷战的产物。在美国,20世纪60
年代是一个很特殊的时代。60年代初,古巴核导弹危机发生,美国和原苏联
之间的冷战状态随之升温,核毁灭的威胁成了人们日常生活的话题。在美国
对古巴封锁的同时,越南战争爆发,许多第三世界国家发生政治危机。由于
美国联邦经费的刺激和公众恐惧心理的影响,"实验室冷战"也开始了。人们
认为,能否保持科学技术上的领先地位,将决定战争的胜负。而科学技术的
进步依赖于电脑领域的发展。到了60年代末,每一个主要的联邦基金研究中
心,包括纯商业性组织、大学,都有了由美国新兴电脑工业提供的最新技术
装备的电脑设备。电脑中心互联以共享数据的思想得到了迅速发展。
• 美国国防部认为,如果仅有一个集中的军事指挥中心,万一这个中心被
原苏联的核武器摧毁,全国的军事指挥将处于瘫痪状态,其后果将不堪设想,
因此有必要设计这样一个分散的指挥系统──它由一个个分散的指挥点组成,
当部分指挥点被摧毁后其它点仍能正常工作,而这些分散的点又能通过某种
形式的通讯网取得联系。1969年,美国国防部高级研究计划管理局( ARPA
- - Advanced Research Projects Agency )开始建立一个命名为ARPAnet的
网络, 把美国的几个军事及研究用电脑主机联接起来。当初,ARPAnet只联
结4台主机,从军事要求上是置于美国国防部高级机密的保护之下,从技术上
它还不具备向外推广的条件。
• 1983年,ARPA和美国国防部通信局研制成功了用于异构网络的TCP/IP
协议,美国加利福尼亚伯克莱分校把该协议作为其BSD UNIX的一部分,使
得该协议得以在社会上流行起来,从而诞生了真正的Internet。
• 1986年,美国国家科学基金会(National Science Foundation,NSF)
利用ARPAnet发展出来的TCP/IP 的通讯协议,在5 个科研教育服务超级电脑
中心的基础上建立了NSFnet广域网。由于美国国家科学基金会的鼓励和资助,
很多大学、政府资助的研究机构甚至私营的研究机构纷纷把自己的局域网并
入NSFnet中。那时,ARPAnet 的军用部分已脱离母网,建立自己的网络--
Milnet。ARPAnet --网络之父,逐步被NSFnet所替代。到1990年,
ARPAnet已退出了历史舞台。如今,NSFnet已成为Internet的重要骨干网之
一。
• 1989年,由CERN开发成功WWW,为Internet 实现广域超媒体信息截
取/检索奠定了基础。
• 到了90年代初期,Internet事实上已成为一个"网中网"──各个子网分别负
责自己的架设和运作费用,而这些子网又通过NSFnet互联起来。由于
NSFnet是由政府出资,因此,当时Internet最大的老板还是美国政府,只不
过在一定程度上加入了一些私人小老板。 Internet在80年代的扩张不单带来
量的改变,同时亦带来质的某些改变。由于多种学术团体、企业研究机构,
甚至个人用户的进入,Internet的使用者不再限于电脑专业人员。 新的使用者
发觉, 加入 Internet 除了可共享NSFnet的巨型机外,还能进行相互间的通讯,
而这种相互间的通讯对他们来讲更有吸引力。 于是, 他们逐步把Internet 当
作一种交流与通信的工具, 而不仅仅是共享NSFnet巨型机的运算能力。
• 在90年代以前,Internet的使用一直仅限于研究与学术领域。商业性机构
进入Internet一直受到这样或那样的法规或传统问题的困扰。事实上,象美国
国家科学基金会等曾经出资建造Internet的政府机构对Internet上的商业活动
并不感兴趣。
• 1991年,美国的三家公司分别经营着自己的CERFnet、PSInet及
Alternet 网络, 可以在一定程度上向客户提供Internet联网服务。他们组成了
"商用Internet协会"(CIEA),宣布用户可以把它们的Internet子网用于任何
的商业用途。Internet商业化服务提供商的出现,使工商企业终于可以堂堂正
正地进入Internet 。 商业机构一踏入Internet这一陌生的世界就发现了它在通
讯、资料检索、客户服务等方面的巨大潜力。于是,其势一发不可收拾。世
界各地无数的企业及个人纷纷涌入 Internet , 带来Internet发展史上一个新的
飞跃。
• Internet目前已经联系着超过160个国家和地区、4万多个子网、500多万
台电脑主机,直接的用户超过4000万,成为世界上信息资源最丰富的电脑公
共网络。Internet被认为是未来全球信息高速公路的雏形。
2几个重要搜索引擎的使用方法
• GOOGLE
• BAIDU
2.1 google
• Google(www.google.com)由两个斯坦福
大学博士生Larry Page与Sergey Brin于
1998年9月发明,Google Inc. 于1999年创
立。2000年7月份,Google替代Inktomi成
为Yahoo公司的搜索引擎,同年9月份,
Google成为中国网易公司的搜索引擎。98
年至今,GOOGLE已经获得30多项业界大
奖。
看看平时咱们都是怎么做的
• 找找关于杀毒软件卡巴斯基的信息
• “手气不错”是干嘛用的呢?
• 一点直达,看来的确手气不错呀!
刚才那个是基本搜索
• Google 查询简洁方便,仅需输入查询内容
并敲一下回车键 (Enter),或单击“Google
搜索”按钮即可得到相关资料。
• Google 查询严谨细致,能帮助您找到最重
要、最相关的内容。例如,当 Google 对网
页进行分析时,它也会考虑与该网页链接
的其它网页上的相关内容。Google 还会先
列出那些搜索关键词相距较近的网页。
自动使用“and”进行查询
• Google 只会返回那些符合您的全部查询条
件的网页。不需要在关键词之间加上“and”
或“+”。如果您想缩小搜索范围,只需输入
更多的关键词,只要在关键词中间留空格
就行了。
• 就这个问题大家可以想想论文写作中的抄
袭、剽窃以及活学活用之说
比较一下
• 易:203000条结果
• 吸:92600条结果
• 易并吸:16200条结果
忽略词
• Google 会忽略最常用的词和字符,这些词
和字符称为忽略词。Google 自动忽略
“http”, “.com”和“的”等字符以及数字
和单字,这类字词不仅无助于缩小查询范
围,而且会大大降低搜索速度。
• 使用英文双引号可将这些忽略词强加于搜
索项,例如:输入“柳堡的故事”时,加
上英文双引号会使“的”强加于搜索项中。
比较下
• “柳堡的故事”:19900条结果
• 柳堡的故事:341000条结果
简繁转换
• Google运用智能型汉字简繁自动转换系统,
为您找到更多相关信息。
• 这个系统不是简单的字符变换,而是简体
和繁体文本之间的“翻译”转换。例如简
体的“计算机”会对应于繁体的“”。当
您搜索所有中文网页时,Google会对搜索
项进行简繁转换后,同时检索简体和繁体
网页。并将搜索结果的标题和摘要转换成
和搜索项的同一文本,便您阅读。
词干法
• Google 现在使用“词干法”。也就是说,
在合适的情况下,Google会同时搜索关键
词和与关键词相近的字词。词干法对英文
搜索尤其有效。例如:搜索“dietary
needs”, Google会同时搜索“diet needs”和
其它该词的变种。用于搜索的您原来用词
的任何变化都将在搜索结果的简述文字中
标示出来。
• 最符合的靠前显示
• 相关的则在后边跟上
英文字母大小写是否有影响?
• Google 搜索不区分英文字母大小写。所有
的字母均当做小写处理。例如:搜索
“google”、“GOOGLE”或“GoOgLe”,
得到的结果都一样。
拼音汉字转换
• 例如:搜索“shang wu tong”, Google 能自动提示 “您是
不是要找:商务通”。如果您点击“商务通”, Google
将以“商务通”作为关键词进行搜索。对于拼音和中文混
和关键词, 系统也能做有效转换。对于拼音“lü”, “lüe”,
“nü” 或 “nüe”,您可输入 “lv”, “lve”, “nv” 或 “nve”。如
果拼音中没有空格,例如 “shangwutong”,Google 也会
做相应处理,但是在多个拼音中加空格能提高转换准确率
和速度。
• 由于汉语的多音字和方言众多,常用发音与实际发音常常
有出入,更不用说拼音输入中可能出现的错误了。Google
的拼音汉字转换系统能支持模糊拼音搜索,为用户提示最
符合的中文关键词,具有容错和改正的功能。例如:搜索
“wan luo xing wen”, Google 会提示 “您是不是要找:
万罗兴文 万络行文 网络新闻”, 其中 “网(wang)络新(xin)
闻” 是系统参考了可能会有的拼音错误后自动转换的。
高级搜索窍门
减除无关资料
• 如果要避免搜索某个词语,可以在这个词
前面加上一个减号(“-”, 英文字符)。但
在减号之前必须留一空格。
– 示例:搜索所有包含“易筋经”而不含“吸星大法”
的中文网页
搜索:“易筋经 -吸星大法”
– 注意: “-”号是英文字符,操作符与作用的关键字之间,
不能有空格。
英文短语搜索
• 在 Google 中,可以通过添加英文双引号来
搜索短语。双引号中的词语(比如"like
this")在查询到的文档中将作为一个整体出
现。这一方法在查找名言警句或专有名词
时显得格外有用。
• 一些字符可以作为短语连接符。Google 将
“-”、“\”、“.”、“=”和“..."等标点符号
识别为短语连接符。
指定网域
• 有一些词后面加上冒号对 Google 有特殊的
含义。其中有一个词是“site:”。要在某个
特定的域或站点中进行搜索,可以在
Google 搜索框中输入“site:xxxxx.com”。
Google 的特殊功能
查找 Flash 文件
• 查找Flash文件,只需搜索“关键词 filetype:swf”。
• Google已经可以支持13种非HTML文件的搜索。除了PDF
文档,Google现在还可以搜索Microsoft Office (doc, ppt,
xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其
它类型文档。新的文档类型只要与用户的搜索相关,就会
自动显示在搜索结果中。
• 例如,如果您只想查找 PDF或Flash 文件,而不要一般网
页,只需搜索“关键词 filetype:pdf” 或“关键词
filetype:swf”就可以了。
• Google同时也提供用户不同类型文件的“HTML版”,方
便用户在即使没有安装相应应用程序的情况下阅读各种类
型文件的内容。用“HTML版”阅读也能帮助用户防范某
些类型的文档中可能带来的病毒。
地图查寻
• 使用Google查寻城市地图或具体地址,您
只需要在捜索框直接键入城市名或地址后
加上“地图”即可,或直接输入具体地址。
• 下面是一些查寻示例:
• 北京地图
• 广州市越秀区流花路
• 示例
网页快照[很好用,有价值]
• Google 在访问网站时,会将看过的网页复制一份
网页快照,以备在找不到原来的网页时使用。单
击“网页快照”时,您将看到 Google 将该网页
编入索引时的页面。Google 依据这些快照来分析
网页是否符合您的需求。
• 在显示网页快照时,其顶部有一个标题,用来提
醒您这不是实际的网页。符合搜索条件的词语在
网页快照上突出显示,便于您快速查找所需的相
关资料。
• 尚未编入索引的网站没有“网页快照”,另外,
如果网站的所有者要求 Google 删除其快照,这
些网站也没有“网页快照”。
货币转换
• 要使用我们的内置货币转换器,只需在
Google 搜索框中键入您需要完成的货币转
换,并单击“回车”键或 Google Search
按钮即可。
• 下面是一些查寻示例:
• 3.5 USD =? GBP
• 10新加坡元等于多少印度卢比
• 8人民币换成泰国的货币
• 30 人民币每公升 =? 美元每加仑
计算器
• Google 为用户提供了一个内置计算器。只需要在搜索字
段中输入算式,按一下回车键或者搜索就可以了。这个计
算器可以用来做所有简单的计算,一些复杂的科学计算,
单位换算,以及提供各种物理常数。下面的例子可以展示
这个计算器的功能:
• 5+2*2
• 2^20
• sqrt(-4)
• 一磅=?克
• 光速乘以二秒等于多少公里
按链接搜索
• 有一些词后面加上冒号对 Google 具有特殊
的含义。其中的一个词是“link:”。查询 link:
显示所有指向该网址的网页。例如,
“link:www.google.com”将找出所有指向
Google 主页的网页。不能将 link: 搜索与普
通关键词搜索结合使用。
• INURL,INTITLE等
错别字改正
• Google 的错别字改正软件系统会对输入的关键词
进行自动扫描, 检查有没有错别字。如果发现用其
他字词搜索可能会有更好的结果,它能提供相应
提示来帮助纠正可能有的错别字。例如,搜索
“互连网”,Google 会自动提示 “您是不是要
找:互联网”。如果您点击 “互联网”,Google
将以“互联网”作为关键词进行搜索。
• 因为Google 的错别字改正软件系统是建立在互联
网上所能找到的所有词条之上,它能够提示常用
人名及地名的最常见的书写方式,这是一般的错
别字改正软件所不及的。
中英文字典
• Google 给中英文单词互译带来了极大的方
便。您只需输入一个关键词(“翻译”,“fy” 和
“FY” 任选其一)和要查的中 (英) 文单词,
Google会直接显示您要查的单词的英文
(或中文)翻译。
• 例如,要查找 apple (或 苹果)的中(英)
文翻译,只需在搜索字段中输入:
天气查询
• 用Google 查询中国城市地区的天气和天气
预报,只需输入一个关键词(“天气”,“tq”
或“TQ” 任选其一)和您要查询的城市地
区名称即可。Google返回的网站链接会带
给您最新的当地天气状况和天气预报。
• 例如,要查找上海地区的天气状况,可以
输入:
定义[很实用]
• 要查看字词或词组的定义,只需键入
“define”,接着键入一个空格,然后键入
您需要其定义的词。如果 Google 在网络上
找到了该字词或词组的定义,则会检索该
信息并在搜索结果的顶部显示它们。
• Google 大学搜索
• Google 桌面搜索
• Google 工具栏
• Google 网页目录
图片搜索
Google 是否支持通配符搜索?
• Google 不支持传统的通配符搜索,在传统方法中星号表
示字词的片断或扩展;不过,我们使用 stemming(词根
还原)技术。在适当情况下,Google 的搜索将不仅局限
于您的搜索字词,还会搜索与这些字词的部分或全部相似
的字词。如果您搜索 [ pet lemur dietary needs ],Google
还会搜索 [ pet lemur diet needs ] 以及您字词的其他相关
变体。这些字词的所有变体将会在与每个搜索结果一起显
示的文字摘要中突出显示。
另外,Google 认为通配符星号 (*) 代表一个完整的、唯一
的字词。例如,在 Google 上搜索 [ flower * pots ] 将返回
包含"flower filled pots","flower power pots"等词组的结
果。但是,相同的查询不会返回包含词组"flowering pots"
或"flowerful pots"的结果,因为这些结果只是单词"flower"
(花)的衍生词,不是完整的、单独的字词。
高级检索
GOOGLE 小结
• GOOGLE是个搜索引擎
• GOOGLE可以搜到很多东西
• GOOGLE不可能搜到你想要的所有东西
• GOOGLE搜到的东西不一定是对的
• 判断GOOGLE搜索到的结果是对还是错,
关键在于不断地学习
• 讲的这些其实还是最基本的,GOOGLE还
可以做更多(被称为黑客最喜欢的工具之
一,可想而知了)
演示
2.2 百度
演示
3 网上免费学术资源
• 网上免费全文学术资源的查找方法
• 学术机构网站资源
• 学术期刊网站资源