第三部分:互联网应用
5、万维网的信息检索系统
在万维网中用来进行搜索的的工具叫做搜索引擎。搜索引擎的种类很多,大体可以分为全文检索搜索引擎和分类目录搜索引擎。
全文检索搜索引擎是一种纯技术型的检索工具。它的工作原理是通过搜索软件(例如一种叫“蜘蛛(Spider)”或“网络机器人”程序)到互联网上的各个网站收集信息,找到一个网站后可以从这个网站再链接到另一个网站,像蜘蛛爬行一样,然后按照一定的规律建立一个很大的在线索引数据库供用户查询。用户查询信息时是从数据库里进行查询而不是实时地在互联网查询。
分类目录搜索引擎并不采集网站的任何信息,而是利用各网站向搜索引擎提交网站信息时填写的关键字和网站描述等信息,经过审核编辑后如果符合网站登录的条件,则输入到分类目录的数据库中。
- 垂直搜索引擎:
垂直搜索引擎针对某一特定领域、特定人群、或某一特定需求提供搜索服务。垂直搜索引擎也是提供关键字进行搜索的,但被放到了一个行业知识的上下文中。
- 元搜索引擎:
元搜索引擎把用户提交的检索请求发送到多个独立的搜索引擎上去搜索,并把搜索结果统一集中处理,以统一的格式提供给用户,因此是搜索引擎之上的搜索引擎。
- PageRank:
Google搜索引擎的核心技术是网页排名(PageRank)。PageRank对搜索结果按重要性排名,这是Google的两个创始人共同开发出来的。
传统搜索引擎往往是检查关键字在网页上出现的频率来确定某页面的重要性。而PageRank则把整个互联网当作一个整体对待,检查整个网络连接的结构,并确定哪些网页重要性最高。具体些就是如果有很多网站上的链接都指向页面A,则A就比较重要。
6、博客
万维网日志(weblog)简称为blog。本来网络日志是指个人撰写并在互联网发布的、属于网络共享的个人日记。但是现在它不仅可以是个人日记,而且可以有无数的形式和规则。
博客与个人网站有不少区别。最主要的区别是建立个人网站成本较高,需要租用个人空间和域名,同时需要懂得相关技术。但是写博客门槛较低。
7、社交网站SNS
社交网站(Social Network Site)是近年来发展非常迅速的一种网站。其作用是为一群拥有相同兴趣与活动的人创建在线社区。
社交网站的功能非常丰富,如电子邮件、即时通讯、博客撰写、共享相册、上传视频、网络游戏、社团、广告等。
(END)