zhouqijie

第一部分:万维网概述



1、概述

万维网(World Wide Web)简称Web。万维网能用链接的方法能非常方便地从互联网上的一个站点访问另一个站点(即链接到另一个站点),从而主动地按需获取丰富的信息。万维网是一个分布式的超媒体(hypermedia)系统,它是超文本(hypertext)系统的扩充。

万维网以客户端服务器方式工作。浏览器(Browser)就是在用户主机上的万维网客户端程序。万维网文档所驻留的主机则运行服务器程序,因此这台主机也称为万维网服务器。
客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所需的万维网文档。在一个客户程序主窗口上显示出的万维网文档称为页面(Page)

怎样标识分布在互联网上的万维网文档? –统一资源定位符(Uniform Resource Locator, URL)
用什么样的协议来实现万维网上各种链接? –超文本传输协议(Hypertext Transfer Protocol)
怎样使不同创作者创作的不同风格的万维网文档? –超文本标记语言(Hypertext Markup Language, HTML)
怎样使用户能够很方便地找到所需信息? –搜索工具



2、统一资源标识符URL

URL格式

统一资源标识符URL是用来表示从互联网上得到的资源位置和访问这些资源的方法。URL给资源的位置提供一种抽象的识别方法,并用这种方法给资源定位。只要能对资源定位,系统就可以对资源进行各种操作,如存取、更新、替换、查找其属性。

由此可见,URL实际就是在互联网上的资源的地址。只有知道了这个资源在互联网上什么地方,才能对它进行操作。显然,互联网上所有资源,都有唯一确定的URL。

“资源”是指在互联网上可以被访问的任何对象,包括文件目录、文件、文档、图像、声音等,以及与互联网相连的任何形式的数据。“资源”还包括电子邮件的地址和USENET新闻组,或USENET新闻组中的报文。

URL相当于一个文件名在网络范围的扩展。因此,URL是与互联网相连的机器上的任何可访问对象的一个指针。由于访问不同对象所使用协议不同,所以URL还指出读取某个对象所使用协议。

URL的一般格式由4部分组成:
<协议>://<主机>:><端口>/<路径>

使用HTTP的URL

对于万维网的网点的访问要使用HTTP协议。http://<主机>:<端口>/<路径>

HTTP的默认端口号是80,通常可省略。若再省略文件的<路径>项,则URL就指到互联网上的某个主页(Home Page)

URL的<协议>和<主机部分>,字母不分大小写。但是<路径>有时要区分大小写。

URL不仅能够访问WWW页面,而且还能够通过URL使用其他的互联网程序,用户使用这些应用程序时,只使用一个程序-浏览器,这显然是非常方便的。



(END)