WWW的核心一一HTTP协议

WWW的核心一一HTTP协议

1.3.4WWW的核心一一HTTP协议

WWW服务器使用的主要协议是HTTP协议,即超文体传输协议。由于HTTP协议支持的服务不限于WWW,还可以是其他服务,因而HTTP协议允许用户在统一的界面下,采用不同的协议访问不同的服务,FTP,DNS,SMTP,TELKIET等。另外,HTTP协议还可用于名字服务器和分布式对象管理。

l.HTTP协议简介

HTTP属于应用层的面向对象协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。

    HTTP协议的主要特点可概括如下:

支持客户/服务器模式。

简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET,HEAD,POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以

标记。

无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

2.HTTP协议的主要概念

连接(Connection):传输层的实际环流,建立在两个相互通讯的应用程序之间。·消息(Message):基本通讯单位,通过连接传输。

请求(Request):从客户端到服务器的请求信息,包括应用于资源的方法、资源的标识符和协议的版本号。

响应(Response):从服务器返回的信息包括HTTP协议的版本号、请求的状态(例如

"成功""没找到")和文档的MIME类型。

资源(Resource):URI标识的网络数据对象或服务。

实体(EMity):数据资源或来自服务资源的回映的特殊表示方法,它可能被包围在请求    或响应信息中。实体包括实体头信息和实体的本身内容。

客户(CKnt):为发送请求而建立连接的应用程序。

用户代理(Useragent):初始化请求的客户。它们可以是浏览器、编辑器或其他用户工具。

服务器(Server):接受连接并对请求返回信息的应用程序。

代理(Proxy):中间程序,它可以充当服务器,也可以充当客户,为其他客户建立请求。请求是通过可能的翻译在内部或经过传递到其他的服务器中。

网关(Gateway):作为其他服务器中间媒介的服务器。与代理不同的是,网关接受请求就好像对被请求的资源来说它就是源服务器;发出请求的客户机并没有意识到它在同网关打交道。

    网关经常作为通过防火墙的服务器端的门户,网关还可以作为协议翻译器以便存取那些存储在非HTTF系统中的资源。

1.3.5域名系统

域名通常指域名系统和统一资源定位器。32位二进制数的IP地址对计算机来说十分有效,但用户使用和记忆都很不方便。为此,Interrmt引进了字符形式的特殊地址,即域名。域名采用层次结构的基于""的命名方案,每一层子域名间用"."分隔,其格式为:

    机器名.机构名.领域名.最高域名

Internet域名由域名系统DNS(DomainNameSystem)统一管理。DNS是分布式数据库系统,由域名空间、域名服务器和地址转换请求程序三部分组成。有了DNS,凡域名空间中有定义的域名可以有效地转换为对应的IP地址,同样,IP地址也可通过DNS转换成域名。

WWW上的每一个网页(HomePage)都有一个独立的地址,这些地址称为统一资源定位器(URL),只要知道某网页的URL,便可直接打开该网页。

例如:InterIEt浏览器的URL输入框输入:http://www.cpta.com.Cn-按回车后即可进入国家人事考试中心的主页。

Internet,用户可以用各种各样的方式来命名自己的主机名。域名是通过申请合法得到的。

常用领域名包括:

COM:商业机构的  INT:国际组织

    EDU:教育机构 MIL:军事部门

    GOV:政府机构 NET:专门网络系统

ORG:社会组织、专业协会

最高域名(一般指国家和地区):CN指中国、HK指香港等。

:WWW.cpta.com.cn名字中WWW为主机名,由服务器管理员命名,cpta.com.cn为域名,由服务器管理员申请合法可以使用。cpta表示国家人事考试中心,COM表示商业机构,cn表示中国。www.cpta.com.cn就表示中国人事考试中心的WWW主机。

1.3.6主页与超文本标记语言

HTML(HyperTextMark-upLarlguage)即超文本标记语言,WWW的描述语言。设计HTML语言的目的是为了能把存放在不同电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其他电脑上。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体(Body)两大部分。头部描述浏览器所需的信息,主体包含所要说明的具体内容。

主页(Homepage)是一种利用超文本标记语言将能经过相应的浏览器表现出来的文字、图像、声音、动画等多种信息和组织方式。主页同报纸、杂志、电视、广播等相类似。主页的传播方式是将原代码与有关的图形文件、声音文件和超媒体信息放在WWW服务器供客户端访问。比如你想了解国家机构一一国家人事考试中心的情况,在浏览器URL输入的地方输入:

http://www.cpta.com.cn即可。

 

1.4国际互联网Internet

1.4.1 Internet的特点

灵活多样的入网方式是Internet获得高速发展的重要原因。任何计算机只要采用TCP/IP协议与Internet中的任何一个节点相连,就可以成为Internet的一部分。TCP/IP协议成功地解决了不同硬件平台、不同网络产品和不同操作系统之间的兼容性问题,它已经成为计算机通信方面事实上的国际标准。

Internet采用了目前在分布式网络中最为流行的客户一一服务运行方式,大大增加了网络信息服务的灵活性。用户可以通过自己计算机上的客户程序发出请求,与装有相应服务器程序的主机进行通信,从而获得所需要的信息。

Internet把网络技术、多媒体技术和超文本技术融为一体,体现了多种信息技术互相融合的发展趋势,真正发挥它们应有的作用。Internet为教学4科研、商业广告、远程医学诊断和气象预报等应用提供了新的手段。

    Internet服务的收费是很低的。低收费策略可以吸引更多的用户使用网络,从而形成良性循环。Internet的收费标准已完全被用户所接受。

具有极为丰富的、免费的信息资源,Internet已经成为服务于全世界各行各业的通用信息网络。绝大多数的Gopher服务器、WAIS服务器、Archie服务器和WWW服务器都是免费的,此外还有许多免费的FTP服务器和Telnet服务器。

    Internet具有丰富的信息搜索功能和友好的用户浏览界面。

因特网是一个建立在网络互联基础上的、开放的全球性网络。InterIIet拥有数千万台计算机和上亿个用户,是全球信息资源的超大型集合体。所有采用TCP/IP协议的计算机都可加入Internet,实现信息共享和相互通信。与传统的书籍、报刊、广播、电视等传播媒体相比,Internet使用方便,查阅更快捷,内容更丰富。

Internet采用了目前最流行的客户机/服务器工作模式,凡是使用TCP/IP协议,并能与Internet的任意主机进行通信的计算机,无论是何种类型,采用何种操作系统,均可看成是Internet的一部分。

严格地说,用户并不是将自己的计算机直接连接到Internet,而是连接到其中的某个网络上,再由该网络通过网络干线与其他网络相连。网络干线之间通过路由器互联,使得各个网络上的计算机都能相互进行数据和信息传输。例如:用户的计算机通过本地局域网络或拨号上网,连接到Internet服务提供者(ISP)的主机上。而ISP的主机通过高速干线与Internet相连,这样,用户仅通过一级ISP的主机,便可遍访Internet。由此也可以说,Internet是分布在全球  ISP通过高速通信干线连接而成的网络。

Internet的这种结构形式,使其具有如下的众多特点:

(l)灵活多样的入网方式。这是由于TCP/IP成功地解决了不同的硬件平台、网络产品、操作系统之间的兼容性问题。

    (2)采用了分布网络中最为流行的客户机/服务器模式,大大提高了网络信息服务的灵

活性。

(3)将网络技术、多媒体技术融为一体,体现了现代多种信息技术互相融合的发展趋势。(4)方便易行。任何地方仅需通过电话线、普通计算机即可接入Internet

(5)向用户提供极其丰富的信息资源,包括大量免费使用的资源。

(6)具有完善的服务功能和友好的用户界面9操作简便,无须用户掌握更多的专业计算机知识。

1.4.2信息服务与访问的工作原理

1.客户/服务器(C/S)工作原理

2.Internet联网服务方式

提供Interrlet服务的商家分为四类:

ISP(服务提供商)

IAP(接人服务商)

ICP(内容服务商),

ASP(应用提供商)

3.Internet接入方式

常见的Internet接入方式包括:MODEM拨号方式、ISDNADSLCABLEMODEMFTTB、局域网接入方式。

1.4.3Internet的主要应用

万维网(WorldWideWeb,WWW或刑73)也称为W,它是因特网上的主要应用形式之一。WWW通过超文本(HyperText)向用户提供全方位的多媒体信息,从而为Internet用户提供了获取信息、共享信息的全新途径。

    Internet专业管理机构是InerNIC,它是国际互联网的管理中心,它的主要工作就是分配IP地址、管理域名资源和统一资源定位符。

    1.万维网

    万维网(WorldWideWeb,简称WWW)Internet上集文本、声音、图像、视频等多

媒体信息于一身的全球信息资源网络,Internet上的重要组成部分。浏览器(Browser)是用户通向WWW的桥梁和获取WWW信息的窗口,通过浏览器,用户可以在浩瀚的Internet海洋中漫游,搜索和浏览自己感兴趣的所有信息。

WWW的网页文件是用超文件标记语言HTML编写,并在超文件传输协议HTTP支持下运行的。超文本中不仅含有文本信息,还包括图形、声音、图像、视频等多媒体信息(故超文本又称超媒体),更重要的是超文本中隐含着指向其他超文本的链接,这种链接称为超链接(HyperLinks)二利用超文本,用户能轻松地从一个网页链接到其他相关内容的网页上,而不必关心这些网页分散在何处的主机中。

WWW浏览器是一个客户端的程序,其主要功能是使用户获取Internet上的各种资源。常用的浏览器是MicrosoftInternetExplorer(IE)Navigator/COIIIII111iCatorSUN公司也开发了一个用Java编写的浏览器IfotJavaJava是一种新型的、独立于各种操作系统和平台的动态解释性语言,Java使浏览器具有了动态效果,为连机用户提供了实时交互功能。目前常用的浏览器均支持Java

2.电子邮件E-mail

E-mailInternet上使用最广泛的一种服务。用户只要能与InterIIet连接,具有能收发电子邮件的程序,就可以与Internet上所有E-mail用户方便、快速地交换电子邮件,也可以向多个用户发送同一封邮件,或将收到的邮件转发给其他用户。电子邮件中除文本外,还可包含声音、图像、应用程序等各类文件。此外,用户还可以邮件方式在网上订阅电子杂志、获取所需文件、参与有关的讨论组。

收发电子邮件必须有相应的软件支持。常用的收发电子邮件的软件有Exchange011tholt-Express,这些软件提供邮件的接收、编辑、发送及管理功能。邮件服务器使用的协议有简单邮件传输协议SMTP(SimpleMailTrmsferProtocol)、电子邮件扩充协议MIME(MultipurposeInternetMailExtensions)和邮局协议POP(PostOfficeProtocol)POP服务需由邮件服务器来提供,用户必须在该邮件服务器上取得账号才可能使用这种服务。目前使用得较普遍的POP协议为第三版,故又称为POP3协议。

3.Usenet

Usenet指各种专题讨论组。Usend用于发布公告、新闻、评论及各种文章供网上用户使用和讨论。讨论内容按不同的专题分类组织,每一类为一个专题组,称为新闻组,其内部还可以分出更多的子专题。

Usend的每个新闻都由一个区分类型的标记引导,每个新闻组围绕一个主题,comp.(计算机方面的内容),mws.(Usermt本身的新闻与信息),rec-(体育、艺术及娱乐活动),sci.(科学技术),SOCJ(社会问题),talke(讨论交流),misc.(其他话题),biz.{商业方面问题)等二用户除了可以选择参加感兴趣的专题小组外,也可以自己开设新的专题组。只要有人参加, 该专题组就可一直存在下去;若一段时间无人参加,则这个专题组便会被自动删除。

4.FTP文件传输

FTP文件传输服务允许Irlternet上的用户将某台计算机上的文件传输到另一台上,几乎所

有类型的文件,包括文本文件、二进制可执行文件飞声音文件、图像文件、数据压缩文件等,都可以用FTP传送前FTP是一套文件传输服务软件,它以文件传输为界面,使用简单的getput命令进行文件的下载或上传,如同在IIItemet上执行文件复制命令一样。大多数FTP服务器主机都采用Unix操作系统,但普通用户通过Windows也能方便地使用FTP

FTP最大的特点是用户可以使用Internet上众多的匿名FTP服务器。所谓匿名服务器,指的是不需要专门的用户名和口令就可进入的系统。用户连接匿名FTP服务器时,都可以用"anonymous(匿名)"作为用户名,以自己的E-mail地址作为口令登录。登录成功后,用户便可以从医名服务器上下载文件。匿名服务器的标准目录为pub,用户通常可以访问该目录下所

    有子目录中的文件。基于对安全问题的考虑,大多数匿名FTP服务器不允许用户上传文件。

5.远程登陆hind

TelnetInternet远程登陆服务的协议,该协议定义了远程登录用户与服务器交互的方式。

Telnet允许用户在一台联网的计算机上登录到远程分时系统中,然后像使用自己的计算机一样使用该远程系统。

要使用远程登录服务,必须在本地计算机上启动客户应用程序,指定远程计算机的名字,并通过Internet与之建立连接。一旦连接成功,本地计算机就可直接访问远程计算机系统的资源。远程登录软件允许用户直接与远程计算机交互<, SPAN lang=EN-US>,通过键盘或鼠标操作,客户应用程序将有关的信息发送给远程计算机,再由服务器将输出结果返回给用户。用户退出远程登录后,用户的键盘、显示控制权又回到本地计算机。一般用户可以通过WindowTelnet客户程序进行远程登录。

6.电子商务

电子商务是指利用计算机网络进行的商务活动,它将顾客、销售商、供货商和雇员联系在一起。统指商务活动的电子化、网络化、自动化。

7.Internet电信

通常指在Internet完成语音、传真、视频传输等多种电信业务。IP电话是最常用的Internet

电信'业务,它也称作Internet电话或网络电话。

IP电话的话音是利用基于IP(Internet/Intranet)数据网进行传输。话音(模拟信号)首先由数字信号处理器(DSP)将其转换为数字信号,然后,数字信号被压缩成更便于网络传输的数据包,之后,通过Interlet将数据包传送到目的地,在目的地以相反的过程解压缩、解包、数/模转换,送达对方话筒。由于Internet中采用"存储一转发"的方式传递数据包,并不独

占电路,并且对语音信号进行了大比例的压缩处理,因此,IP电话占用带宽仅为8~lOkb/s,还不到模拟电话所需带宽的1/8,再加上Internet上数据传输的计费方式与距离的远近无关,

自然大大节省了长途通信费用。

8.基于IP的视频业务

这类应用主要包括lPTVInternet视频会议。

基于数字视频通信会议电视已经发展了20多年,顺应三网(计算机网络、电信网、有线电视网)合一的趋势,已进入重要的转型阶段。转型之一就是,传输网络基础,由专线网络向IP网过渡;转型之二是,其所针对的服务对象将由中大型会议向小型的工作组会议室、个人工作桌面、家庭延伸。

IPTV具有三个特征:服务器/客户机模型、基于IP网络、采用多播技术。多播技术在每一个网段上只存在一个流,在网络节点上进行复制,提高了利用率,有效地减轻了骨干网的负担,平衡了企业网和Internet的带宽使用。使得骨干网能够承载音频和视频业务。

基于Internet的视频会议系统,在系统结构和实现功能上与IPTV比较接近,在视频会议中,多播技术也有很重要的意义。通过多播协议和实时传播协议,,可以降低网络的负担,同时提高服务的质量。基手IP网络的视频会议系统的优势还在于,它能充分利用Interrlet网络的优势:效率高、成本低、方便灵活。

9.智能信息平台智能信息平台是集各类信息的收集、传递、处理、加工、消费为一体的信息枢纽。它帮助用户方便、及时、准确、高效地获取信息。

智能信息平台可以分为三大部分:搜索引擎、数据挖掘、信息检索工具。

    搜索引擎能帮助用户准确、有效、及时地从互联网上得到所需信息。搜索引擎一般分为两种:通用搜索引擎和专用搜索引擎。通用搜索引擎一般由网页自动搜集模块、互联网网页分析索引模块、互联网网页检索查询模块构成,搜索结果具有网页质量(网页互相连接)和检素质量(网页链接信息)两种特征。专用搜索引擎专门针对某个专业信息领域,它能更准确地描述网页内容,并能利用用户对信息检索结果的使用情况的反馈来改进检索效果。

数据挖掘的功能是分析理解所搜集的信息,并将挖掘结果进行集中整理。在挖掘过程中,利用各种资源,对每个网页从各个层面上进行挖掘。在挖掘结果中,既有页面主题的关键词和所属领域等知识信息,又有网页的作者、URL.长度等一般性信息。

信息检索工具主要对于两种用户接口(计算机网络用户与无线网络用户)接受查询请求。针对用户的输入,分别对关键词查询、类自然语言查询、基于模板的查询进行分析,然后在页面数据库中查找,并进行相关度评价,最终对结果排序输出。

10.网络教育

    网络教育是以网络为传输媒介的远程教育。远程教育在网络诞生以前就存在,当时主要

的传输媒介是卫星电视网、电信通信网、有线电视网等。Internet诞生以后,才出现了以网络为传输媒介的远程教育,即网络教育。网络与其他几种媒介相比,更加适合于个性化学习

(浏览、检索、下载课件、文件传送和远程登录)、非实时交互式学习'(电子邮件、电子公告系统、文件传送和远程登录)、专题讨论或检索。网络最大的优势在于,给学习者提供了主动参与操作的机会和几乎无限的资源,使学习者能主动发现知识,探索知识,从而掌握知识。因此,网络给远程教育提供了一个很好的条件。

网络教育利用Interτlet实现远程的教育资源共享,是以计算机网络系统为基础的教学系统,实现一种随时随地、交互性强并且内容最新的教学方法。它不仅是传统教育的补充或简单扩展,而且是全新的教育模式,甚至是未来教育的主流模式。网络教育具备四个鲜明特征:

11.数字图书馆

    数字图书馆是针对传统图书馆的根本性变革。将传统的图书馆数字化,仅仅是数字图书馆研究的一部分。数字图书馆与传统的图书馆有着完全不同的运营方式,、它将所有有用的信息资源用数字的形式进行表示,其根本目标是,为数字形式表示的信息的收集、存储和组织提供一个快速有效的方式,从而使得人们可以通过网络来处理和检索这些信息,使每一个人在任何地方、任何时间都能获得有关的任何知识。数字图书馆拥有多种媒体且内容丰富的数字化信息资源,它可为提供方便、快捷的信息服务。