浅谈sql数据库论文

　　ORACLE中SQL查询优化研究

　　摘要数据库性能问题一直是决策者及技术人员共同关注的焦点，影响数据库性能的一个重要因素就是SQL查询语句的低效率。论文首先分析了导致SQL查询语句性能低下的四个常见原因以及SQL调优的一般步骤，然后分别针对如何降低I/O操作、在查询语句中如何避免对查询结果的高成本操作以及在多表连接时如何提高查询效率进行了分析。
　　关键词 ORACLE；SQL；优化；连接

　　1 引言
　　随着网络应用不断发展，系统性能已越来越引起决策者的重视。影响系统性能的因素很多，低效的SQL语句就是其中一个不可忽视的重要原因。论文首先分析导致SQL性能低下的常见原因，然后分析SQL调优应遵循的一般步骤，最后从如何降低I/O、避免对查询结果的高成本操作和多表连接中如何提高SQL性能进行了研究。鉴于目前ORACLE在数据库市场上的主导地位，论文将只针对ORACLE进行讨论。
　　2 影响SQL性能的原因
　　影响SQL性能的因素很多，如初始化参数设置不合理、导入了不准确的系统及模式统计数据从而影响优化程序(CBO)的正确判断等，这些往往和DBA密切相关。纯粹从SQL语句出发，笔者认为影响SQL性能不外乎以下四个重要原因：
　　(1)在大记录集上进行高成本操作，如使用了引起排序的谓词等。
　　(2)过多的I/O操作(含物理I/O与逻辑I/O)，最典型的就是未建立恰当的索引，导致对查询表进行全表扫描。
　　(3)处理了太多的无用记录，如在多表连接时过滤条件位置不当导致中间结果集包含了太多的无用记录。
　　(4)未充分利用数据库提供的功能，如查询的并行化处理等。
　　第(4)个原因处理起来相对简单。论文将针对前三个原因论述如何提高SQL查询语句的性能。
　　3 SQL优化的一般步骤
　　SQL优化一般需经过发现问题、分析问题、提出解决措施、应用措施、测试性能几个步骤，如图1所示。“发现问题就是解决问题的一半”，因此在SQL调优过程中，定位问题SQL是非常重要的一步，一般可借助于ORACLE自带的性能优化工具如STATSPACK、TKPROF、AUTOTRACE等辅助用户进行，同时还应该重视动态性能视图如V$SQL、V$MYSTAT、V$SYSSTAT等的研究。

　　图1 SQL优化的一般步骤
　　4 SQL语句的优化
　　4.1 优化排序操作
　　排序的成本十分高昂，当在查询语句中使用了引起结果集排序的谓词时，SQL性能必然受到影响。
　　4.1.1 排序过程分析
　　当待排序数据集不是太大时，服务器在内存(排序区)完成排序操作，如果排序需要更多的内存空间，服务器将进行如下处理：
　　(1) 将数据分成多个小的集合，对每一集合进行排序。
　　(2) 服务器向磁盘申请临时空间，将排好序的中间结果写入临时段，再对另外的集合进行排序。
　　(3) 在所有的集合均排好序后，服务器再将它们进行合并得到最终的结果，如果排序区尺寸太小，合并无法一次完成时，将分多次进行。
　　从上述分析可知，排序是一种十分昂贵的操作，它消耗大量的CPU时间和内存，触发磁盘分页和交换操作，因此只要有可能，我们就应该在SQL语句中尽量避免排序操作。
　　4.1.2 SQL中引起排序的操作
　　SQL查询语句中引起排序的操作大致有：ORDER BY 和GROUP BY 从句；DISTINCT修饰符；UNION、INTERSECT、MINUS集合操作符；多表连接时的排序合并连接(SORT MERGE JOIN)等。
　　4.1.3 如何避免排序
　　1)建立恰当的索引
　　对经常进行排序和连接操作的字段建立索引。在建立索引后，当服务器向这些字段发出排序请求时，将直接引用索引而不进行排序操作；当进行等值连接查询操作时，若建立连接的字段未建立索引，服务器进行的是排序合并连接(SORT MERGE JOIN)，连接操作的过程如下：
　　对进行连接的两个或多个表分别进行全扫描；
　　对每一个表中的行集分别进行全排序；
　　合并排序结果。
　　如果建立连接的字段已建立索引，服务器进行嵌套循环连接(NESTED LOOP JOINS)，该连接方式不需要任何排序，其过程如下：
　　对驱动表进行全表扫描；
　　对返回的每一行利用连接字段值实施索引惟一扫描；
　　利用从索引扫描中返回的ROWID值在从表中定位记录；
　　合并主、从表中的匹配记录。
　　因此，建立索引可避免多数排序操作。
　　2)用UNIION ALL替换UNION
　　UNION在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。大部分应用中是不会产生重复记录的，最常见的是过程表与历史表UNION 。因此，采用UNION ALL操作符替代UNION，因为UNION ALL操作只是简单的将两个结果合并后就返回。
　　4.2 优化I/O
　　过多的I/O操作会占用CPU时间、消耗大量内存和占用过多的栓锁，因此有必要对SQL的I/O进行优化。优化I/O的最有效方式就是用索引扫描代替全表扫描。
　　4.2.1 应用基于函数的索引
　　基于函数的索引(FUNCTION BASED INDEX，简记为FBI)提供了索引计算列并在查询中使用这些索引的能力。FBI的实质是对查询所需中间结果进行预处理。如果一个FBI与查询语句中的内嵌函数完全匹配，CBO在生成查询计划时，将自动启用索引范围扫描(INDEX RANGE SCAN)替换全表扫描(FULL TABLE SCAN)。考察下面的代码段并用AUTOTRACE观察创建FBI前后执行计划的变化。
　　select * from emp where upper(ename)=’SCOTT’
　　创建FBI前，很明显是全表扫描。
　　Execution Plan
　　……
　　1 0 TABLE ACCESS (FULL) OF 'EMPLOYEES' (Cost=2 Card=1 Bytes=22)
　　idle>CREATE INDEX EMP_UPPER_FIRST_NAME ON EMPLOYEES(UPPER(FIRST_NAME))；
　　索引已创建。
　　再次运行相同查询，
　　Execution Plan
　　……
　　1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMPLOYEES' (Cost=1 Card=1 Bytes=22)
　　2 1 INDEX (RANGE SCAN) OF 'EMP_UPPER_FIRST_NAME' (NON-UNIQUE) (Cost=1 Card=1)
　　这一简单的例子充分说明了FBI在SQL查询优化中的作用。FBI所用的函数可以是用户自己创建的函数，该函数越复杂，基于该函数创建FBI对SQL查询性能的优化作用越明显。
　　4.2.2 应用物化视图和查询重写
　　物化视图是一个预计算结果集，其中通常包含聚集与多表连接等复杂操作。数据库自动维护物化视图，且随用户的要求进行刷新。查询重写机制就是用数据库中的替代对象(如物化视图)将用户提交的查询重写为完全不同但功能等价的查询。查询重写对用户透明，用户完全按常规编写访问数据库的查询语句，优化程序(CBO)自动决定是否对用户提交的查询进行重写。查询重写是提高查询性能的一种非常有效的方法，尤其是在数据仓库环境中针对汇总、多表连接以及其它高成本的操作方面。
　　下面以一个非常简单的例子来演示物化视图和查询重写在优化SQL查询性能方面的作用。
　　select dept.deptno，dept.dname，count(*)
　　from emp，dept
　　where emp.deptno=dept.deptno
　　group by dept.deptno，dept.dname
　　查询计划及主要统计数据如下：
　　执行计划：
　　-----------------------------------------
　　……
　　2 1 HASH JOIN (Cost=5 Card=14 Bytes=224)
　　3 2 TABLE ACCESS (FULL) OF 'DEPT' (Cost=2 Card=4 Bytes=52)
　　4 2 TABLE ACCESS (FULL) OF 'EMP' (Cost=2 Card=14 Bytes=42)
　　主要统计数据：
　　-----------------------------------------
　　305 recursive calls
　　46 consistent gets
　　创建物化视图EMP_DEPT：
　　create materialized view emp_dept build immediate
　　refresh on demand
　　enable query rewrite
　　as
　　select dept.deptno，dept.dname，count(*)
　　from emp，dept
　　where emp.deptno=dept.deptno
　　group by dept.deptno，dept.dname
　　/
　　再次执行查询，执行计划及主要统计数据如下：
　　执行计划：
　　-------------------------------------
　　……
　　1 0 TABLE ACCESS (FULL) OF 'EMP_DEPT' (Cost=2 Card=327 Bytes=11445)
　　主要统计数据：
　　------------------------------------
　　79 recursive calls
　　28 consistent gets
　　可见，在建立物化视图之前，首先执行两个表的全表扫描，然后进行HASH连接，再进行分组排序和选择操作；而建立物化视图后，CBO自动将上述复杂操作转换为对物化视图EMP_DEPT的全扫描，相关的统计数据也有了很大的改善，递归调用(RECURSIVE CALLS)由305降到79，逻辑I/O(CONSISTENT GETS)由46降为28。
　　4.2.3 将频繁访问的小表读入CACHE
　　逻辑I/O总是快于物理I/O。如果数据库中存在被应用程序频繁访问的小表，可将这些表强行读入KEEP池，从而避免物理I/O的发生。
　　4.3 多表连接优化
　　最能体现查询复杂性的就是多表连接，多表连接操作往往要耗费大量的CPU时间和内存，因此多表连接查询性能优化往往是SQL优化的重点与难点。
　　4.3.1 消除外部连接
　　通过消除外部连接，不仅使得到的查询更易于读取，而且性能也经常可以得到改善。一般的思路是，有以下形式的查询：
　　SELECT …，OUTER_JOINED_TABLE.COLUMN
　　FROM SOME_TABLE，OUTER_JOINED_TO_TABLE
　　WHERE …=OUTER_JOINED_TO_TABLE(+)
　　可转换为如下形式的查询：
　　SELECT …，(SELECT COLUMN FROM OUTER_ JOINED_TO_TABLE WHERE …)FROM SOME_TABLE；
　　4.3.2 谓词前推，优化中间结果
　　多表连接的性能低下多数是因为连接操作与过滤操作的次序不合理，大多数用户在编写多表连接查询时，总是先进行连接操作再应用过滤条件，这导致服务器做了太多的无用功。针对这类问题，其优化思路就是尽可能将过滤谓词前推，使不符合条件的记录提前被筛选掉，只对符合条件的少数记录进行连接处理，这样可成倍的提高SQL查询效能。

　　标准连接查询如下：
　　Select a.prod_name，sum(b.sale_quant)，
　　sum(c.sale_quant)，sum(d.sale_quant)
　　From product a，tele_sale b，online_sale c，store_sale d
　　Where a.prod_id=b.prod_id and a.prod_id=c.prod_id
　　and a.prod_id=d.prod_id And a.order_date>sysdate-90
　　Group by a.prod_id；
　　启用内嵌视图，且将条件a.order_date>sysdate-90前移，优化后代码如下：
　　Select a.prod_name，b.tele_sale_sum，c.online_sale_sum，d.store_sale_sum From product a，
　　(select sum(sal_quant) tele_sale_sum from product，tele_sale
　　Where product.order_date>sysdate-90 and product.prod_id =tele_sale.prod_id) b，
　　(select sum(sal_quant) online_sale_sum
　　from product，tele_sale
　　Where product.order_date>sysdate-90 and product.prod_id =online_sale.prod_id) c，
　　(select sum(sal_quant) store_sale_sum
　　from product，store_sale
　　Where product.order_date>sysdate-90 and product.prod_id =store_sale.prod_id) d，
　　Where a.prod_id=b.prod_id and
　　a.prod_id=c.prod_id and a.prod_id=d.prod_id；
　　5 结束语
　　SQL语言在数据库应用中占有非常重要的地位，其性能的优劣直接影响着整个信息系统的可用性。论文从影响SQL性能的最主要的三个方面入手，分析了如何优化SQL查询的I/O、避免高成本的排序操作和优化多表连接。需要强调的一点是，理解SQL语句所解决的问题比SQL调优本身更重要，因此SQL调优需要系统分析人员、开发人员和数据库管理员密切协作。
　　参考文献
　　[1]Thomas Kyte.Effective Oracle by Design：Design and Build High-performance Oracle Application[M]，The McGral- Hill Companies，Inc，2003
　　[2]Kevin Loney，George Koch，Oracle 9i：The Complete Reference[M]，The McGral-Hill Companies，Inc，2002
　　[3] Oracle9i SQL Reference release 2(9.2)[OL/M]，2002.10. http：//
　　[4] Oracle9i Data Warehousing Guide release 2(9.2) [OL/M]，2002.03. http：//
　　[5]Alexey Danchenkov，Donald Burleson，Oracle Tuning：The Definitive Reference[OL/M]，Rampant Techpress，2006.
　　[6] Oracle9i Database Concepts release 2(9.2) [OL/M]，2002.08. http：//
　　[7] Oracle9i supplied plsql packages and types reference release 2(9.2) [OL/M]，2002.12. http：// technology/

sql数据库认识

SQL是Structured Quevy Language(结构化查询语言)的缩写。SQL是专为数据库而建立的操作命令集，是一种功能齐全的数据库语言。在使用它时，只需要发出“做什么”的命令，“怎么做”是不用使用者考虑的。SQL功能强大、简单易学、使用方便，已经成为了数据库操作的基础，并且现在几乎所有的数据库均支持SQL。 
##1 二、SQL数据库数据体系结构 
SQL数据库的数据体系结构基本上是三级结构，但使用术语与传统关系模型术语不同。在SQL中，关系模式(模式)称为“基本表”(base table)；存储模式(内模式)称为“存储文件”(stored file)；子模式(外模式)称为“视图”(view)；元组称为“行”(row)；属性称为“列”(column)。名称对称如^00100009a^： 
##1 三、SQL语言的组成 
在正式学习SQL语言之前，首先让我们对SQL语言有一个基本认识，介绍一下SQL语言的组成： 
1.一个SQL数据库是表(Table)的集合，它由一个或多个SQL模式定义。 
2.一个SQL表由行集构成，一行是列的序列(集合)，每列与行对应一个数据项。 
3.一个表或者是一个基本表或者是一个视图。基本表是实际存储在数据库的表，而视图是由若干基本表或其他视图构成的表的定义。 
4.一个基本表可以跨一个或多个存储文件，一个存储文件也可存放一个或多个基本表。每个存储文件与外部存储上一个物理文件对应。 
5.用户可以用SQL语句对视图和基本表进行查询等操作。在用户角度来看，视图和基本表是一样的，没有区别，都是关系(表格)。 
6.SQL用户可以是应用程序，也可以是终端用户。SQL语句可嵌入在宿主语言的程序中使用，宿主语言有FORTRAN，COBOL，PASCAL，PL/I，C和Ada语言等。SQL用户也能作为独立的用户接口，供交互环境下的终端用户使用。 
##1 四、对数据库进行操作 
SQL包括了所有对数据库的操作，主要是由4个部分组成： 
1.数据定义：这一部分又称为“SQL DDL”，定义数据库的逻辑结构，包括定义数据库、基本表、视图和索引4部分。 
2.数据操纵：这一部分又称为“SQL DML”，其中包括数据查询和数据更新两大类操作，其中数据更新又包括插入、删除和更新三种操作。 
3.数据控制：对用户访问数据的控制有基本表和视图的授权、完整性规则的描述，事务控制语句等。 
4.嵌入式SQL语言的使用规定：规定SQL语句在宿主语言的程序中使用的规则。 
下面我们将分别介绍： 
##2 (一)数据定义 
SQL数据定义功能包括定义数据库、基本表、索引和视图。 
首先，让我们了解一下SQL所提供的基本数据类型：(如^00100009b^) 
1.数据库的建立与删除 
(1)建立数据库：数据库是一个包括了多个基本表的数据集，其语句格式为： 
CREATE DATABASE <数据库名> 〔其它参数〕 
其中，<数据库名>在系统中必须是唯一的，不能重复，不然将导致数据存取失误。〔其它参数〕因具体数据库实现系统不同而异。 
例：要建立项目管理数据库(xmmanage)，其语句应为： 
CREATE DATABASE xmmanage 
(2) 数据库的删除：将数据库及其全部内容从系统中删除。 
其语句格式为：DROP DATABASE <数据库名> 
例：删除项目管理数据库(xmmanage)，其语句应为： 
DROP DATABASE xmmanage 
2.基本表的定义及变更 
本身独立存在的表称为基本表，在SQL语言中一个关系唯一对应一个基本表。基本表的定义指建立基本关系模式，而变更则是指对数据库中已存在的基本表进行删除与修改。 
……

SQL数据库的应用领域、现状、发展前景

SQL数据库是具有数据操纵和数据定义等多种功能的数据库语言，这种语言具有交互性特点，能为用户提供极大的便利，数据库管理系统应充分利用SQL语言提高计算机应用系统的工作质量与效率。

一、SQL数据库的应用领域

1、多媒体数据库

这种数据库主要存储与多媒体有关的数据，如语音、图像和视频数据。多媒体数据最大的特点是数据连续、数据量大、存储空间大。

2、移动数据库

这种数据库是在笔记本电脑、掌上电脑等移动计算机系统上开发的。数据库的最大特点是通过无线数字通信网络传输。移动数据库可以随时随地获取和访问数据，为一些业务应用和一些突发事件带来了极大的便利。

3、空间数据库

目前，这种数据库发展迅速。它主要包括地理信息数据库（也称为GIS）和计算机辅助设计（CAD）数据库。其中，地理信息数据库一般存储与地图相关的信息数据；CAD数据库一般存储机械、集成电路、电子设备设计图纸等设计信息的空间数据库。

4、信息检索系统

信息检索是根据用户输入的信息从数据库中查找相关文档或信息，并将信息反馈给用户。信息检索领域与数据库领域同步发展。它是一个典型的联机文档管理系统或联机图书目录。

5、分布式信息检索

这种数据库是随着Internet的发展而产生的。它广泛应用于Internet和远程计算机网络系统中。特别是随着电子商务的发展，这种数据库的发展更为迅速。许多网络用户（如个人、公司或企业等）将信息存储在自己的计算机中。

6、专家决策系统

专家决策系统也是数据库应用的一部分。因为越来越多的数据可以在网上获得，特别是通过这些数据，企业可以对企业的发展做出更好的决策，从而使企业能够更好地经营。随着人工智能的发展，专家决策系统的应用越来越广泛。

二、SQL数据库现状

1、自主研发

国内自主研发关系型数据库的企业、单位基本上都是发源于上世纪90年代的，而且都是以大学、科研机构为主。到今天，有代表性的厂商有：达梦–由华中理工冯玉才教授创办，完全自主研发。以Oracle为参照、追赶对象。

2、引进源代码

引进数据库源代码发展国产数据库，如今，经济发展，而且IBM也愿意迎合国人对于国产化的诉求，将搁置多年的Informix源代码拿出来，发挥余热。2015年以来，与IBM签订源代码授权的公司有华胜天成、南大通用（Gbase8t）和星瑞格。这三个公司成为以引进Informix源代码发展国产数据库的代表。

三、SQL数据库发展前景

1、产品形成系列化

一方面，Web和数据仓库等应用的兴起，数据的绝对量在以惊人的速度迅速膨胀；另一方面，移动和嵌入式应用快速增长。针对市场的不同需求，数据库正在朝系列化方向发展。

2、智能化集成化

SQL数据库技术的广泛使用为企业和组织收集并积累了大量的数据。数据丰富知识贫乏的现实直接导致了联机分析处理（OLAP）和数据挖掘（DataMining）等技术的出现，促使数据库向智能化方向发展。

3、支持各种互联网应用

SQL数据库管理系统是网络经济的重要基础设施之一。支持Internet（甚至于MobileInternet）数据库应用已经成为数据库系统的重要方面。例如，Oracle公司从8版起全面支持互联网应用，是互联网数据库的代表。

扩展资料：

SQL包括了所有对数据库的操作，主要是由4个部分组成：

1、数据定义：又称为“DDL语言”，定义数据库的逻辑结构，包括定义数据库、基本表、视图和索引4部分。

2、数据操纵：又称为“DML语言”，包括插入、删除和更新三种操作。

3、数据查询：又称为“DQL语言”，包括数据查询操作。

4、数据控制：又称为“DCL语言”，对用户访问数据的控制有基本表和视图的授权及回收。

5、事务控制：又称为“TCL语言”，包括事务的提交与回滚。

参考资料来源：百度百科-SQL数据库

数据库论文急求！！追加1000分

一、三个世界
1、现实世界人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系，这种联系是客观存在的，是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程，教师为学生授课，学生选修课程并取得成绩。
2、概念世界概念世界是现实世界在人们头脑中的反映，是对客观事物及其联系的一种抽象描述，从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语：
实体：我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物，也可以是抽象事件。如一个职工、一场比赛等。
实体集：同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。
属性：描述实体的特性称为属性。如职工的职工号，姓名，性别，出生日期，职称等。
关键字：如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体，可以选作关键字。用作标识的关键字，也称为码。如"职工号"就可作为关键字。
联系：实体集之间的对应关系称为联系，它反映现实世界事物之间的相互关联。联系分为两种，一种是实体内部各属性之间的联系。另一种是实体之间的联系。
3、机器世界存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系，数据库中的数据必须有一定的结构，这种结构用数据模型来表示。数据模型将概念世界中的实体，及实体间的联系进一步抽象成便于计算机处理的方式。
数据模型应满足三方面要求：一是能比较真实地模拟现实世界；二是容易为人所理解；三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等，它是按计算机系统的观点对数据建模，用于DBMS的实现。
关系数据库采用关系模型作为数据的组织方式。关系数据库因其严格的数学理论、使用简单灵活、数据独立性强等特点，而被公认为最有前途的一种数据库管理系统。它的发展十分迅速，目前已成为占据主导地位的数据库管理系统。自20世纪80年代以来，作为商品推出的数据库管理系统几乎都是关系型的，例如，Oracle，Sybase，Informix，Visual FoxPro等。
网络数据库也叫Web数据库。促进Internet发展的因素之一就是Web技术。由静态网页技术的HTML到动态网页技术的CGI、ASP、PHP、JSP等，Web技术经历了一个重要的变革过程。Web已经不再局限于仅仅由静态网页提供信息服务，而改变为动态的网页，可提供交互式的信息查询服务，使信息数据库服务成为了可能。Web数据库就是将数据库技术与Web技术融合在一起，使数据库系统成为Web的重要有机组成部分，从而实现数据库与网络技术的无缝结合。这一结合不仅把Web与数据库的所有优势集合在了一起，而且充分利用了大量已有数据库的信息资源。图1-1是Web数据库的基本结构图，它由数据库服务器（Database Server）、中间件（Middle Ware）、Web服务器（Web Server）、浏览器（Browser）4部分组成。
Web数据库的基本结构
它的工作过程可简单地描述成：用户通过浏览器端的操作界面以交互的方式经由Web服务器来访问数据库。用户向数据库提交的信息以及数据库返回给用户的信息都是以网页的形式显示。
1.1.1 Internet技术与相关协议
Internet技术在Web数据库技术中扮演着重要的角色。Internet（因特网）专指全球最大的、开放的、由众多网络相互连接而成的计算机网络，并通过各种协议在计算机网络中传递信息。TCP/IP协议是Internet上使用的两个最基本的协议。因此也可以说Internet是全球范围的基于分组交换原理和TCP/IP协议的计算机网络。它将信息进行分组后，以数据包为单位进行传输。Internet在进行信息传输时，主要完成两项任务。
（1）正确地将源信息文件分割成一个个数据包，并能在目的地将源信息文件的数据包再准确地重组起来。
（2）将数据包准确地送往目的地。
TCP/IP协议的作用就是为了完成上述两项任务，规范了网络上所有计算机之间数据传递的方式与数据格式，提供了数据打包和寻址的标准方法。
1．TCP/IP协议
TCP协议（Transmission Control Protocol，传输控制协议）规定了分割数据和重组数据所要遵循的规则和要进行的操作。TCP协议能保证数据发送的正确性，如果发现数据有损失，TCP将重新发送数据。
2．IP协议
在Internet上传送数据往往都是远距离的，因此在传输过程中要通过路由器一站一站的转接来实现。路由器是一种特殊的计算机，它会检测数据包的目的地主机地址，然后决定将该数据包送往何处。IP协议（Internet Protocol，网际协议）给Internet中的每一台计算机规定了一个地址，称为IP地址。IP地址的标准是由4部分组成（例如202.112.203.11），其中前两部分规定了当前使用网络的管理机构，第3部分规定了当前使用的网络地址，第4部分规定了当前使用的计算机地址。
Internet上提供的主要服务有E-mail、FTP、BBS、Telnet、WWW等。其中WWW（World Wide Web，万维网）由于其丰富的信息资源而成为Internet最为重要的服务。
3．HTTP协议
HTTP协议（Hypertext Transfer Protocol，超文本传输协议）应用在WWW上，其作用是完成客户端浏览器与Web服务器端之间的HTML数据传输。
1.1.2 Web的工作原理与工作步骤
万维网简称为Web。Web可以描述为在Internet上运行的、全球的、交互的、动态的、跨平台的、分布式的、图形化的超文本信息系统。
1．Web的工作原理
Web是伴随着Internet技术而产生的。在计算机网络中，对于提供Web服务的计算机称为Web服务器。Web采用浏览器/服务器的工作方式。每个Web服务器上都放置着大量的Web信息。Web信息的基本单位是Web页（网页），多个网页组成了一个Web节点。每个Web节点的起始页称为“主页”，且拥有一个URL地址（统一资源定位地址）。Web节点之间及网页之间都是以超文本结构（非线性的网状结构）来进行组织的。
2．Web的工作步骤
Web的工作步骤如下。
（1）用户打开客户端计算机中的浏览器软件（例如Internet Explorer）。
（2）用户输入要启动的Web主页的URL地址，浏览器将生成一个HTTP请求。
（3）浏览器连接到指定的Web服务器，并发送HTTP请求。
（4）Web服务器接到HTTP请求，根据请求的内容不同作相应的处理，再将网页以HTML文件格式发回给浏览器。
（5）浏览器将网页显示到屏幕上.

图1-2 Web的工作步骤
1.1.3 WWW世界中的标记语言
1．HTML语言
HTML（Hypertext Markup Language，超文本标记语言）是创建网页的计算机语言。所谓网页实际上就是一个HTML文档。文档内容由文本和HTML标记组成。HTML文档的扩展名就是.html或.htm。浏览器负责解释HTML文档中的标记，并将HTML文档显示成网页。
（1）HTML标记
HTML标记的作用是告诉浏览器网页的结构和格式。每一个标记用尖括号<>括起来。大多数标记都有一个开始标记和一个结束标记。标记不分大小写。多数标记都带有自己的属性。例如字体标记有FACE、COLOR、SIZE等属性：FACE定义字体；COLOR定义字体的颜色；SIZE定义字体的大小。
使用格式： BEIJING 。
网页中有很多文本链接和图片链接。链接，又被称为超链接，用于链接到WWW万维网中的其他网页上。在HTML文档中表示超链接的标记是<A>，通过属性HREF指出链接的网页地址URL。
使用格式：<A HREF= > BEIJING </A>。
（2）HTML程序
HTML程序必须以<HTML>标记开始，以</HTML>标记结束。在<HTML>和</HTML>标记之间主要由两部分组成：文件头和文件体。文件头用标记<HEAD> </HEAD>来标识，文件体用标记<BODY></BODY>来标识。在文件的头部通常包含整个网页的一些信息。例如<TITLE></TITLE>标记是用来说明网页的名称；<META></META>标记是用来说明网页的其他信息，如设计者姓名和版权信息等。所有在浏览器中要显示的内容称为网页的主体，必须放在<BODY></BODY>标记中。下面给出的是一个空网页的HTML程序。

<HTML>
<HEAD>
<TITLE>(在此标记中写网页的标题)</TITLE>
</HEAD>
<BODY>
(在此标记中写网页的内容)
</BODY>
</HTML>
（3）HTML规范
HTML规范又称为HTML标准，它总在不断地发展。每一新版本的出现，HTML都会增加新的特性和内容。有关HTML版本的详细信息请访问网站。
在不同的浏览器中，网页的显示效果可能会有所不同。每一个浏览器都使用自己独特的方式解释HTML文档中的标记，并且多数浏览器不完全支持HTML的所有特性。因为，像Microsoft和Netscape公司在HTML标准上又开发了一些特有的HTML标记和属性，称之为HTML的扩展。这些标记和属性只被他们自己的浏览器所识别，不可能被其他公司的浏览器识别。如果浏览器不能识别HTML文档中的标记，则会忽略这个标记。
（4）HTML程序的编辑环境与运行环境
HTML文档是一个普通的文本文件（ASCII），不包含任何与平台、程序有关的信息。因此HTML文档可以利用任何文本编辑器来方便地生成。要注意的是HTML文档的扩展名必须是.html或.htm。运行HTML文档可以在任何浏览器下进行，并可在浏览器上查看网页的HTML源代码。
关于HTML语言中标记的种类与使用方法将会在第5章中更详细地进行介绍。
2．可扩展标记语言（XML）
HTML是Web上的通用语言，随着Internet的深入人心，WWW上的Web文件日益复杂化、多样化，人们开始感到了HTML这种固定格式的标记语言的不足。1996年W3C开始对HTML的后续语言进行研究，并于1998年正式推出了XML（Extensible Markup Language，可扩展标记语言）。在设计网页时，XML提供了比HTML更灵活的方法。
（1）XML语言的特点
XML是国际组织W3C为适应WWW的应用，将SGML （Standard Generalized Markup Language）标准进行简化形成的元标记语言。简单地说，XML是使用标记来描述内容或与内容相关的形式信息的通用语言。一个XML文档由标记和字符数据组成。
而作为元标记语言，XML不再使标记固定，允许网页的设计者定义数量不限的标记来描述内容，同时还允许设计者创建自己的使用规则。
（2）XML的DTD
DTD（Document Type Definition,文档类型定义）是一组应用在XML文档中的自定义标记语言的技术规范。DTD中定义了标记的含义及关于标记的语法规则。语法规则中确定了在XML文档中使用哪些标记符，它们应该按什么次序出现，标记符之间如何嵌套，哪些标记符有属性等等。DTD可以包含在它所描述的XML文档中，但通常它是一份单独的文档或者一系列文档。作为外部文件可通过URL链接，被不同的XML文档共享。
XML把DTD的定义权开放，不同行业可以根据自己的实际需求定义描述内容的DTD，以适应本行业内部的信息交流和存档需要。因此，适合于不同行业、不同平台的标记语言大批涌现。
（3）XML的CSS与XSL
强调内容描述与形式描述的分离，一方面可以使XML文件的编写者更集中精力于数据本身，而不受显示方式的细节影响；另一方面允许为相同的数据定义不同的显示方式，从而适合于不同应用、不同媒体，使XML数据得到最大程度的重用。XML文档数据的显示形式是通过样式单定义的。CSS（Cascading Style Sheets）是XML使用的一种标准的级联样式单，XSL（Extensible Style Language）则是可扩展的样式语言。
由于XML允许用户创建任何所需的标记，而通用浏览器却既无法预期用户标记的意义，又无法为显示这些标记而提供规则，因此用户必须为自己创建的XML文档编写样式单，样式单可以实现共享。
浏览器对一个XML文档的处理过程是，首先去关联它所指定的样式单文件，如果该样式单是一个XSL文件，则按照规定对XML数据进行转换然后再显示，XSL本身也是基于XML语言的，可以将XML转化为HTML后再显示。如果该样式单是一个CSS文件，浏览器就会按照样式单的规定给每个标记赋予一组样式后再显示。
1.2 Web数据库访问技术
Web数据库访问技术通常是通过三层结构来实现的，如图1-3所示。目前建立与Web数据库连接访问的技术方法可归纳为CGI技术，ODBC技术和ASP、JSP、PHP 技术。

Web数据库访问的三层结构
1.2.1 CGI技术
CGI（Common Cateway Interface，通用网关界面）是一种Web服务器上运行的基于Web浏览器输入程序的方法，是最早的访问数据库的解决方案。CGI程序可以建立网页与数据库之间的连接，将用户的查询要求转换成数据库的查询命令，然后将查询结果通过网页返回给用户。一个CGI工作的基本原理如图1-4所示。
CGI程序需要通过一个接口才能访问数据库。这种接口多种多样，数据库系统对CGI程序提供了各种数据库接口如Perl、C/C++、VB等。为了使用各种数据库系统，CGI程序支持ODBC方式，通过ODBC接口访问数据库。

CGI工作流程
1.2.2 ODBC技术
ODBC（Open Database Connectivity，开放数据库互接）是一种使用SQL的应用程序接口（API）。ODBC最显著的优点就是它生成的程序与数据库系统无关，为程序员方便地编写访问各种DBMS的数据库应用程序提供了一个统一接口，使应用程序和数据库源之间完成数据交换。ODBC的内部结构为4层：应用程序层、驱动程序管理器层、驱动程序层、数据源层。它们之间的关系如图1-5所示。由于ODBC适用于不同的数据库产品，因此许多服务器扩展程序都使用了包含ODBC层的系统结构。

ODBC的内部结构
Web服务器通过ODBC数据库驱动程序向数据库系统发出SQL请求，数据库系统接收到的是标准SQL查询语句，并将执行后的查询结果再通过ODBC传回Web服务器，Web服务器将结果以HTML网页传给Web浏览器，工作原理如图1-6所示。

Web服务器通过ODBC访问数据库
由于Java语言所显示出来的编程优势赢得了众多数据库厂商的支持。在数据库处理方面，Java提供的JDBC为数据库开发应用提供了标准的应用程序编程接口。与ODBC类似，JDBC也是一种特殊的API，是用于执行SQL语句的Java应用程序接口。它规定了Java如何与数据库之间交换数据的方法。采用Java和JDBC编写的数据库应用程序具有与平台无关的特性。
1.2.3 ASP、JSP、PHP技术
ASP是Microsoft开发的动态网页技术，主要应用于Windows NT+IIS或 Windows 9x+PWS平台。确切地说ASP不是一种语言，而是Web服务器端的开发环境。利用ASP可以产生和运行动态的、交互的、高性能的Web服务应用程序。ASP支持多种脚本语言，除了VBScript和Pscript，也支持Perl语言，并且可以在同一ASP文件中使用多种脚本语言以发挥各种脚本语言的最大优势。但ASP默认只支持VBScript和Pscript，若要使用其他脚本语言，必须安装相应的脚本引擎。ASP支持在服务器端调用ActiveX组件ADO对象实现对数据库的操作。在具体的应用中，若脚本语言中有访问数据库的请求，可通过ODBC与后台数据库相连，并通过ADO执行访问库的操作。关于ASP的编程技术将会在第7章中详细介绍。
JSP是Sun公司推出的新一代Web开发技术。作为Java家族的一员，几乎可以运行在所有的操作系统平台和Web服务器上，因此JSP的运行平台更为广泛。目前JSP支持的脚本语言只有Java。JSP使用JDBC实现对数据库的访问。目标数据库必须有一个JDBC的驱动程序，即一个从数据库到Java的接口，该接口提供了标准的方法使Java应用程序能够连接到数据库并执行对数据库的操作。JDBC不需要在服务器上创建数据源，通过JDBC、JSP就可以实现SQL语句的执行。
PHP是Rasmus Lerdorf推出的一种跨平台的嵌入式脚本语言，可以在Windows、UNIX、Linux等流行的操作系统和IIS、Apache、Netscape等Web服务器上运行，用户更换平台时，无需变换PHP代码。PHP是通过Internet合作开发的开放源代码软件，它借用了C、Java、Perl语言的语法并结合PHP自身的特性，能够快速写出动态生成页面。PHP可以通过ODBC访问各种数据库，但主要通过函数直接访问数据库。PHP支持目前绝大多数的数据库，提供许多与各类数据库直接互连的函数，包括Sybase、Oracle、SQL Server等，其中与SQL Server数据库互连是最佳组合。
1.3 网络数据库应用系统的层次体系
当前，Internet/Intranet技术发展异常迅速，越来越多的数据库应用软件运行在Internet/Intranet环境下。在此之前，数据库应用系统的发展经历了单机结构、集中式结构、客户机/服务器（C/S）结构之后，随着Internet的普及，又出现了浏览器/服务器（B/S）结构与多层结构。在构造一个应用系统时，首先考虑的是系统的体系结构，采用哪种结构取决于系统的网络环境、应用需求等因素。
1.3.1 客户机/服务器结构
1．二层C/S结构
二层C/S结构是当前非常流行的数据库系统结构，在这种结构中，客户机提出请求，服务器对客户机的服务请求做出回答。它把界面和数据处理操作分开在前端（客户端）和后端（服务器端），这个主要特点使得C/S系统的工作速度主要取决于进行大量数据操作的服务器，而不是前端的硬件设备；同时也大大降低了对网络传输速度的要求，因为只须客户端把服务请求发送给数据库服务器，数据库服务器只把服务结果传回前端，如图1-7所示。
在设计时，对数据可能有如下不同的处理形式。
（1）在处理时，客户机先向服务器索取数据，然后释放数据库，即客户机发出的是文件请求，在客户机端处理数据，最后将结果送回服务器。这种处理方式的缺点很明显：所有的应用处理都在客户端完成，这就要求客户端的计算机必须有足够的能力，以便执行需要的任何程序。更为糟糕的是，由于所有的处理均在客户端完成，每次运行时都要将文件整体传送到客户端，然后才能执行。如：Student表中有30 000条记录，客户端发出命令：

Select * From Student Where Sno='200101'

这条命令将要求服务器将Student表中的所有记录传送到客户端，然后在客户端执行查询，结果只用到一条记录；如果查询的记录不存在，网络传输的数据实际上是无用的。如此大的数据传输量是不可想象的。因此，人们提出了在服务器中能够执行部分代码的客户机/服务器结构。
（2）在处理时，客户机接受用户要求，并发给服务器；在服务器端处理用户要求，最后将结果传回客户机显示或打印。这种处理方式网络通信量较小。客户机向服务器发出的是处理请求，而不是文件请求，处理请求中的代码在服务器端执行后向客户机传送处理后的结果。
这样，为了特定任务，客户机上的程序和服务器上的程序协同工作：客户机端的代码用于完成用户的输入输出及数据的检查，而服务器端的代码完成对数据库的操作。
客户机/服务器结构的另一个主要特点在于软件、硬件平台的无关性。数据库服务器上的数据库管理系统集中负责管理数据，它向客户端提供一个开放的使用环境，客户端通过数据库接口，如ODBC（开放数据库连接）和SQL语言访问数据库，也就是说，不管客户端采用什么样的硬件和软件，它只要能够通过网络和数据库接口程序连接到服务器，就可对数据库进行访问。
在客户机/服务器结构中，常把客户机称为前台，而把服务器端称为后台。前台应用程序的功能包括用户界面、接收用户数据、处理应用逻辑、向后台发出请求、同时接收后台返回的结果，最后再将返回的结果按一定的格式或方式显示给用户。而后台服务器则负责共享外部设备、存取共享数据、响应前台客户端的请求并回送结果等工作。前台的应用程序和数据一般是用户专用的，而后台的数据和代码是所有用户可以共享的。
由于数据库服务器不仅要管理共享数据，保证数据的完整性，还要执行一部分代码，完成客户端的一些处理请求，所以对用于服务器的计算机提出较高的要求。最好要采用一台专用的服务器，有较快的处理速度，有大容量的硬盘和内存，支持磁带等大容量的存储设备。
上面讲的客户机/服务器结构将应用分在了客户机、服务器两级，称其为两层客户机/ 服务器结构。总之，两层C/S结构的基本工作方式是客户程序向数据库服务器发送SQL请求，服务器返回数据或结果。
这种C/S结构有两种实现方式，一种是客户来完成表示部分和应用逻辑部分，而服务器完成数据访问部分，这种情况是以客户为中心的，适用于应用相对简单、数据访问量不是很大的情况。另一种是以服务器为中心的，把一些重要的应用逻辑部分放到服务器上，这样可充分利用服务器的计算能力，减少网络上需要传送的数据。通常以存储过程和触发器的形式出现，但存储过程都依赖于特定数据库，不同数据库之间很难移植，而三层C/S结构可以很好地解决这个问题。
注意：触发器（trigger）是数据库系统中，一个在插入、删除、修改操作之后运行的记录级事件代码。不同的事件可以对应不同的动作。通常有3种类型的触发器：INSERT触发器、DELETE触发器和UPDATE触发器。
2．三层C/S结构
由于两层结构的客户机/服务器系统本身固有的缺陷，使得它不能应用于一些大型、结构较为复杂的系统中，故出现了3层结构的客户机/服务器系统，将两层结构中服务器部分和客户端部分的应用单独划分出来，即采用“客户机—应用服务器—数据库服务器”结构（如图1-8所示）。典型的数据库应用可分为三部分：表示部分、应用逻辑（商业逻辑）部分和数据访问部分，三层结构便是对应于这三部分。

图1-8 三层C/S结构
其中，应用服务器和数据库服务器可位于同一主机，也可位于不同主机。客户机是应用的用户接口部分，负责用户与应用程序的交互，运行在客户机端的软件也称为表示层软件。应用服务器存放业务逻辑层（也称为功能层）软件，是应用逻辑处理的核心，实现具体业务。它能响应客户机请求，完成业务处理或复杂计算。若有数据库访问任务时，应用服务器层可根据客户机的要求向数据库服务器发送SQL指令。应用逻辑变得复杂或增加新的应用时，可增加新的应用服务器。数据库服务器便是用来执行功能层送来的SQL指令，完成数据的存储、访问和完整性约束等。操作完成后再通过应用服务器向客户机返回操作结果。
1.3.2 浏览器/服务器结构
随着Internet技术和Web技术的广泛应用，C/S结构已无法满足人们的需要。因为在典型C/S体系中，通常为客户安装前端应用程序的做法已不再现实，并且限制客户端工作环境只能基于Windows、Macintosh或UNIX等操作系统也不切实际。于是基于浏览器/服务器结构（Browser/Server）的系统应运而生。
采用B/S结构后，在客户端只需安装一个通用的浏览器即可，不再受具体操作系统和硬件的制约，实现了跨平台的应用。
基于B/S结构的典型应用通常采用三层结构：“浏览器—Web服务器—数据库服务器”，B/S模式的工作原理是：通过浏览器以超文本的形式向Web服务器提出访问数据库的请求，Web服务器接受客户请求后，激活对应的CGI程序将超文本HTML语言转化为SQL语法，将这个请求交给数据库，数据库服务器得到请求后，进行数据处理，然后将处理结果集返回给CGI程序。CGI再将结果转化为HTML，并由Web服务器转发给请求方的浏览器，如图1-9所示。

图1-9 B/S工作原理
在B/S模式中，客户端的标准配置是浏览器，如IE；业务功能处理由独立的应用服务器处理，Web服务器成为应用处理的标准配置；数据处理仍然由数据库服务器处理。
从本质上讲，B/S结构与传统的C/S结构都是以同一种请求和应答方式来执行应用的，区别主要在于：C/S是一种两层或三层结构模式，其客户端集中了大量应用软件，而B/S是一种基于超链接（HyperLink）、HTML、Java的三级或多级C/S结构，客户端仅需单一的浏览器软件，是一种全新的体系结构，解决了跨平台问题。到目前，这两种结构在不同方面都有着广泛的应用。虽然C/S结构在Internet环境下明显不如B/S结构具有优势，但它在局域网环境下仍具有优势。
1.3.3 Internet/Intranet信息系统的多层体系结构
多层结构应用软件与传统的两层结构应用软件相比，有可伸缩性好、可管理性强、安全性高、软件重用性好等诸多优点，如何在Internet/Intranet环境下构建应用软件体系结构就成为一个非常重要的问题，也是现今软件体系研究的一个新热点。
目前各种技术层出不穷，如最初的静态HTML页面、简单的CGI网关程序、Java Applet程序，现在的ASP等Web数据库技术，还有动态的Java在线游戏及PHP技术等。
实际上，多层的概念是由Sun公司提出来的。Sun公司提出的多层应用体系包括4层：客户层、顶端Web服务层、应用服务层和数据库层。其中顶端Web服务层是Sun公司多层体系结构中非常重要的一层，它主要起代理和缓存的作用。顶端Web服务器的作用是缓存本地各客户机经常使用的Java Applet程序和静态数据，通常被放置在客户机所在的局域网内，起到一个Java Applet主机（向Web浏览器传送Java Applet程序的计算机）和访问其他服务的代理作用。与普通代理服务器的作用相同。构建多层结构应用软件时，选用Java平台是一个很好的选择，因为它跨越各应用平台。总之，在Java平台上构建多层应用软件体系代表着今后Internet/Intranet应用的趋势。

浅谈sql数据库论文