数据库

「资料库」的各地常用别名
中国大陆 数据库
台湾 资料库
港澳 数据库
Emp Tables (Database).PNG

资料库,又称为资料管理系统,简而言之可视为电子化的档案柜——储存电子档案的处所,使用者可以对档案中的资料执行新增、撷取、更新、删除等操作。

所谓「资料库」是以一定方式储存在一起、能予多个使用者共享、具有尽可能小的冗余度、与应用程式彼此独立的资料集合。一个资料库由多个表空间(Tablespace)构成。

技术初衷

作业系统出现之后,随着电脑应用范围的扩大、需要处理的资料迅速膨胀。最初,资料与程式一样,以简单的档案作为主要储存形式。以这种方式组织的资料在逻辑上更简单,但可延伸性差,存取这种资料的程式需要了解资料的具体组织格式。当系统资料量大或者使用者浏览量大时,应用程式还需要解决资料的完整性、一致性以及安全性等一系列的问题。因此,必须开发出一种系统软体,它应该能够像作业系统封锁了硬体存取复杂性那样,封锁资料存取的复杂性。由此产生了资料管理系统,即资料库。[2]

资料库管理系统

资料库管理系统(英语:Database Management System,简称DBMS)是为管理资料库而设计的电脑软体系统,一般具有储存、撷取、安全保障、备份等基础功能。资料库管理系统可以依据它所支援的资料库模型来作分类,例如关联式XML;或依据所支援的电脑类型来作分类,例如伺服器群集、行动电话;或依据所用查询语言来作分类,例如SQL、XQuery;或依据效能冲量重点来作分类,例如最大规模、最高执行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支援多种查询语言。

资料库的分类

随着资料库技术与其他分支学科技术的结合,出现了多种新型资料库,例如:与分布处理技术结合产生的分散式资料库、与并列处理技术结合产生的并列资料库、与人工智慧结合产生的演绎资料库、与多媒体技术结合产生的多媒体资料库。另外,资料库技术应用于特定的领域,出现了工程资料库、 地理资料库、统计资料库、空间资料库等特定领域资料库。[2]

关联式资料库

几乎所有的资料库管理系统都配备了一个开放式资料库连接(ODBC)驱动程式,令各个资料库之间得以互相整合。

非关系型资料库(NoSQL

键值资料库

资料库技术的发展

随着网际网路的普及,资料库使用环境也随之发生变化,这种变化主要体现为XMLJava技术的大量使用、要求支援各种网际网路环境下的应用伺服器、极容易出现大量使用者同时存取资料库、要求支援7x24小时不间断执行和高安全性等。[2]

为解决由于这些变化所带来的新问题,资料库管理系统也逐渐产生变化,包括:

  1. 网路化的大型通用资料库管理系统的出现

    由于网际网路应用的使用者数量无法预测,这就要求资料库相比以前拥有能处理更大量的资料以及为更多的使用者提供服务的能力,即更好的可伸缩性及高可用性,因此,能够支援Internet的资料库应用已经成为资料库系统的重要方面,学术界及各主流资料库公司都将大型通用资料管理系统作为主要发展方向。例如Oracle公司从 8 版起全面支援网际网路应用,微软公司更是将 SQL Server 作为 其整个 .NET计划中的一个重要的成分。[2]

  2. 资料库安全系统及技术的提升

    由于资料库系统在现代电脑系统中的地位越来越趋于核心的地位,资料库系统的安全问题自然受到越来越多的关注。在目前各国所参照或制定的 一系列安全标准中,最重要的两个是由美国国防部制定的《可信电脑系统的评估标准》(简称TCSEC)和《可信电脑系统的评估标准关于可信资料库系统的解释》(简称 TDI)。目前,所有资料库的开发必须遵从相应的安全标准。[2]

  3. XML及Web资料管理技术的普及

    随着越来越多的Web应用,如电子商务数字图书馆、资讯服务等采用XML作为资料表现形式、越来越多网站采用XML作为资讯发布的语言,以XML格式资料为主的半结构化资料逐步成为网上资料交换和资料表示的标准。而XML具有如下的一些特征:面向显示、半结构化和无结构、不同形式的资料来源,动态变化以及资料海量等。因此,支援这种结构松散、形式多样、动态变化的海量资料的储存、共享、管理、检索,成了资料库技术的大势所趋。[2]

    Web资料管理是一个很松散的概念,大体上它是指在Web环境下对各种复杂资讯的有效组织与整合,进行方便而准确的资讯查询和发布。当前Web资料管理的研究开发方向主要包括:半结构化资料管理、Web资料查询、Web资讯整合、XML资料管理等。到目前为止,XML 与 Web 资料管理的研究工作中主要集中在如下的一些方面。[2]

    • 半结构化资料
    • Web资料查询
    • XML相关标准
    • XML资料管理
  4. 嵌入式行动资料库技术

    随着行动通讯技术的迅速发展和投入使用,加上移动智慧型电话、行动电脑的大量普及,国内外许多研究机构都展开了对行动资料库的研究,并取得了许多有价值的成果。行动资料库技术涉及资料库技术、分散式计算技术以及行动通讯技术等多个学科领域,具有较高的学术起点。[2]

资料库模型

  • 物件模型
  • 层次模型(轻量级资料存取协定)
  • 网状模型(大型资料储存)
  • 关系模型
  • 物件导向模型
  • 半结构化模型
  • 平面模型(表格模型,一般在形式上是一个二维阵列。如表格模型资料Excel)

架构 (Schema)

资料库的架构可以大致区分为三个概括层次:内层、概念层和外层。

  • 内层:最接近实际储存体,亦即有关资料的实际储存方式。
  • 外层:最接近使用者,即有关个别使用者观看资料的方式。
  • 概念层:介于两者之间的间接层。[9]

资料库索引

资料索引的观念由来已久,像是一本书前面几页都有目录,目录也算是索引的一种,只是它的分类较广,例如车牌、身分证字号、条码等,都是一个索引的号码,当我们看到号码时,可以从号码中看出其中的端倪,若是要找的人、车或物品,也只要提供相关的号码,即可迅速查到正确的人事物。

另外,索引跟栏位有着相应的关系,索引即是由栏位而来,其中栏位有所谓的关键栏位(Key Field),该栏位具有唯一性,即其值不可重复,且不可为"空值(null)"。例如:在合并资料时,索引便是扮演欲附加栏位资料之指向性用途的角色。故此索引为不可重复性且不可为空。

资料库事务

事务(transaction)包含一组资料库操作的逻辑工作单元,在事务中包含的资料库操作是不可分割的整体,这些操作要么一起做,要么一起回滚(Roll Back)到执行前的状态。 事务的ACID特性:

  • 原子性(atomicity)
  • 一致性(consistency)
  • 隔离性(isolation)
  • 持续性(durability)

事务的并行性是指多个事务的并列操作轮流交叉执行,事务的并行可能会存取和储存不正确的资料,破坏交易的隔离性和资料库的一致性。

网状资料模型的资料结构

网状模型

满足下面两个条件的基本层次联络的集合为网状模型。

  1. 允许一个以上的结点无双亲;
  2. 一个结点可以有多于一个的双亲。

参考文献

  1. ^ 陈春旭、余明兴、李建全 译:《资料库系统概论》第四版,儒林图书有限公司,1986年7月,第3页
  2. ^ 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 任群, 着. 《计算机软件技术及教学模式研究》. 天津科学技术出版社. 2017年: 第19页. ISBN 9787557628413. 
  3. ^ mariadb. [2013-01-07]. (原始内容存档于2013-01-03). 
  4. ^ Wikipedia moving from MySQL to MariaDB. [2013-01-07]. (原始内容存档于2014-11-24). 
  5. ^ 存档副本. [2014-04-26]. (原始内容存档于2014-04-26). 
  6. ^ 存档副本. [2013-08-13]. (原始内容存档于2013-08-24). 
  7. ^ 存档副本. [2013-01-07]. (原始内容存档于2013-01-25). 
  8. ^ 存档副本. [2014-04-26]. (原始内容存档于2011-02-21). 
  9. ^ 陈春旭、余明兴、李建全译,《资料库系统概论》第四版,儒林,1986年7月,第29页

参见