您好,欢迎来到年旅网。
搜索
您的当前位置:首页分布式数据库

分布式数据库

来源:年旅网
五邑大学研究生考试

高级数据库技术与设计

2013~2014年度 第1学期

课后作业:《分布式数据库》

院系: 计算机学院 学号: 2111305006 姓名: 罗 耀 祖

任课教师: 何国辉 成绩评定:

完成日期:2014年 1月 4日

1 概述

当今社会是信息的社会,随着科技的进步,随着网络的发展,信息的地位已经成为比能源、物资更重要的资源,以信息价值的生产为中心,以信息工业为支柱和主导,促进信息高速发展成为至关重要的课题。如何更好的管理众多的信息,如何更好的存储大量的数据,特别是如何让大量的有用信息可以让大众共享,也就同时成为当今研究的重要项目之一。分布式数据库的研究和应用已经成为这个项目的重要研究领域。 为此,我们就需要对分布式数据库的优点,缺点详细了解,从而使分布式数据更好的为我们服务。

2 什么是分布式数据库系统

要研究分布式数据库首先就要先知道什么是分布式数据库。 打个比方说,一个学校对学生进行管理工作,就是把学生安排在多个班里,每个班都是一个的数据库,而多个班合起来就是一个学校学生的整体数据库。 这种分布处理的方式,能更好的对学生进行管理。

通过上面的例子我们可以看出, 所谓分布式数据库系统就是由分布于多个计算机结点上的若干个数据库组成, 每个子数据库系统都是一个的数据库系统,它们都拥有各自的数据库、处理机、终端,以及各自的局部数据库管理系统,分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个结点上。 当然,分布在各个结点上的子数据库在逻辑上是相关的。 简单的说,分布式数据库系统是一系列集中式数据库系统的联合。 它们在逻辑上属于同一系统,但在物理结构上是分布式的。

3 分布式数据库的前提——— “分”

数据库技术主要研究的对象就是数据,那么如何处理数据就成为数据库技术主要面对的问题。 在分布式数据库中,我们要进行的前提就是如何实现数据的“分”。

3.1 数据分片问题

从分布式数据库的定义中,我们知道,所谓的分布式简单的说,就是把一个整体分成多个的个体,所以对于分布式数据库系统来讲,就是把一个大片数据分成多个的小数据存放在网络中的各个主机上,我们把这个过程就称为数据分片。 那么下面我们就来看看在分布式数据库系统中,是如何实现对数据的分片的。 1)水平分片

所谓水平分片就是按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段,简单地说,就是按关键字的特征来划分全局数据库。 2)垂直分片

所谓垂直分片就是把一个全局关系的属性集分成若干子集,并在这些子集上

作投影运算,每个投影称为垂直分片。我们现在仍然用上面的例子对垂直分片的方法进行说明如下图所示,全局数据库 XSXX,按字段名分成两片局部数据库,这里面学号和姓名字段出现重复,在对数据库分片时,最好应避免出现过多的重复字段,但这种重复又是必要的,因为它们能够表达记录特征,使局部数据库之间的记录能一一对应,这样的字段要求其值相对固定,不要随意改动。 3)导出分片

又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。 (也可以归为水平分片的特例) 4)混合分片

在分布式数据库应用中,仅仅进行单一的水平分片或垂直分片往往是不够的,在数据库设计的时候,一般都同时用到这两种方法,这就是混合分片的方法。 所谓混合分片,简单地说就是以上三种方法的混合。 可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。我们还是通过上面的例子来理解混合分片的方法。

3.2 数据在进行分片时的要求

在对数据“化整为零”的过程中,并不是简单的水平,垂直分成多份就可以了,在“分”数据时必须有一定的要求和规则。 1)完整性要求

必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。

2)可重构要求

必须保证能够由同一个全局关系的各个片段来重建该全局关系。 对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。 即,“化整为零”的数据,还要能够再“化零为整”。 3)不重复要求

要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。

3.3 数据的分配方法

1)集中式:所有数据片段都安排在同一个场地上。

2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。

3)全复制式:数据在每个场地重复存储。 也就是每个场地上都有一个完整的数据副本。

4)混合式:这是一种介乎于分割式和全复制式之间的分配方式。

4 分布式数据库的应用———“查”

无论建立什么样的数据库,最终的目的就是对它内部数据的使用,当我们把大量数据分成多个部分,分配在各个网络和设备结点,那么在应用某些数据时,

如何采用寻找最优解的算法,就成为一个重要的问题。 所以如何“查”,就是我们关心的另一个主要问题。“查”的主要工作就是在执行分布式查询时选择查询执行计划的方法和关系运算符的实现算法 。 根据系统环境的不同,查询优化所使用的算法也有所不同,通常分为远程广域网环境和高速局域网环境,其区别主要在网络的带宽。 对于一元运算符可以采用集中式数据库中的查询优化方法。 而对于二元运算符,由于涉及场地间的数据传输,因此必须考虑通信代价。目前,在分布式查询中常见的连接运算执行策略包括: 1)半连接方法

利用半连接运算的转换方法 R∞S=(RµS)∞S。假设场地1和场地2上分别有关系R和关系S,首先在S上执行连接属性

上的投影并将结果传输至场地1,在场地1上执行关系 R 与投影的连接操作,再将结果传输至场地 2 与关系 S 执行连接操作。这种 方法能够降低执行连接运算时的网络通信代价,主要适用于带宽较低的远程广域网络。

2)枚举法方法

指枚举关系运算符的物理执行计划,通过对比执行计划的代价选择执行算法的方法。其中,连接运算符的物理执行计划包括嵌 套循环方法、哈希连接法和归并连接法。枚举法主要适用于以磁盘 IO 代价为主的高速局域网环境。

5 分布式数据库的特点及应用

从上面的分析,我们已经对分布式数据库系统有了一个大概的了解,从中我们可以看出分布式数据库在现代社会的海量数据

管理和使用中,是功不可没的,但同时也面临着许多的问题,下面我们从分布式数据库的“功”与“过”来对它的特点进行一下简单的分析。

5.1 分布式数据库的“功”

1)对网络中各结点的要求不高

由于分布式数据库技术,将大量的数分成多个部分来进行管理,所以对某些结点计算机系统的配置要求可以放低。 2)降低了数据传送代价

大多数的对数据库的访问操作都是针对局部数据库的,而不是对其他位置的数据库访问的,所以降低了数据的传送代价。 3)提高了系统的可靠性

当网络出现故障时,仍然允许对局部数据库的操作,而且一个位置的故障不影响其他位置的处理工作,只有当访问出现故障位

置的数据时,在某种程度上才受影响 4)便于扩充

由于在分布式数据库系统中各个数据库的位置是透明的,所以对于数据库的

扩充更方便。正因为分布式数据库有如此多的优点,所以对于数据信息需求日益增多的今天,它已经占有了一块十分重要的领域。 但是,有些功能却需要付出更高的代价。

5.2 分布式数据库的“过”

1)事务管理性能要求高

由于,分布式数据库把数据分散到多个网络结点上,所以为了调配在几个位置上的活动,事务管理的性能比在中心数据库时花费更高,甚至抵消许多其他的优点。

2)数据的安全性存在隐患

由于分布式数据库的数是在各个数据库的位置是透明的,所以使大量信息的安全性存在隐患,甚至造成重要信息被泄漏。我们正是要我利用分布式数据库系统的这些特点使其更好的为我们服务。

6 未来分布式数据库与移动 Agent 的绑定的展望

研究分布式数据库的目的是为了更好的“为己所用”。 所以,我们要做的就是让分布式数据库的优点更可靠,更好的为我们服务,同时更重要的就是了解,发现它的缺点,并想办法来解决这些问题。这让我想到了,前一段时间看到的移动 Agent 技术。 移动 Agent 具有可以自由在网络中移动,并当从一个结点到另一个结点后,可以不占用带宽,也就意味着,此时如果断网,也不会影响,Agent 的工作,所以如果用移动 Agent 来寻找数据就可以避免数据信息的泄漏,并且也不用耗费大量的精力来管理调配数据,只需对这种“数据探访”Agent 进行控制就可以完成所需的大量工作。所以,如果能使移动 Agent 技术与分布式数据库技术绑定,将会使未来的数据库管理技术的发展有着光明美好的前景。

7 结束语

分布式数据库技术是一项仍然会不断发展的技术,从总体上看,分布式数据的研究已经从起步阶段发展到了攻坚阶段,目前急需对分布式技术的某些问题进行深层研究,比如说查询的优化问题,并且同时需要对所存在的问题进行解决,如信息的安全隐患问

题,事务管理要求过高的问题。 写成本文,主要是为了让更多人关注分布式数据库的发展。 我相信,随着研究和开发工作的不断深入,分布式数据库将在实际应用中不断的提高和完善,更好的为我们所用。

参考文献:

[1] 浙江中控软件技术有限公司.分布式实时数据库在钢铁中的应用 [2] 刘威.分布式数据库及其技术[J].长春大学学报,2000,10(1). [3] 萨师煊,王珊.数据库系统概论[M].北京:高等教育出版社,2006.

[4] 武君胜,吴德州.面向电力系统的分布式实时数据库关键技术及应用[J].中国科技论文

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务