当前位置：文档之家› A DATABASE FEDERATION PLATFORM FOR GENE CHIPS AND THE HUMAN GENOME DATABASE

A DATABASE FEDERATION PLATFORM FOR GENE CHIPS AND THE HUMAN GENOME DATABASE

Abstrac t- Data sources that are typical of the next genera-tion of biological information entities are gene chips that identify the individual genes in a given biological sample. These data are currently stored in a database format de-fined by the Genetic Analysis Technology Consortium (GATC). To interpret the chip data, we also need infor-mation about the genes themselves, as found in the Hu-man Genome Database (HGDB). These two databases were conceived at different times to serve different pur-poses, and their designs differ significantly. Extracting information simultaneously from multiple databases has proved to be a very difficult problem.

We have developed a system that will intelligently direct a single client query against a federation of databases. Our solution uses software standards common in the field today - XML, CORBA, and Java - but these standards by themselves are not sufficient. We have developed a new component called the Class Mapper, a software layer unique to each database. Each Class Mapper represents its database as an object-oriented schema consistent with the schema level of the federation. A Federation Platform reads the query, the Class Mappers execute the query across their respective databases, and the Federation Plat-form returns results to the client.

Keywords - Biological databases, XML, CORBA, Java, database federation, genetic database, Class Mapper.

I.I NTRODUCTION

Recent advances in biology have produced an extraordi-nary number and variety of data sources that must be used together to address problems in medicine and biology [1-3]. Among the most visible are the data sources that capture our understanding of the human genome. Prominent among these is the Human Genome Database (HGDB) [4] that was de-signed to be a central repository for accumulating and dis-seminating genetic data. It contains three main types of information: regions of the human genome; maps of the hu-man genome; and variations including mutations and poly-morphisms. The size of the HGDB is more than a terabyte.

A second class of data sources comes from experiments. A representative of these data is the GATC format developed by the Genetic Analysis Technology Consortium [5] to capture the information in gene chips that contain 105 or more indi- Research sponsored by the Advanced Research Projects Agency. vidual reaction wells, each of which represents an individual genetic test. A single gene chip entry in a GATC database would contain intensity information for each individual gene assayed by the chip as well as metadata giving the details of the experimental conditions and the analysis protocols.

We have taken the HGDB and GATC databases as repre-sentative of the many data sources that must be addressed together. Our objective is to be able to write a single query that will extract data from several databases simultaneously and in an intelligent manner. This means identifying the in-dividual databases where specific data exist, parsing the query to address the right databases, and reassembling the result in such a way that, from the client point of view, the process is indistinguishable from a single query against a monolithic database.

The technical literature reveals a large number of attempts to federate databases using different methods and approaches. [6-14] This activity was very pronounced during the period around 1990-1994, but nearly all of those projects, including a promising effort called Pegasus at Hewlett Packard [13], seemed to disappear during the ensuing 5 years. In particular, the Pegasus project was to have users add remote schemas to be imported into the Pegasus database, thus making it a dy-namic federated database. Non-object-oriented schemas were mapped to object-oriented representations within the global database. The global access language HOSQL (Heterogene-ous Object SQL) had features of a multidatabase language system; however, local users were responsible for integrating imported schemas. All traces of this work vanished after 1993. Other notable approaches, including a system called MARGBench that originated at the Otto-von-Guericke Un-versity in Magdeburg, Germany [7], are discussed in the ref-erences.

The present work builds on previous efforts in our group to develop a common access technology between different data-bases. This approach came from the realization that writing and maintaining unique access software for each individual database would make the concept of federated databases nearly unworkable. The mechanism that was developed is called the Class Mapper [15-17]. The Class Mapper is a software layer that represents its underlying database to the federation as an object-oriented schema (a ClassMap) that completely describes the functionality of the underlying data-base.

A DATABASE FEDERATION PLATFORM FOR GENE CHIPS AND THE HUMAN GENOME DATABASE

B. Fu, S. Zhang, W. Chuang, and

C. F. Dewey, Jr.

Massachusetts Institute of Technology, Cambridge, MA USA

The Class Mapper also supplies the procedures to query the

database in its own language and return results to the federa-

tion. Data exchange between the Class Mapper and the fed-eration can then be carried out using reusable tools, and

queries of one database appear to be operationally identical to

the queries of any other database in the federation. Transport

protocols can then be built using standards such as JDBC or

CORBA to evoke TCP/IP. XML can also be used to define

the data packages exchanged; this is discussed elsewhere [15].

II. T HE F EDERATION P LATFORM

The database federation architecture consists of a client, a

Federation Platform with a local database, and two or more

external databases that contain information used to compose

an answer to the query from the client. Fig. 1 presents an

overview of the transaction architecture. We have used the problem of federating the GATC database and the HGDB

database in this example. Numbers in circles indicate the

steps in processing a query that initiates at the client at point ?. The Federation Platform is designed to parse the query, communicate with the Class Mappers on the individual data-

bases, and create and maintain a transient database (the Local Database in Fig. 1) to efficiently extract specific information to satisfy the query.

Fig. 1 The transaction architecture in a federated database.

Steps ② and ③ represent separate queries to the GATC and HGDB databases to retrieve individual parts of the in-formation that will be used to satisfy the query in ①. What is returned to the Federation Platform is a series of partial tables from the GATC and the HGDB. These partial tables are then used in ④ to construct a Local Database that contains only information relevant to the current query. The fact that these tables are written back to the Federation Platform upon each query insures that the data used in answering the query are current. The actual query and other processing algorithms are run against the Local Database in ⑤, returning the result ⑥. At the end of the query, the information in the Local Database is discarded.

By using a Local Database, all of the results that have been retrieved from the remote databases are easily accessible us-ing standard database tools that are designed for such pur-poses. Storage scalability is a second advantage. Database systems are built to be scalable to terabytes with good per-formance. With good commercial database technology, one can scale to multi-gigabyte file queries without severe per-formance penalties. Without using database functionality, such file sizes could quickly exceed the capacity of system memory, forcing the use of brute-force memory swapping to handle complex queries. Finally, the Local Database can take advantage of built-in database management features such as query optimization, security, recovery, and data integrity. Although we have yet to implement it, one could also make use of local cache mechanisms to allow partial tables from the external databases to be saved between queries so that build-ing sequential Local Databases from the same partial tables could be accelerated. A mechanism much like the cache con-trol used on internet browsers could be adopted. This could also reduce network traffic in cases where the partial tables were large and/or the network connections were slow.

III. I MPLEMENTATION

Our first implementation of the GATC-HGDB database federation was implemented on a Sun 450 running Solaris 7 using local disks and separate databases representing the GATC and HGDB databases. We built all three databases - the GATC database, the Local Database, and the representa-tive HGDB database - using Informix Dynamic Server 2000. For the HGDB database, we did not use the entire database at the NIH because it is over a terabyte in size. The difficulties of replicating and keeping current such a large local database would have detracted from our main goal of achieving feasi-bility testing. A partial HGDB database (we call it "HGDB Lite") was therefore built locally to handle information spe-cifically relevant to the test queries that we were writing. It was built to conform to the full HGDB Class Map as defined by Chuang [17]; we simply populated a small fraction of the available tables.

Class Mappers were available for both the GATC and the complete HGDB databases from the work of William Chuang [17]. The GATC database was populated with about 500 sets of Affymetrix gene chip data that were kindly supplied by Michael Cardone of the MIT Department of Biology. No Class Mapper was required for the Local Database because it was created on the fly by the Federation Platform itself and therefore was completely known to the program. The

"HGDB Lite" had about two dozen tables and roughly a

GByte of representative data that covered a range of queries related to GATC information.

The DNA identifiers (called Accession ID’s) in the GATC database correspond to DNA segments with genomic charac-teristics. However, these characteristics are stored in the ta-bles and connections of the HGDB. In order to associate a particular DNA segment from an experiment with its genomic characteristics, the two databases must be used in parallel. The problem then becomes the task of querying data across the two database domains.

Merging the two databases does not represent a feasible so-lution to the problem. Both databases are dynamic because new experimental data are being continually added to the local GATC database and the HGDB is itself an evolving entity. As our prototype demonstrates, federation offers a viable solution that can be applied to multiple databases and multiple queries.

As might be expected from the design shown if Fig. 1, the Federation Platform encompasses a significant amount of functionality. First, the ClassMap for each database of the federation is stored in the Federation Platform and used to construct a global description of the entire federation called a ClassMapRepository. A hash table is used for fast lookups of table-to-database mappings and conflict resolution in case more than one database has the same table name.

From this global description, a series of data structures are created: these structures define the appropriate means of que-rying and accessing any individual piece of data in the entire federation. The details of this design can be found in the Thesis by Ben Fu [18]. Original queries from the client are parsed against this global description by the Federation Plat-form, and the relevant data are automatically queried from the selected tables in the several databases. The original query structure is then used to create the Local Database and a final query is made against the Local Database to produce the re-sults that are returned to the client.

In this prototype, extensive use was made of JDBC to query the databases, construct the Local Database, and handle the table objects. This was convenient because Informix sup-ports a Type 4 (native) JDBC driver. The object support within Java and JDBC also simplified many of the internal structures [19]. It is entirely consistent with this architecture to use other methods, including ODBC and CORBA, to cre-ate the internal data structures and carry out the communica-tion with the Class Mappers. We have done so on other related problems with good success.

IV.D ISCUSSION AND C ONCLUSIONS

This paper has presented a new approach to database fed-eration that we believe will be useful in the coming decade of bioinformatics. The amount of biological data that is being created is staggering. The human genome is only the begin-ning. New databases are being constructed for different spe-cies, for different classes of proteins, and for molecular pathways. Coupled with these data are new experiments that yield protein information, genetic information and gene frag-ment data. The task of creating paths back and forth between these different data sources is truly daunting.

Our short-term goal has been to pick a single pair of impor-tant databases and demonstrate an architecture that can be used to complete cross-database queries using standard data-base tools and programming methodologies. Our results are readily generalizable to other experimental methods and other database collections. No compromises have been made that would restrict this architecture from scaling to very large da-tabases and large numbers of individual data sources. An extended scheme is shown in Fig. 2.

Fig. 2. The general Federation Platform architecture.

A CKNOWLEDGMENT

The research presented in this paper includes contributions of several earlier members of our research group, and is only partially represented by the references to their publications. We wish to thank Ngon Dao for his continuing guidance on the architecture of the federation methods, Patrick McCor-mick for continuing help with the development of Class Mappers for new applications, and Paul Ferraiolo for his con-sultation on best practice software for bioinformatics from a commercial point of view.

R EFERENCES

[1] J. Macauley, H. Wang, and N. Goodman, “A model

system for studying the integration of molecular biol-

ogy databases,” Biolnformatics Journal, Vol 14, No.

71 pp 575-582, 1998.

[2] N. Goodman, S. Rozen, and L. Stein. “The case for

componentry in genome information systems.” Meet-

ing on Interconnection of Molecular Biology Data-

bases, Stanford University, 1994.

[3] S. K. Moore. “Harmonizing data, setting standards.”

IEEE Spectrum vol. 38, issue 1, pp. 111-112. January

2001.

[4] Human Genome Project. Report of the invitational

DOE Workshop on Genome Informatics.

https://www.doczj.com/doc/dd7247580.html,/hgmis/publicat/miscpubs/bioinfo/

inLrep2.html. April 1993.

[5] http:/https://www.doczj.com/doc/dd7247580.html,. Entries to this web site

are older than references given in the commercial web

site of Affymetrix: https://www.doczj.com/doc/dd7247580.html,. [6] J. Kohler, M. Lange, R. Hofestadt, S. Schulze-Kremer.

“Logical and semantic database integration.” Bio-

Informatics and Biomedical Engineering, pp. 77-80,

Proceedings of IEEE International Symposium on

Nov. 8-10, 2000.

[7] A. Freier, R. Hofestadt, M. Lange, and U. Scholz.

“MARGBench – An aproach for integration, modeling

and animation of metabolic networks.” Proceedings

of the German Conference on Bioinformatics, Han-

nover, 1999.

[8] P. D. Karp. “A Strategy for Database Interoperation.”

Journal of Computational Biology, vol. 2, pp. 573-

586, 1995.

[9] B. Reinwald, H. Pirahesh, G. Krishnamoorthy, G.

Lapis, B. Tran, S. Vora. “Heterogeneous query proc-

essing through SQL table functions. ” Proceedings of

the 15th International Conference on Data Engineer-

ing, pp. 366-373, 1999. [10] G.J.L. Kemp, N. Angelopoulos, P.M.D. Gray. “A

schema-based approach to building a bioinformatics

database federation.” Proceedings of the IEEE Inter-

national Symposium on Bio-Informatics and Biomedi-

cal Engineering, 2000.

[11] R. J. Robbins. “Bioinformatics: Essential infrastruc-

ture for global biology.” Journal of Computational

Biology, vol. 3, pp. 465-478, 1996.

[12] O. Jautzy. “Interoperable databases: a programming

language approach.” Proceedings from IDEAS '99 In-

ternational Symposium on Database Engineering and

Applications, pp. 63-71, 1999.

[13] A.R. Hurson, M.W. Bright, S.H. Pakzad. Multidata-

base Systems: An Advanced Solution for Global In-

formation Sharing. IEEE Computer Society Press,

1994.

[14] A. Elmagarmid, M. Rusinkiewicz, A. Sheth. Man-

agement of heterogeneous and autonomous database

systems. Morgan Kaufmann Publishers Inc., 1999. [15] P.J. McCormick. Designing object-oriented interfaces

for medical data repositories. M. Eng. Thesis, MIT.

1999.

[16] N. Dao, P.J. McCormick, C.F. Dewey, Jr. “The human

physiome as an information environment.” Annals of

Biomedical Engineering. vol. 28, pp. 1031-1042,

2000.

[17] W. Chuang. Design of a genetics database for medi-

cal research. M. Eng. Thesis, MIT. 2000.

[18] B. Fu. Design of a genetics database for gene chips

and the human genome database. M. Eng. Thesis,

MIT. 2001.

[19] C.S. Horstmann, G. Cornell. Core Java 2, Volume 1:

Fundamentals. Prentice Hall PTR/Sun Microsystems

Press, 2000.

《数据库原理及应用》模拟试卷答案

《数据库原理及应用》模拟试卷答案 1.填空题（每格1分，总分20分）（1）数据库的保护功能主要包括确保数据的安全性、__________________、________________、__________________四方面的内容。数据的完整性并发控制数据库恢复（2）事务的性质：原子性、__________、__________、持久性。一致性隔离性（3）在SQL中，CREATE VIEW 语句用于建立视图，如果要求今后对视图用UPDATE语句更新数据时必须满足于查询中的表达式，则应当在CREATE VIEW 语句中使用 ________________________短语。WITH CHECK OPTION （4）视图是一个虚表，它是从____________中导出的表，在数据库中只存放视图的____________，不存放视图的____________。基本表或视图定义数据（5）数据库设计应包括两方面的内容：一是___________特性的设计，二是_____________特性的设计。结构行为（6）关系数据操作语言(DML)的特点是：操作对象与结果均为关系、操作的非过程性强、语言一体化、并且是建立在数学理论基础之上。DML包括数据查询和________两种数据操作语句。数据更新（7）使用游标的步骤为：定义游标、打开游标、__取出记录____________、关闭游标（释放游标）。（8）信息的三种世界是指__________________、__________________和数据世界，其中数据世界又称为计算机世界。信息的现实世界信息世界（9）从关系规范化理论的角度讲，一个只满足1NF的关系可能存在的四方面问题是：数据冗余度大、__________________异常、__________________异常和 __________________异常。插入修改删除（10）在SQL中，通配符%表示__________________，下划线_表示 __________________。任何长度的字符串一个任意字符 2.单选题（每题2分,总分20分）（1）以下____B___采用了自底向上的设计分析方法 A)需求分析B)概念结构设计 C)逻辑结构设计D)物理结构设计（2）在视图上不能完成的操作是( D )。 A、在视图上定义新的视图 B、查询操作

广东工业大学数据库原理与应用试卷答案

广东工业大学试卷用纸，共页，第页

一、填空（每题1分，共10分） 1、层次模型，网状模型，关系模型 2、逻辑结构设计，物理结构设计 3、原子性，持续性 4、并发调度的可串行性 5、闭包 6、描述事物的符号记录二、选择题（每题2分，共20分）三、简答题（每题4分，共16分） 1、解释数据库，数据库系统，数据库管理系统三个概念。数据库是指长期存储于计算机内的、有组织的、可共享的数据集合。(1分) DBMS是指位于用户与OS之间的一层数据管理软件，它位用户或应用程序提供访问DB的方法。(1分) DBS是实现有组织的、动态的存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统，即采用数据库技术的计算机系统。(2分) 2、试述视图和基本表之间的联系和区别？ (1)视图和基本表在概念上等同，他们都是关系。(1分) (2)基本表是本身独立存在的表。视图是从一个或几个基本表（或视图）中导出的表，它与基本表不同，是一个虚表。数据库中只存放视图的定义，而不存放视图对应的数据，这些数据仍然放在原来的基本表中。(3分) 3、数据库的完整性概念与数据库的安全性概念有什么区别和联系？数据的完整性和安全性是两个不同的概念，但是有一定的联系。前者是为了防止数据库中存在不符合语义的数据，防止错误信息的输入和输出，即所谓垃圾进垃圾出所造成的无效操作和错误结果。(2分) 后者是保护数据库防止恶意的破坏和非法的存取。也就是说，安全性措施的防范对象是非法用户和非法操作，完整性措施的防范对象是不合语义的数据。(2分) 4、什么是封锁？基本的封锁类型有几种，简要说明它们的含义。封锁就是事务T在对某个数据对象（例如表、记录等）操作之前，先向系统发出请求，对其加锁。加锁后事务T就对该数据对象有了一定的控制，在事务T释放它的锁之前，其它的事务不能更新此数据对象。(2分)基本封锁类型：排它锁和共享锁。排它锁又称为写锁：若事务T对数据对象A加上X锁，则只允许T读取和修改A，其它任何事务都不能再对A加任何类型的锁，直到T释放A上的锁(1分) 共享锁又称为读锁：若事务T对数据对象A加上S锁，则其它事务只能再对A加S锁，而不能加X锁，直到T 释放A 上的S锁。(1分) 四、计算（4分） 1、(R÷S)×S＝{(2,3,4,5),(2,7,2,3)} 2 广东工业大学试卷用纸，共页，第页

数据库原理试题及答案

全国2001年10月自学考试数据库原理试题及答案2 作者：ryan 点击：时间：2003-10-11 上午 23:05:00 来源：第一部分选择题 (共30分) 一、单项选择题 (本大题共15小题，每小题2分，共30分) 在每小题列出的四个选项中只有一个是符合题目要求的，请将其代码填在题后的括号内。错选或未选均无分。 1. 单个用户使用的数据视图的描述称为【】 A. 外模式 B. 概念模式 C. 内模式 D. 存储模式 2. 子模式DDL用来描述【】 A. 数据库的总体逻辑结构 B. 数据库的局部逻辑结构 C. 数据库的物理存储结构 D. 数据库的概念结构 3. 在DBS中，DBMS和OS之间的关系是【】 A. 相互调用 B. DBMS调用OS C. OS调用DBMS D. 并发运行 4. 五种基本关系代数运算是【】 A. ∪，-，×，π和σ B. ∪，-，∞，π和σ C. ∪，∩，×，π和σ D. ∪，∩，∞，π和σ 5. 当关系R和S自然联接时，能够把R和S原该舍弃的元组放到结果关系中的操作是【】 A. 左外联接 B. 右外联接 C. 外部并 D. 外联接 6. 下列聚合函数中不忽略空值 (null) 的是【】 A. SUM (列名) B. MAX (列名) C. COUNT ( * )

D. AVG (列名) 7. 设关系模式R (A，B，C)，F是R上成立的FD集，F = {B→C}，则分解ρ = {AB，BC}相对于F 【】 A. 是无损联接，也是保持FD的分解 B. 是无损联接，但不保持FD的分解 C. 不是无损联接，但保持FD的分解 D. 既不是无损联接，也不保持FD 的分解 8. 关系模式R分解成ρ = {R1，…，Rk}，F是R上的一个FD集，那么R中满足F的每一个关系r，与其投影联接表达式mρ(r) 间的关系满足【】 A. rí mρ(r) B. mρ(r) í r C. r = mρ(r) D. r≠mρ(r) 9. 在数据库设计中，将ER图转换成关系数据模型的过程属于【】 A. 需求分析阶段 B. 逻辑设计阶段 C. 概念设计阶段 D. 物理设计阶段 10. SQL中，下列涉及空值的操作，不正确的是【】 A. AGE IS NULL B. AGE IS NOT NULL C. AGE = NULL D. NOT (AGE IS NULL) 11. 如果事务T获得了数据项Q上的排它锁，则T对Q 【】 A. 只能读不能写 B. 只能写不能读 C. 既可读又可写 D. 不能读不能写 12. DBMS中实现事务持久性的子系统是【】 A. 安全性管理子系统 B. 完整性管理子系统 C. 并发控制子系统 D. 恢复管理子系统 13. SQL的全局约束是指基于元组的检查子句和【】 A. 非空值约束 B. 域约束子句 C. 断言

2019年大学《数据库原理及应用教程》试题及答案

《数据库原理及应用教程》试题及答案一、选择题 1、下面叙述正确的是(C) A. 算法的执行效率与数据的存储结构无关 B. 算法的空间复杂度是指算法程序中指令（或语句）的条数 C. 算法的有穷性是指算法必须能在执行有限个步骤之后终止 D. 以上三种描述都不对 (2) 以下数据结构中不属于线性数据结构的是(C) A. 队列 B. 线性表 C. 二叉树 D. 栈 (3) 在一棵二叉树上第5层的结点数最多是(B) 注：由公式2k-1得 A. 8 B. 16 C. 32 D. 15 (4) 下面描述中，符合结构化程序设计风格的是(A) A. 使用顺序、选择和重复（循环）三种基本控制结构表示程序的控制逻辑 B. 模块只有一个入口，可以有多个出口 C. 注重提高程序的执行效率 D. 不使用goto语句 (5) 下面概念中，不属于面向对象方法的是(D) 注：P55-58 A. 对象 B. 继承 C. 类 D. 过程调用 (6) 在结构化方法中，用数据流程图（DFD）作为描述工具的软件开发阶段是(B)

A. 可行性分析 B. 需求分析 C. 详细设计 D. 程序编码 (7) 在软件开发中，下面任务不属于设计阶段的是(D) A. 数据结构设计 B. 给出系统模块结构 C. 定义模块算法 D. 定义需求并建立系统模型 (8) 数据库系统的核心是(B) A. 数据模型 B. 数据库管理系统 C. 软件工具 D. 数据库 (9) 下列叙述中正确的是(C) A.数据库是一个独立的系统，不需要操作系统的支持 B.数据库设计是指设计数据库管理系统 C.数据库技术的根本目标是要解决数据共享的问题 D.数据库系统中，数据的物理结构必须与逻辑结构一致 (10) 下列模式中，能够给出数据库物理存储结构与物理存取方法的是(A) 注：P108 A. 内模式 B. 外模式 C. 概念模式 D. 逻辑模式 (11) 算法的时间复杂度是指(C) A. 执行算法程序所需要的时间 B. 算法程序的长度 C. 算法执行过程中所需要的基本运算次数 D. 算法程序中的指令条数 (12) 算法的空间复杂度是指(D)

数据库原理和应用教程第4版习题与解析

习题参考答案第1章习题参考答案一、选择题 1. C 2. B 3. D 4. C 5. D 6. B 7. A 8. B 9. D 10. B 11. C 12. D 13. D 14. D 15. B 16. C 17. D 18. A 19. D 20. A 21. D 22. D 23. C 24. A 25. C 二、填空题 1. 数据库系统阶段 2. 关系 3. 物理独立性 4. 操作系统 5. 数据库管理系统（DBMS） 6. 一对多 7. 独立性 8. 完整性控制 9. 逻辑独立性 10. 关系模型 11. 概念结构（逻辑） 12. 树有向图二维表嵌套和递归 13. 宿主语言（或主语言） 14. 数据字典 15. 单用户结构主从式结构分布式结构客户/服务器结构浏览器/服务器结构 16. 现实世界信息世界计算机世界三、简答题 1、简述数据库管理技术发展的三个阶段。各阶段的特点是什么？答：数据库管理技术经历了人工管理阶段、文件系统阶段和数据库系统阶段。 (1）、人工管理数据的特点： A、数据不保存。 B、系统没有专用的软件对数据进行管理。 C、数据不共

享。D、数据不具有独立性。（2）、文件系统阶段的特点： A、数据以文件的形式长期保存。 B、由文件系统管理数据。 C、程序与数据之间有一定的独立性。 D、文件的形式已经多样化 E、数据具有一定的共享性（3）、数据库系统管理阶段特点： A、数据结构化。 B、数据共享性高、冗余度底。 C、数据独立性高。 D、有统一的数据控制功能。 2、从程序和数据之间的关系来分析文件系统和数据库系统之间的区别和联系答：数据管理的规模日趋增大，数据量急剧增加，文件管理系统已不能适应要求，数据库管理技术为用户提供了更广泛的数据共享和更高的数据独立性，进一步减少了数据的余度，并为用户提供了方便的操作使用接口。数据库系统对数据的管理方式与文件管理系统不同，它把所有应用程序中使用的数据汇集起来，以记录为单位存储，在数据库管理系统的监督和管理下使用，因此数据库中的数据是集成的，每个用户享用其中的一部分。 3、简述数据库、数据库管理系统、数据库系统三个概念的含义和联系。答：数据库是指存储在计算机内、有组织的、可共享的数据集合。数据库管理系统是软件系统的一个重要组成部分，它通过借助操作系统完成对硬件的访问，并对数据库的数据进行存取、维护和管理。数据库系统是指计算机系统中引入数据库后的系统构成。它主要由数据库、数据库用户、计算机硬件系统和计算机软件系统几部分组成。三者的联系是：数据库系统包括数据库和数据库管理系统。数据库系统主要通过数据库管理系统对数据库进行管理的。 4、数据库系统包括哪几个主要组成部分？各部分的功能是什么？画出整个数据库系统的层次结构图。答：数据库系统包括：数据库、数据库用户、软件系统和硬件系统。数据库主要是来保存数据的。数据库用户是对数据库进行使用的人，主要对数据库进行存储、维护和检索等操作。软件系统主要完成对数据库的资源管理、完成各种操作请求。硬件系统主要完成数据库的一些物理上的操作，如物理存储、输入输出等。

全国自考《数据库系统原理》试题及参考答案

2008年1月高等教育自学考试全国统一命题考试数据库系统原理试卷课程代码4735 一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.数据库在磁盘上的基本组织形式是( ) A．DB B．文件 C．二维表D．系统目录 2．ER模型是数据库的设计工具之一，它一般适用于建立数据库的( ) A．概念模型B．逻辑模型 C．内部模型D．外部模型 3．数据库三级模式中，用户与数据库系统的接口是( ) A．模式B．外模式 C．内模式D．逻辑模式 4．在文件系统中，所具有的数据独立性是( ) A．系统独立性 B．物理独立性 C．逻辑独立性 D．设备独立性 5．在DB技术中，“脏数据”是指( ) A．未回退的数据 B．未提交的数据 C．回退的数据 D．未提交随后又被撤消的数据 6．关系模式至少应属于( ) A．1NF B．2NF C．3NF D．BCNF 7．设有关系模式R(ABCD)，F是R上成立的FD集，F={A→B，B→C}，则属性集BD的闭包(BD)+为( ) A．BD B．BCD C．BC D．CD 8．设有关系R如题8图所示：

题8图则∏专业，入学年份(R)的元组数为 A．2 B．3 C．4 D．5 9．集合R与S的交可以用关系代数的基本运算表示为( ) A．R-(R-S) B．R+(R-S) C．R-(S-R) D．S-(R-S) l0．已知SN是一个字符型字段，下列SQL查询语句( ) SELECT SN FROM S WHERE SN LIKE′AB％′；的执行结果为 A．找出含有3个字符′AB％′的所有SN字段 B．找出仅含3个字符且前两个字符为′AB′的SN字段 C．找出以字符′AB′开头的所有SN字段 D．找出含有字符′AB′的所有SN字段 l1．现要查找缺少成绩(Grade)的学生学号(Snum)，相应的SQL语句是( ) A．SELECT Snum B．SELECT Snum FROM SC FROM SC WHERE Grade=0 WHERE Grade<=0 C．SELECT Snum D．SELECT Snum FROM SC FROM SC WHERE Grade=NULL WHERE Grade IS NULL l2．下列不是．．数据库恢复采用的方法是( ) A．建立检查点B．建立副本 C．建立日志文件 D.建立索引 13.在SQL／CLI中，将宿主程序与数据库交互的有关信息记录在运行时数据结果中。不能．．保存此信息的记录类型是( ) A．环境记录B．连接记录 C．语句记录D．运行记录 l4．在面向对象技术中，复合类型中后四种类型——数组、列表、包、集合——统称为( ) A．行类型B．汇集类型 C．引用类型D．枚举类型 l5．在面向对象技术中，类图的基本成分是类和( ) A．属性B．操作 C．关联D．角色二、填空题(本大题共10小题，每小题1分，共10分) 请在每小题的空格上填上正确答案。错填、不填均无分。 16．在数据库的概念设计中，客观存在并且可以相互区别的事物称为_________________。17．增强ER模型中，子类实体继承超类实体的所有________________________。 18．产生数据冗余和异常的两个重要原因是局部依赖和_________________依赖。 l9．如果Y?X?U，则X→Y成立。这条推理规则称为________________。20．ODBC规范定义的驱动程序有两种类型：即单层驱动程序和________________。21．DBMS可分为层次型、网状型、__________________型、面向对象型等四种类型。22．如果事务T对某个数据R实现了__________________锁，那么在T对数据R解除封锁之前，不允许其他事务再对R加任何类型的锁。 23．在多个事务并发执行时，系统应保证与这些事务先后单独执行时的结果一样，这是指事务的____________________性。

数据库原理-期末考试试题及答案

数据库原理-期末考试试题及答案（本大题共15小题，每小题2分，共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的，错选、多选或未选均无分。 1. 要保证数据库的数据独立性，需要修改的是（） A．三层模式之间的两种映射B．模式与内模式 C．模式与外模式D．三层模式 2. 下列四项中说法不正确的是（） A．数据库减少了数据冗余B．数据库中的数据可以共享 C．数据库避免了一切数据的重复D．数据库具有较高的数据独立性 3. 公司中有多个部门和多名职员，每个职员只能属于一个部门，一个部门可以有多名职员，从职员到部门的联系类型是（） A．多对多B．一对一 C．多对一D．一对多 4．将E-R模型转换成关系模型，属于数据库的（） A．需求分析B．概念设计 C．逻辑设计D．物理设计 5．五种基本关系代数运算是（） A．∪，—，×，π和σB ．∪，—，，π和σ C．∪，∩，×，π和σD ．∪，∩，，π和σ 6．下列聚合函数中不忽略空值 (NULL) 的是（）。 A．SUM (列名) B．MAX (列名) C．COUNT ( * ) D．AVG (列名) 7. SQL中，下列涉及空值的操作，不正确的是（）。 A. AGE IS NULL B. AGE IS NOT NULL C. AGE = NULL D. NOT (AGE IS NULL) 8. 已知成绩关系如表1所示。执行SQL语句： SELECT COUNT（DISTINCT学号） FROM成绩 WHERE分数＞60 查询结果中包含的元组数目是（）表1 成绩关系

A. 1 B. 2 C. 3 D. 4 9．在视图上不能完成的操作是（） A. 更新视图 B. 查询 C. 在视图上定义新的基本表 D. 在视图上定义新视图 10. 关系数据模型的三个组成部分中，不包括（） A. 完整性约束 B. 数据结构 C. 恢复 D. 数据操作 11. 假定学生关系是S （S ＃，SNAME ，SEX ，AGE ），课程关系是C （C ＃，CNAME ，TEACHER ），学生选课关系是SC （S ＃，C ＃，GRADE ）。要查找选修“COMPUTER ”课程的“女”学生姓名，将涉及到关系（） A ．S B ．S C ，C C ．S ，SC D ．S ，SC ，C 12. 关系规范化中的删除操作异常是指（） A ．不该删除的数据被删除 B ．不该插入的数据被插入 C ．应该删除的数据未被删除 D ．应该插入的数据未被插入 13. 从E-R 模型关系向关系模型转换时，一个m:n 联系转换为关系模式时，该关系模式的码是（） A ．M 端实体的码 B ．N 端实体的码 C ．M 端实体码与N 端实体码组合 D ．重新选取其他属性 14．已知关系R={A ，B ，C ，D ，E ，F}，F={A →C ，BC →DE ，D →E ，CF →B}。则(AB)F + 的闭包是（） A ．ABCDEF B ．ABCDE C ．ABC D ．AB 15．设有关系R （A ，B ，C ）和S （C ，D ）。与SQL 语句select A,B,D from R,S where R.C=S.C 等价的关系代数表达式是（） A ．σR.C=S.C (πA,B,D (R×S)) B ．πA,B,D (σR,C= S.C (R×S)) C ．σR.C=S.C ((πA,B (R))×(π D (S))) D ．σR,C=S.C (πD ((πA,B (R))×S)) 二、多项选择题（本大题共5小题，每小题2分，共10分）在每小题列出的四个备选项中有多个是符合题目要求的，多选、少选、错选、不选均无分。

沈阳工业大学849 数据库原理及应用

2019年硕士研究生招生考试题签（请考生将题答在答题册上，答在题签上无效）科目名称：数据库原理及应用第1页共4页精品文档，欢迎下载！一、单项选择题（40分，每题2分） 1、数据库中存储的是0A.数据B,信息C,数据之间的联系D,数据以及数据之间的联系 2、数据的物理独立性是指应用程序独立于。A.外模式B,模式 C.内模式D.子模式 3、关系数据库的查询操作由三种基本运算组合而成，这三种基本运算不但葬A.投影 B.除法 C.连接 D.选择 4、不允许在关系中出现重复记录的约束是通过实现的。 A.主码 B.外码 C.索引 D.惟一索引58、部分匹配查询中有关通配符的正确的叙述是。A.代表多个字符 B.可以代表零个或多个字符C.不能与“％”一同使用 D.代表一个字符9、在关系双据库系统中，为了简化用户的查询操作，后又不增加数据的存储空间，常用的方法12、下列说法中正确的是 A,关系模式的规范化程度越高越好 B,若关系模式R 中只有两个属性，则R 至少属于3NF C,属于3NF 的关系模式中己完全消除了插入异常和删除异常 D,具有无损链接性的模式分解能保证不丢失原模式中的信息 13、数据库设计中，建立数据字典的时机是阶段。A,需求分析B,概念设计C.逻辑设计D.物理设计14、数据库物理设计不但聲 A.存储记录结构设计C.确定数据存放位置 B.存取方法设计D.关系规范化是创建 A.索引 B.游标 C.视图10、数据库的是指数据的正确性和相容性。A 一荷枇R 安仝桦C 穽整桂D 并舄桂 11、将数据库对象的操作权限授予用户，属于安全控制机制中的 D.另一个表D,审计

数据库原理及应用

数据库原理及应用数据库技术简介数据库技术产生于六十年代末，是数据管理的最新技术，是计算机科学的重要分支。数据库技术是信息系统的核心和基础，它的出现极大地促进了计算机应用向各行各业的渗透。数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志。第一章绪论 1.1 数据库系统概述 1.1.1 四个基本概念数据(Data) 数据库（Database）数据库管理系统(DBMS) 数据库系统(DBS) 一、数据数据(Data)的定义数据是信息的具体表现形式描述事物的符号记录数据的表现形式——数字文字图形图像声音等各类数据必须数字化后才能加工处理。数据与其语义是不可分的例如：93是一个数据语义1：学生某门课的成绩语义2：某人的体重语义3：计算机系2007级学生人数例如：学生档案中的一条记录：（李明男1982 江苏计算机系2000）二、数据库(续) 数据库的定义数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合。三、数据库管理系统什么是DBMS 数据库管理系统（Database Management System，简称DBMS）是位于用户与操作系统之间的一层数据管理软件。 DBMS的用途组织和存储好大量的数据，并提供方便、高效地检索数据和维护数据的手段。 DBMS的主要功能: 数据定义功能数据组织存储和管理数据操纵功能数据库的事务管理和运行管理数据库的建立和维护功能其它功能四、数据库系统什么是数据库系统

数据库系统（Database System，简称DBS）是指在计算机系统中引入数据库后的系统。数据库系统的构成数据库数据库管理系统（及其开发工具）应用系统数据库管理员（DBA） 1.1.2 数据管理技术的产生和发展数据管理：是指对数据的分类、组织、编码、存储、查询和维护等活动，是数据处理的中心环节。数据处理：是指对数据进行收集、组织、存储、加工、抽取和传播等一系列活动的总和。其目的是从大量的、原始数据中抽取、推导出对人们有价值的信息。数据管理技术的发展动力：应用需求的推动、计算机软/硬件的发展数据管理技术的发展过程人工管理阶段(40年代中--50年代中) 文件系统阶段(50年代末--60年代中) 数据库系统阶段(60年代末--现在) 一、人工管理时期 40年代中--50年代中产生的背景应用需求科学计算硬件水平纸带、卡片、磁带软件水平没有操作系统处理方式批处理特点：数据不保存、数据由程序各自管理（逻辑结构、存储结构、存取方法、输入方式等）数据不共享：一组数据只能对应一个程序数据不具独立性：数据的结构发生变化后（物理或逻辑上），应用程序必须做相应的修改。应用程序与数据的对应关系(人工管理阶段) .. 二、文件系统时期

(完整word版)数据库原理试卷带答案

数据库原理试卷A 一、单选题（本题共20个小题，每题1分，共20分。答案唯一，多选或少选均不得分。请将答案按对应的题号写在下面的表格中） 1.下述关于数据库系统的正确叙述是( A )。 A. 数据库系统减少了数据冗余 B. 数据库系统避免了一切冗余 C. 数据库系统中数据的一致性是指数据类型一致 D. 数据库系统比文件系统能管理更多的数据 2. 数据库（DB），数据库系统（DBS）和数据库管理系统（DBMS）之间的关系是( A )。 A. DBS包括DB和DBMS B. DBMS包括DB和DBS C. DB包括DBS和DBMS D. DBS就是DB，也就是DBMS 3. 描述数据库全体数据的全局逻辑结构和特性的是( A )。 A.模式 B. 内模式 C. 外模式 D. 用户模式 4. 要保证数据库的逻辑数据独立性，需要修改的是(A )。 A. 模式与外模式的映射 B. 模式与内模式之间的映射 C. 模式 D. 三层模式 5. 数据库系统的数据独立性体现在( B )。 A.不会因为数据的变化而影响到应用程序 B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序 C.不会因为存储策略的变化而影响存储结构 D.不会因为某些存储结构的变化而影响其他的存储结构 6. 在一个关系中如果有这样一个属性存在，它的值能惟一地标识关系中的每一个元组，称这个属性为( C )。 A. 关键字 B. 数据项 C. 主属性 D. 主属性值 7. 现有如下关系：患者（患者编号，患者姓名，性别，出生日起，所在单位）医疗（患者编号，患者姓名，医生编号，医生姓名，诊断日期，诊断结果）其中，医疗关系中的外码是( D )。 A. 患者编号 B. 患者姓名 C. 患者编号和患者姓名 D. 医生编号和患者编号 8. 自然连接是构成新关系的有效方法。一般情况下，当对关系R和S使用自然连接时，要求R或S含有一个或多个共有的( D )。 A. 元组 B. 行 C. 纪录 D. 属性 9. 有关系SC（S_ID，C_ID，AGE，SCORE），查找年龄大于22岁的学生的学号和分数，正确的关系代数表达式是( D )。 ⅰ. πS_ID，SCORE (σAGE >22 (SC) ) ⅱ. σAGE >22 (πS_ID，SCORE (SC) ) ⅲ. πS_ID，SCORE (σAGE >22 (πS_ID，SCORE，AGE (SC) ) ) A.ⅰ和ⅱ B. 只有ⅱ正确 C. 只有ⅰ正确 D. ⅰ和ⅲ正确

数据库原理与应用期末复习总结含试题及其答案

数据库原理综合习题答案 1.1名词解释 (1) DB：即数据库（Database),是统一管理的相关数据的集合。DB能为各种用户共享，具有最小冗余度，数据间联系密切，而又有较高的数据独立性。 (2) DBMS：即数据库管理系统（Database Management System)，是位于用户与操作系统之间的一层数据管理软件，为用户或应用程序提供访问DB的方法，包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型，可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS：即数据库系统（Database System),是实现有组织地、动态地存储大量关联数据，方便多用户访问的计算机软件、硬件和数据资源组成的系统，即采用了数据库技术的计算机系统。 (4) 1：1联系：如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系，反之亦然，那么实体集E1对E2的联系称为“一对一联系”，记为“1：1”。 (5) 1：N联系：如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，而E2中每个实体至多和E1中的一个实体有联系，那么E1对E2的联系是“一对多联系”，记为“1：N”。 (6) M：N联系：如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，反之亦然，那么E1对E2的联系是“多对多联系”，记为“M：N”。 (7) 数据模型：模型是对现实世界的抽象。在数据库技术中，表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型：概念数据模型和结构数据模型。 (6) 概念数据模型：是独门于计算机系统的模型，完全不涉及信息在系统中的表示，只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型：是直接面向数据库的逻辑结构，是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统，所以称为“结构数据模型”。结构数据模型应包含：数据结构、数据操作、数据完整性约束三部分。它主要有：层次、网状、关系三种模型。 (10) 层次模型：用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型：用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型：是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集，用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。 (13) 概念模式：是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型，还要描述记录间的联系、操作、数据的完整性、安全性等要求。 (14) 外模式：是用户与数据库系统的接口，是用户用到的那部分数据的描述。 (15) 内模式：是数据库在物理存储方面的描述，定义所有的内部记录类型、索引和文件的组成方式，以及数据控制方面的细节。 (16) 模式/内模式映象：这个映象存在于概念级和内部级之间，用于定义概念模式和内模式间的对应性，即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象：这人映象存在于外部级和概念级之间，用于定义外模式和概念模式间的对应性，即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性：在数据库技术中，数据独立性是指应用程序和数据之间相互独立，不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性：如果数据库的内模式要进行修改，即数据库的存储设备和存储方法有所变化，那么模式/内模式映象也要进行相应的修改，使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

数据库原理试卷(有答案)

综合应用题之一 (每小题3分，共30分) 设有如下表所示的三个关系： S（SID，SN，AGE，SEX，DEPT） C（CID，CN，TEACHER） SC(SID，CID，GRADE) 其中：SID为学号，SN为姓名，AGE为年龄，SEX为性别，DEPT为系别，CID为课程号，CN为课程名，TEACHER为任课老师，GRADE为成绩。 1、试用关系代数完成如下查询（1）查找年龄小于18岁男同学的学号和姓名。 πSID，SN (σAGE<18 ∧SEX = “男”(S)) 1分2分（2）查找系别为“信息工程”的学生姓名、学号和选修的课程号。 πSID，SN，CID (σDEPT = “信息工程”(S∞SC)) 1分2分或： πSID，SN，CID (（σDEPT = “信息工程”(S)）∞SC) 1分2分（3）查找选修了课程名为“C语言程序设计”的学生学号和姓名。 πSID，SN (σCN = “C语言程序设计”(S∞C∞SC)) 1分2分或： πSID，SN ((σCN = “C语言程序设计”(C))∞S∞SC)) 1分2分

2、写出下列操作的SQL语句（1）在S表中增加一条学生信息：（AP0000001，张成，19，男，交通工程）。 INSERT (1分) INTO S（SID，SN，AGE，SEX，DEPT）(1分) V ALUES(…AP0000001?，?张成?，19，?男?，?交通工程?)(1分) 或： INSERT (1分) INTO S (1分) V ALUES(…AP0000001?，?张成?，19，?男?，?交通工程?)(1分) （2）查询选修了课程名为“C语言”的学生学号和姓名。 SELECT S.SID，SN (1分) FROM S，C，SC (1分) WHERE S.SID=SC.SID AND SC.CID = C.CID AND https://www.doczj.com/doc/dd7247580.html, = “C语言”；(1分) （3）查询每个学生的学号、选修的课程门数和平均成绩。 SELECT SID，COUNT(*) AS 课程门数，A VG（GRADE）AS 平均成绩(1分) FROM SC (1分) GROUP BY SID；(1分) （4）将学号为“AP0000001”同学所选修的“数据库原理”成绩改为88分。 UPDATE SC(2分) SET GRADE= 88 WHERE SID=‘AP0000001’AND CID IN（SELECT CID FROM C WHERE CN=‘数据库原理’）；(1分) （5）把查询SC表的权限授给用户U1。 GRANT SELECT (1分) ON TABLE SC (1分，表前不加TABLE不扣分) TO U1；(1分)

数据库原理及应用教案(北京联合大学优秀教案)

北京联合大学优秀教案评选参赛教案申报单位北京联合大学参赛教师XXX 课程名称数据库原理及应用授课章节第3讲第3节参赛类别理工类授课对象本科生课程性质专业必修授课时间2学时北京联合大学教务处

、课程简介在先修课“离散数学”、“数据结构”、“VB程序设计”，为本课程提供数学、算法、程序设计基础、程序设计语言和 Windows 应用程序开发工具的基础上，本课程主要讲授两大部分内容：一为“数据库系统概论” ，二为“ Microsoft SQL Server数据库管理系统”。本课程为后续课程“网络编程课程设计”、“软件系统基础”、“信息系统开发实习”提供数据库的概念、方法和技术基础。本课程为信息与计算科学专业专业基础必修课。要求学生了解数据库系统的基本概念、基本结构和关系模型的基本概念；掌握数据库查询和操作方法；掌握数据库保护的基本技术；掌握关系数据理论的基本概念和基本理论；掌握数据库设计的基本步骤和方法。掌握使用Microsoft SQL Server关系数据库管理系统管理数据的方法，并结合Visual Basic设计开发简单的数据库应用系统。二、单元教学目标通过本单元的教学，使学生初步掌握标准SQL的查询语句结构，掌握简单查询、连表查询和嵌套查询的方法，并在 SQL Server 环境下应用各类查询语句，完成实际查询任务。 1、知识层面（1）掌握标准 SQL 的查询语句结构；（2）掌握简单查询，连表查询，嵌套查询的方法。 2、能力层面（1）分析查询需求，选择应用合适的查询语句，解决实际查询问题；（2）在 SQL Server 环境下，实现各类查询，分析查询结果，分析查询执行错误的原因并找出和实践解决办法。 3、思维层面进一步训练逻辑思维能力。三、单元教学内容本单元主要介绍标准SQL及SQL Serve环境下SQL的数据查询功能（DQL）。 1、认识数据库查询；（ 5分钟） 2、示例数据库的结构；（2分钟） 3、标准 SQL 的查询语句结构，包括： FROM、 WHERE 、 SELECT、 GROUP BY、HAVING 、 ORDER BY 子句；（5分钟） 4、简单查询，包括：浏览查询，投影查询，选取查询（带IN、BETWEEN 、LIKE、IS NULL运算符及一般比较运算符的查询），SELECT子句带表达式的查

数据库原理与应用(第四版)

数据库一、选择题30’ 二、填空题20’涉及内容：C1,C2,C3,C7概念为主。其余章节少量涉及。三、问答题20’(4*5’) 1.论述数据、数据库、数据库管理系统、数据库系统的概念；数据：描述事物的符号记录。是数据库中存储的基本对象。种类：文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等特点：数据与其语义是不可分的数据库：长期储存在计算机内、有组织的、可共享的大量数据的集合。基本特征： ?数据按一定的数据模型组织、描述和储存 ?可为各种用户共享 ?冗余度较小 ?数据独立性较高 ?易扩展数据库管理系统（DBMS）：位于用户与操作系统之间的一层数据管理软件，是基础软件，是一个大型复杂的软件系统。用途：科学地组织和存储数据、高效地获取和维护数据数据库系统：在计算机系统中引入数据库后的系统，一般由数据库、数据库管理系统（及其开发工具）、应用系统、数据库管理员构成。 2.数据库系统的特点 ?数据结构化整体结构化不再仅仅针对某一个应用，而是面向全组织不仅数据内部结构化，整体是结构化的，数据之间具有联系数据库中实现的是数据的真正结构化数据的结构用数据模型描述，无需程序定义和解释数据可以变长数据的最小存取单位是数据项 ?数据的共享性高，冗余度低，易扩充数据库系统从整体角度看待和描述数据，数据面向整个系统，可以被多个用户、多个应用共享使用。数据共享的好处减少数据冗余，节约存储空间避免数据之间的不相容性与不一致性使系统易于扩充 ?数据独立性高物理独立性指用户应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了，应用程序不用改变。

数据库原理试题及答案

汕头职业技术学院 2009—2010学年度第二学期期中考试试卷课程名称数据库原理与应用拟题人审题人_____________ 系（校区）计算机系班级姓名学号____________ 一、单项选择题：（将正确答案的编号填在下表中，每小题1.5分，共18分） 1．任何一个满足2NF但不满足3NF的关系模式都不存在（） A）主属性对主码的部分依赖 B）非主属性对主码的部分依赖 C）主属性对主码的传递依赖 D）非主属性对主码的传递依赖 2．相对于非关系模型，关系数据模型的缺点之一是（） A）查找记录的速度最慢 B）数据结构简单 C）数据独立性高 D）有严格的数学基础 3．创建一个用户数据库时，（）数据库的内容（表和视图）就会自动地复制到新创建的数据库中。 A）master B）model C）msdb D）tempdb 4．下列聚合函数中不忽略空值（null）的是（） A）sum(列名) B）max(列名) C）count(*) D）avg(列名) 5．关于唯一约束的叙述，错误的是（） A）一个表可以定义多个唯一约束 B）唯一约束的值不能重复 C）唯一约束的值不能为null D）一个唯一约束可以施加到多个属性中 6．下列涉及空值的操作，不正确的是（） A）age is null B）age is not null C）age=null D）not(age is null) 7．层次模型不能表示（）的联系 A）多对多 B）一对多 C）多对一 D）一对一 8．下列关系运算中，（）运算不属于专门的关系运算。 A）选择 B）连接 C）投影 D）广义笛卡尔积 9．数据库系统的体系结构是（） A）两级模式结构和一级映射 B）三级模式结构和一级映射 C）三级模式结构和两级映射 C）三级模式结构和三级映射 10．单个用户使用的数据视图的描述称为（）

文档之家

A DATABASE FEDERATION PLATFORM FOR GENE CHIPS AND THE HUMAN GENOME DATABASE

《数据库原理及应用》模拟试卷答案

广东工业大学数据库原理与应用试卷答案

数据库原理试题及答案

2019年大学《数据库原理及应用教程》试题及答案

数据库原理和应用教程第4版习题与解析

全国自考《数据库系统原理》试题及参考答案

数据库原理-期末考试试题及答案

沈阳工业大学849 数据库原理及应用

数据库原理及应用

(完整word版)数据库原理试卷带答案

数据库原理与应用期末复习总结含试题及其答案

最新数据库系统原理期末考卷及标准答案

数据库原理试卷(有答案)

数据库原理及应用教案(北京联合大学优秀教案)

数据库原理与应用(第四版)

数据库原理试题及答案