装入数据又称为数据库加载(Loading),是数据库实施阶段的主要工作。在数据库结构建立好之后,就可以向数据库中加载数据了。
由于数据库的数据量一般都很大,它们分散于一个企业(或组织)中各个部门的数据文件、报表或多种形式的单据中,它们存在着大量的重复,并且其格式和结构一般都不符合数据库的要求,必须把这些数据收集起来加以整理,去掉冗余并转换成数据库所规定的格式,这样处理之后才能装入数据库。因此,需要耗费大量的人力、物力,是一种非常单调乏味而又意义重大的工作。
由于应用环境和数据来源的差异,所以不可能存在普遍通用的转换规则,现有的DBMS并不提供通用的数据转换软件来完成这一工作。
对于一般的小型系统,装入数据量较少,可以采用人工方法来完成。
首先将需要装入的数据从各个部门的数据文件中筛选出来,转换成符合数据库要求的数据格式,
然后输入到计算机中,
最后进行数据校验,检查输入的数据是否有误。
但是,人工方法不仅效率低,而且容易产生差错。对于数据量较大的系统,应该由计算机来完成这一工作。通常是设计一个数据输入子系统,其主要功能是从大量的原始数据文件中筛选、分类、综合和转换数据库所需的数据,把它们加工成数据库所要求的结构形式,最后装入数据库中,同时还要采用多种检验技术检查输入数据的正确性。
为了保证装入数据库中数据的正确无误,必须高度重视数据的校验工作。在输入子系统的设计中应该考虑多种数据检验技术,在数据转换过程中应使用不同的方法进行多次检验,确认正确后方可入库。
如果在数据库设计时,原来的数据库系统仍在使用,则数据的转换工作是将原来老系统中的数据转换成新系统中的数据结构。同时还要转换原来的应用程序,使之能在新系统下有效地运行。
数据的转换、分类和综合常常需要多次才能完成,因而输入子系统的设计和实施是很复杂的,需要编写许多应用程序,由于这一工作需要耗费较多的时间,为了保证数据能够及时入库,应该在数据库物理设计的同时编制数据输入子系统,而不能等物理设计完成后才开始。

