数据加载的概念
数据加载是继数据抽取和转换清洗后的一个阶段,它负责将从数据源中抽取加工所需的数据,经过数据清洗和转换后,最终按照预定义好的数据仓库模型,将数据加载到目标数据集市或数据仓库中去,可实现SQL或批量加载。大多数情况下,异构数据源均可通过SQL语句进行insert、update、delete操作。而有些数据库管理系统集成了相应的批量加载方法,如SQLServer的bcp、bulk等,Oracle的sqlldr,或使用Oracle的plsql工具中的import完成批量加载。大多数情况下会使用SQL语句,因为这样导入有日志记录,是可回滚的。但是,批量加载操作易于使用,并且在加载大量数据时效率较高。当异构数据源的种类繁多,且数据仓库模型复杂时,使用专业的ETL工具必将事半功倍。
作者:云创智学
来源:云创智学
发布时间:2022-05-23 13:30:20